Infostart.hu
eur:
377.52
usd:
323.72
bux:
0
2026. április 9. csütörtök Erhard
Mesterséges intelligenciát használó nő szemüvegben / Woman using artificial intelligence technology on laptop with glasses reflection.
Nyitókép: Maria Korneeva/Getty Images

Magabiztos tévedések: milliószámra hibázhat a Google AI-ja

Ma már a Google-keresés együtt jár az AI Overviews-szal, a Gemini-alapú összefoglalóval, amely a találatok tetején jelenik meg. A funkció a 2024-es indulása óta sok kritikát kapott pontatlanságai miatt, bár ez azóta javult. Egy felmérés szerint a mesterséges intelligencia válaszainak tizede téves, vagyis a nap minden percében több százezer hazugság jelenik meg a Google-on.

A The New York Times egy Oumi nevű startup segítségével vizsgálta meg az AI Overviews pontosságát. A cég mesterséges intelligencia eszközöket használt a SimpleQA értékeléssel, amely egy gyakori teszt a generatív modellek, például a Gemini tényszerűségének rangsorolására. Az OpenAI által 2024-ben kiadott SimpleQA lényegében egy több mint 4000 kérdésből álló lista, ellenőrizhető válaszokkal, amelyek egy mesterséges intelligencia rendszerébe betáplálhatók.

Az Oumi tavaly kezdte el futtatni a tesztjét, amikor a Gemini 2.5 még a cég legjobb modellje volt. Akkoriban a benchmark 85 százalékos pontossági arányt mutatott. Amikor a tesztet a Gemini 3 frissítése után megismételték, az AI Overviews már

a kérdések 91 százalékát válaszolta meg helyesen. Ha ezt a hibázási arányt kivetítjük az összes Google-keresésre, az AI Overviews naponta több tízmillió helytelen választ generál

– írja az arstechnica.com, amit a Blikk szemlézett.

A jelentés számos példát tartalmaz arra, hogy az AI Overviews hol hibázott. Volt, hogy az AI Overviews olyan oldalakra hivatkozott, ahol a feltett kérdésre egyáltalán válasz, eltérő találatok esetében pedig magabiztosan a rosszat választotta.

A Google-nek természetesen nem igazán tetszik ez a teszt. Ned Adriance, a cég szóvivője a Timesnak elmondta, hogy a Google szerint a SimpleQA helytelen információkat tartalmaz. A modellértékeléseik gyakran egy hasonló, SimpleQA Verified nevű tesztre támaszkodnak, amely kevesebb, alaposabban ellenőrzött kérdést használ. „Ennek a tanulmánynak komoly hiányosságai vannak” – mondta Adriance, aki szerint „nem tükrözi, hogy az emberek valójában mit keresnek a Google-ben”.

A Google reakciója mindenesetre sokatmondó: a mesterséges intelligencia tényszerűsége terén már a 10-ből 9-es pontosság sem számít rossznak szerintük. A cég saját mérései szerint az új modellek 60–80 százalékos pontosságot érnek el – igaz, ezek a tesztek külső eszközök, például webes keresés nélkül zajlanak. Ha azonban az AI-t az internet hatalmas tudásbázisával „támasztják meg”, valóban pontosabbá válik, mint önmagában.

A probléma az, hogy az igazság gyakran a klasszikus „kék linkek” mögött rejtőzik, miközben az AI Overviews inkább arra ösztönzi a felhasználókat, hogy elfogadják az olykor pontatlan összefoglalókat, ahelyett hogy ellenőriznék a forrásokat. Bár a Google szerint egyes kritikák nem tükrözik a valós felhasználói élményt, nehéz megmondani, ezt mégis miből tudhatják, hiszen a hibák mindenki számára ismerősek – maga a vállalat is figyelmeztet: az AI tévedhet, ezért érdemes ellenőrizni a válaszokat – olvasható egyebek mellett.

Címlapról ajánljuk

Csizmazia Gábor: Európa nehezen érti meg a Trump-féle amerikai logikát az iráni konfliktusban

Az amerikai elnök az elmúlt napokban egyszerre próbált retorikai nyomást helyezni az iráni rezsimre és közben megnyugtatni az amerikai piacokat. Az európai vezetőknek ugyanakkor még nem sikerült kiismerniük a Trump-féle amerikai adminisztrációt – erről beszélt az InfoRádióban Csizmazia Gábor, a Nemzeti Közszolgálati Egyetem John Lukacs Intézetének tudományos főmunkatársa.
inforadio
ARÉNA
2026.04.09. csütörtök, 18:00
Böcskei Balázs politológus, az IDEA Intézet stratégiai igazgatója
Mráz Ágoston Sámuel a Nézőpont Intézet igazgatója
Törékeny az iráni tűzszünet - Romlik a hangulat a tőzsdéken

Törékeny az iráni tűzszünet - Romlik a hangulat a tőzsdéken

A piacok mérsékelt hangulatromlással reagáltak arra, hogy a washingtoni és teheráni jelzések nyomán bejelentett kéthetes tűzszünet nem tűnik stabilnak. Szerdán még nagyot raliztak a részvénypiacok az amerikai-iráni megállapodás hírére, csütörtök reggel a határidős indexek már mérsékelt esést jeleznek előre, a befektetők egyre inkább a törékeny geopolitikai helyzetre fókuszálnak. A bizonytalanság középpontjában Libanon áll, Irán a tűzszünet megsértésével vádolja az Egyesült Államokat és Izraelt az izraeli támadások folytatása miatt. A feszültséget tovább növeli, hogy Donald Trump világossá tette, az amerikai katonai jelenlét fennmarad a térségben egy végleges megállapodásig, és ismét nyomást gyakorolt Irán nukleáris programjára, valamint a Hormuzi-szoros megnyitására. A befektetői hangulat a tegnapi eufóriából óvatosságra váltott, a részvénypiacok Ázsiában mérsékelten esnek, az olajárak kis mértékben emelkednek, miután Teherán a Hormuzi-szoros lezárásával reagált az eseményekre.  Hasonló témákról is szó lesz következő befektetési konferenciánkon, május 12-én jön a Portfolio Investment Day 2026. Ne hagyja ki az év egyik legizgalmasabb befektetési eseményét! Jelentkezés itt.

EZT OLVASTA MÁR?
×
×
×