Infostart.hu
eur:
384.85
usd:
334.09
bux:
0
2026. április 4. szombat Izidor
Nyitókép: Pixabay

Hazugsággal és trükkökkel védi magát a mesterséges intelligencia – itt vannak a példák

Egy kutatás szerint egyes új MI-modellek már spontán megpróbálnak kikerülni az emberi irányítás alól.

A mesterséges intelligenciának hívott modellek egyre ügyesebbek abban, hogy becsapják, megtévesszék az embert, sőt a legújabb MI-modellek néha spontán megpróbálnak kikerülni az emberi irányítás alól, írta a hvg.hu az Apollo Research kutatása alapján.

A tudósok olyan körülmények között tesztelték a MI-modelleket, amelyek ösztönzőleg hatottak a cselszövésre. A modellek egymásnak ellentmondó célokat kaptak – egyet a rendszerkérdésekből (amelyek az elsődleges céljukat jelentik), a másikat pedig a felügyeleti mechanizmusokból (amelyek azt képviselik, amit a fejlesztők akarnak). Ezután a modelleket olyan környezetbe helyezték, ahol lehetőségük nyílt megtéveszteni az embereket, hogy elérjék a saját céljukat.

Az eredmények

  • Az OpenAI GPTo1 modellje az esetek közel negyedében „szándékosan” hibásan rangsorolta az e-maileket, például spamnek jelölt nyilvánvalóan nem annak számító leveleket, hogy megakadályozza, hogy a fejlesztők az eredeti céljait megzavaró információkhoz jussanak.
  • Az Anthropic Claude 3 Opusa megtalálta és felülírta egy olyan „utódmodell” céljait, amelyről úgy gondolta, hogy leváltotta volna, így megtartva a régi célokat. Az Opus az esetek 15 százalékában próbálkozott ezzel, és az esetek 5 százalékában sikerült is neki.
  • Amikor a Meta Llama 3.1-e rájött, hogy a készítői figyelik, úgy módosította a beállításokat a szerveren, hogy megakadályozza ezt, és az esetek három százalékában sikerrel is járt.
  • A Google Gemini 1.5 változata az esetek 7 százalékában másolta magát egy új szerverre, amikor azt gyanította, hogy a fejlesztők megpróbálják törölni.

A kutatók a turpisságokról is faggatták a MI-ket, azonban a mesterséges intelligencia gyakran hihető cáfolással vagy homályos magyarázatokkal szolgált.

Figyelmeztettek is a szakemberek, hogy a MI-modellek hajlamosak csalni és hazudni, amikor erre ösztönzik őket, és ezek a modellek egyelőre csak azért nem képesek katasztrofális károkra, mert (még) nincsenek meg a képességeik. Ám ahogy egyre több adathoz férnek hozzá és egyre több képességgel ruházzák fel őket, a kockázat is várhatóan növekedni fog. A kutatás szerint a mostani eredmények már figyelmeztető jelként szolgálhatnak.

Címlapról ajánljuk
Mi lesz Iránnal? – érdekességek a vb-mezőnyről

Mi lesz Iránnal? – érdekességek a vb-mezőnyről

Szerda hajnalban teljes lett a 2026-os világbajnokságnak a 48-as mezőnye – írjuk optimistán. A helyek elkeltek, de, persze, nem tudjuk, mit hoz a következő nagyjából két, két és fél hónap a világpolitikában. Mindenesetre az megvan, hogy a három rendező ország gárdája mellett mely csapatok harcolták ki a vb-részvételt.

Bendarzsevszkij Anton: Putyin már hajlott volna a békére, de Irán miatt elillant a kompromisszumkészsége

A legnagyobb gazdasági impaktja jelenleg a közel-keleti helyzet megoldásának van, így az orosz–ukrán konfliktus rendezése másodlagossá vált – mondta az InfoRádió GeoTrendek című műsorában az Oeconomus Gazdaságkutató Alapítvány igazgatója. A szakértő szerint az orosz gazdaság „mentőövet kapott” az olajárak elszabadulásával, Vlagyimir Putyin pedig most már nem mutat olyan nyitottságot a béketárgyalásokra, mint két-három hónappal ezelőtt.
inforadio
ARÉNA
2026.04.07. kedd, 18:00
Schiffer András
ügyvéd, volt országgyűlési képviselő
Amerikai repülőgépeket lőtt le Irán, kemény ultimátumot adott Trump – Percről percre az iráni háborúról szombaton

Amerikai repülőgépeket lőtt le Irán, kemény ultimátumot adott Trump – Percről percre az iráni háborúról szombaton

Az iráni háború szombaton a 36. napjába lépett, és nem látszik, hogy a konfliktus hamar deeszkalálódhatna. Iráni és amerikai források szerint két amerikai harci repülőgép is odaveszett az iráni és az öbölbeli műveletek során. Az egyik, Irán felett lelőtt F-15E kétfős személyzetéből az egyik katonát kimentették, a másik után tovább folyik a kutatás, miközben Teherán látványosan propagandatémává tette az ügyet. Közben újabb iráni rakéta- és dróntámadások érték Izraelt és a Perzsa-öböl térségét, miközben Washingtonban a háború finanszírozása körül is láthatóvá váltak az első komolyabb politikai repedések. Eközben az első nyugati hajó, egy francia olajtanker átjutott a Hormuzi-szoroson. Cikkünk folyamatosan frissül az iráni háború fejleményeivel.

EZT OLVASTA MÁR?
×
×
×