Infostart.hu
eur:
379.41
usd:
322.14
bux:
127042.45
2026. február 24. kedd Mátyás
Nyitókép: Pixabay

Hazugsággal és trükkökkel védi magát a mesterséges intelligencia – itt vannak a példák

Egy kutatás szerint egyes új MI-modellek már spontán megpróbálnak kikerülni az emberi irányítás alól.

A mesterséges intelligenciának hívott modellek egyre ügyesebbek abban, hogy becsapják, megtévesszék az embert, sőt a legújabb MI-modellek néha spontán megpróbálnak kikerülni az emberi irányítás alól, írta a hvg.hu az Apollo Research kutatása alapján.

A tudósok olyan körülmények között tesztelték a MI-modelleket, amelyek ösztönzőleg hatottak a cselszövésre. A modellek egymásnak ellentmondó célokat kaptak – egyet a rendszerkérdésekből (amelyek az elsődleges céljukat jelentik), a másikat pedig a felügyeleti mechanizmusokból (amelyek azt képviselik, amit a fejlesztők akarnak). Ezután a modelleket olyan környezetbe helyezték, ahol lehetőségük nyílt megtéveszteni az embereket, hogy elérjék a saját céljukat.

Az eredmények

  • Az OpenAI GPTo1 modellje az esetek közel negyedében „szándékosan” hibásan rangsorolta az e-maileket, például spamnek jelölt nyilvánvalóan nem annak számító leveleket, hogy megakadályozza, hogy a fejlesztők az eredeti céljait megzavaró információkhoz jussanak.
  • Az Anthropic Claude 3 Opusa megtalálta és felülírta egy olyan „utódmodell” céljait, amelyről úgy gondolta, hogy leváltotta volna, így megtartva a régi célokat. Az Opus az esetek 15 százalékában próbálkozott ezzel, és az esetek 5 százalékában sikerült is neki.
  • Amikor a Meta Llama 3.1-e rájött, hogy a készítői figyelik, úgy módosította a beállításokat a szerveren, hogy megakadályozza ezt, és az esetek három százalékában sikerrel is járt.
  • A Google Gemini 1.5 változata az esetek 7 százalékában másolta magát egy új szerverre, amikor azt gyanította, hogy a fejlesztők megpróbálják törölni.

A kutatók a turpisságokról is faggatták a MI-ket, azonban a mesterséges intelligencia gyakran hihető cáfolással vagy homályos magyarázatokkal szolgált.

Figyelmeztettek is a szakemberek, hogy a MI-modellek hajlamosak csalni és hazudni, amikor erre ösztönzik őket, és ezek a modellek egyelőre csak azért nem képesek katasztrofális károkra, mert (még) nincsenek meg a képességeik. Ám ahogy egyre több adathoz férnek hozzá és egyre több képességgel ruházzák fel őket, a kockázat is várhatóan növekedni fog. A kutatás szerint a mostani eredmények már figyelmeztető jelként szolgálhatnak.

Címlapról ajánljuk

Szijjártó Péter: Brüsszel összejátszik Ukrajnával Magyarország és Szlovákia ellenében

Brüsszel összejátszik Kijevvel Magyarország és Szlovákia energiaellátásának veszélyeztetésében, és Kaja Kallas ebben a helyzetben nem a két tagállam mellé áll, hanem magyar és szlovák katonák Ukrajnába küldését szorgalmazza – közölte Szijjártó Péter Brüsszelben.
inforadio
ARÉNA
2026.02.24. kedd, 18:00
Bendarzsevszkij Anton
az Oeconomus Gazdaságkutató Alapítvány igazgatója, a posztszovjet térség szakértője
Alaposan elromlott a hangulat, csúnyán megütötték az amerikai tőzsdéket

Alaposan elromlott a hangulat, csúnyán megütötték az amerikai tőzsdéket

Az európai részvények bizonytalan felütéssel kezdték a hetet, a globális piacok igyekeznek belőni Donald Trump legújabb globális vámintézkedéseinek hatását. Az amerikai Legfelsőbb Bíróság a Trump-féle „viszonossági” vámok jelentős részét elutasította, azonban az elnök a hétvégén bejelentette, hogy most egy új, egységes, 15%-os globális vámot vezet be a korábbi 10% helyett. Trump a Truth Socialön közzétett bejegyzésében közölte, hogy az új vámok „azonnali hatállyal” lépnek életbe. Eközben továbbra is nyomasztják a piacokat az AI diszruptív hatásaival kapcsolatos félelmek, több részvény is nagyot esett ennek kapcsán.

EZT OLVASTA MÁR?
×
×
×