Infostart.hu
eur:
360.6
usd:
309.31
bux:
132046.37
2026. május 19. kedd Ivó, Milán
Education technology concept. Schoolboy learning in the room. Online school. EdTech.
Nyitókép: metamorworks/Getty Images

Levizsgáztatták az MI-modelleket az országos kompetenciamérésen – itt vannak az eredmények

Több területen is jelentős hiányosságaik vannak egyes mesterséges intelligencia modelleknek, több még küzd a magyar nyelvvel is.

A mesterséges intelligenciával foglalkozó PeakX csoport a jelenlegi legnépszerűbb AI modellek segítségével átfogó kutatást végzett a magyar országos kompetenciaméréseken. A kutatás célja az volt, hogy kiderítsék, vajon helyt tudnak-e állni a különböző típusú fejlesztések a mesterséges tesztkörnyezeten kívül is – írja az economx.hu.

Az AI modell teszteléshez a vállalat emberei 70 szövegértési és 70 matematikai feladatot használtak, kiegészítve történelem, természettudomány és digitális kultúra kérdésekkel, amelyeket később egy objektív pontozási rendszerrel értékelték. A tesztek három szempontot vettek figyelembe: a feladatmegoldások gyorsaságát, az erőforrásigényt és költségeket, illetve a pontosságot.

A PeakX minősítése az AI modellekről és a teljesítményükről:

  • OpenAI o1: Kiemelkedő általános tudással rendelkezik, erős szövegértési és matematikai képességekkel, viszont lassú és drága.
  • Anthropic Sonnet 3.7: Kiváló szövegértési teljesítményt mutatott, gyors és költséghatékony, azonban komplex matematikai feladatokban gyengébb.
  • xAI Grok2: Rendkívül gyors és olcsó, de a matematikai feladatok terén kifejezetten rosszul teljesített.
  • Gemini 2.0 „Flash”: Kiemelkedő szövegértési képességekkel bír, de az összetettebb következtetési feladatokban alulmaradt.
  • Mistral Large: Relatív olcsó, de általános tudása korlátozottabb.
  • DeepSeek: Olcsó és gyors, kiemelkedő következtetési képességekkel, de nem képes vizuális elemzésre, és hajlamos fura hibákat véteni.

A tapasztalatok szerint bár az érvelő modellek lassabbak és drágábbak, minden kategóriában jobb teljesítményt tudtak nyújtani AI társaiknál. Az eredmények alapján le lehet vonni a következtetést, miszerint a nagy nyelvi modellek a problémamegoldó és analitikus készségeket igénylő területeken még nem képesek helyettesíteni az emberi tudást. Ez a lemaradás főként a komplex matematikai készségeket igénylő feladatokban mutatkozik meg.

A legtöbb AI modellnél az egymás után feltett két ugyanolyan kérdésre adott válaszuk gyakran különbözik, és egyes típusok (például a DeepSeek) nehezen fejti meg a vizuális elemeket, amely azonban a magyar kompetenciamérés szerves részét képezi.

A különböző modelleknek meggyűlik a baja a magyar nyelv megértésével, így emiatt is előfordulhatnak hibák. A végős következtetés szerint a mesterséges intelligencia kiváló lehetőség a tudás bővítésére, illetve gyors megszerzésére, de fontos kiemelni, hogy az emberi tudást nem képes helyettesíteni.

Címlapról ajánljuk
Euró klubtagság nélkül: Andorra, Monaco, San Marino, Vatikán, Koszovó és Montenegró eurótörténete

Euró klubtagság nélkül: Andorra, Monaco, San Marino, Vatikán, Koszovó és Montenegró eurótörténete

Az euróövezetbe elvileg szigorú felvételi vizsgán át vezet az út. Az infláció, a hiány, az államadósság, az árfolyam-stabilitás mind rendben kell, hogy legyen. Mégis vannak olyan államok, amelyek eurót használnak anélkül, hogy ezeket az elvárásokat kipipálták volna. Andorra, Monaco, San Marino és Vatikán szerződéssel kapott különleges státuszt, Koszovó és Montenegró viszont válsághelyzetben, egyoldalúan vezette be az eurót. Ugyanaz a pénz forog náluk, mint mondjuk Németországban, de egészen más történet áll a pénzük mögött.

Új végrehajtói, felszámolói és közjegyzői rendszer jön – itt vannak a friss kormánydöntések

Államilag ellenőrzött végrehajtói rendszer, bírósági kontroll alá kerülő felszámolási eljárások, egyszerűbb és olcsóbb közjegyzői eljárások jöhetnek. Döntött a kormány azbeszt-ügyben, az atomerőmű ügyében, a kormányzati gépkocsikkal és az állami célokra használt honvédségi repülők használatával kapcsolatban is. Elhangzott: az előző kormány meghamisította az idei költségvetést, mert 286 milliárd forint maradt ki az NGM-nél a betervezett fizetendő tételek közül.
Több döntést hozott az új kormány a hétfői ülésén, Sulyok Tamás nem akar lemondani

Több döntést hozott az új kormány a hétfői ülésén, Sulyok Tamás nem akar lemondani

Zajlik a hatalomátvétel: a napokban történik meg az új minisztériumok apparátusának felállítása, egyre több államtitkári név ismert. Hétfőre Magyar Péter ismét kormányülés összehívását lengette be, így várhatóan több fontos bejelentésre számíthatunk a kabinettől. Orbán Anita arról adott hírt, hogy tárgyalások kezdődnek a kárpátaljai magyarok kisebbségi jogainak rendezésére Ukrajnával. Sulyok Tamás köztársasági elnök egy interjúban arról beszélt, hogy nem tervez lemondani a tisztségéről, mire Magyar Péter újra távozásra szólította fel. Balásy Gyula két, az államnak felajánlott kommunikációs cégéről kiderült, hogy végrehajtás indult ellenük, Varga Mihály pedig kijelentette, hogy a jegybank partner lesz a kormánnyal az euró bevezetésében. A fejleményekről folyamatosan tudósítunk.

EZT OLVASTA MÁR?
×
×
×