eur:
410.9
usd:
392.2
bux:
79229.24
2024. november 21. csütörtök Olivér
A magyar tudomány kategóriában Prima Primissima Díjra jelölt Prószéky Gábor matematikus, nyelvész, egyetemi tanár Budapesten 2023. október 18-án.
Nyitókép: MTI/Czimbal Gyula

Prószéky Gábor: néhány dologban lekörözi a PULI a ChatGPT-t

Azok a nyelvek lesznek túlélők, amelyeket a digitális világban is rendszeresen használnak, és a magyar szerencsére ilyen nyelv – mondta az InfoRádió Aréna című műsorában a HUN-REN Nyelvtudományi Kutatóközpont főigazgatója. A Széchenyi-díjas matematikus, nyelvész beszélt arról is, hogy kifejlesztették a magyar ChatGPT-t, a PULI-t, amely több tízmilliárd szóval dolgozik, és sokkal jobban ismeri a magyar kultúrát, mint az OpenAI terméke.

Prószéky Gábor is tagja annak az akadémiai szerkesztőbizottságnak, amely egy széles körű vitafórumot követően jelentést fogadott el a magyar nyelv állapotáról. A tanulmány első megállapítása, hogy a magyar nyelv nincs veszélyben. A Széchenyi-díjas matematikus, nyelvész azt mondta az InfoRádió Aréna című műsorában, hogy nagyon sokan tartanak attól, hogy a magyar nyelv egyszer eltűnik majd, de ennek szerinte nincs megalapozottsága, ugyanis több mint tízmillióan beszélik, és ami legalább ugyanennyire fontos, írott formában, az interneten is nagyon erősen támogatott nyelv a magyar.

Mint fogalmazott, korábbi felmérések azt állapították meg, hogy azok a nyelvek az igazi túlélők, amelyek a digitális világban is megtalálják a támogatásukat, márpedig napjainkban jelentős mennyiségű magyar szöveg érhető el a világhálón. Kiemelte, hogy az írókat, szerzőket számos nyelvhelyességi eszköz segíti, illetve a magyar Wikipédia is „a nagyok közé tartozik a világban”. Mindezek azt bizonyítják, hogy megvan az említett nyelvi támogatottsága az interneten a magyar nyelvnek, így Prószéky Gábor szerint nincs is veszélyben a fennmaradása. Úgy véli, az emberek inkább csak féltik a magyar nyelvet, és „megjelennek bizonyos szavak, amelyeknek nem kellene megjelenniük”. Hozzátette: a kihalás egészen távoli dolog, és inkább a kisebb, kevesebb ember által használt nyelveket veszélyezteti. Általában valamilyen politikai vagy társadalmi ok vezet odáig, hogy lecserélnek egy-egy nyelvet vagy éppen teljesen eltűnik.

Mint mondta, sokan úgy gondolják, hogy a szaknyelvek esetében a magyar is ebben a helyzetben van, de megnyugtatott mindenkit, hogy nem cserélik le a magyar nyelvet. A nyelvész szerint érdemes végiggondolni, hogy milyen szinten lehet veszélyben egy nyelv. A nyelvészek általánosságban véve nyelvi szintekről beszélnek, a jelentéstan szerint pedig tudunk beszélni a dolgokról, így a szintaxis (a nyelvtan szószerkezetekkel és mondatokkal foglalkozó része), a nyelv, valamint mondatok formálása Prószéky Gábor szerint nincs veszélyben, mint ahogy a szóalaktanunk sem változik meg.

Felhívta a figyelmet arra is, hogy egy-egy nyelv megváltozása, átalakulása nagyon hosszú folyamat, akár évszázadokig is eltarthat. Az idő múlásával főként a szókincs változik, megjelennek új formák, és ezeknek az új szavaknak, kifejezéseknek napjainkban leginkább angol a gyökerük. A HUN-REN Nyelvtudományi Kutatóközpont főigazgatója szerint ennek az a fő oka, hogy az egész világon az angol vált a meghatározó nyelvvé, és rengeteg fogalmat, szót az angolból vesznek át más nyelvek.

Ebben nincs semmi újdonság, hiszen a korábbi évszázadokban is mindig hatással volt például a magyar nyelvre is, hogy milyen népek, nemzetek éltek körülöttünk vagy kik törtek be Magyarországra, és maradtak itt hosszú időn át. Ennek következtében jelentek meg és terjedtek el a magyar nyelvben török, szláv, latin vagy éppen germán szavak, kifejezések. „Most az angollal vagyunk ilyen szomszédságban, de hát mindenki ugyanolyan távolságra van ma egymástól az interneten” – jegyezte meg Prószéky Gábor.

Mit tud jobban a magyar fejlesztésű PULI a ChatGPT-nél?

Egyre több, mesterséges intelligencia (MI) által vezérelt nyelvi modell, chatbot érhető el az emberek számára, ilyen például a ChatGPT, a Gemini és a Copilot is, mint ahogy megjelent az első magyar nyelvi modell, a PULI is, amely 50 milliárd magyar szavas szövegkorpuszával jobban modellezi a magyar nyelvet, mint nagy nemzetközi társai. A PULI chatbotot a Nyelvtudományi Kutatóközpont álmodta meg és hozta létre, a fejlesztésében Prószéky Gábor is részt vett. A nyelvész emlékeztetett, hogy a Microsoft tavaly tízmilliárd dollárt adott az OpenAI mesterséges intelligencia kutatólaboratóriumnak, hogy továbbfejlessze a ChatGPT modellt. Ennek ismeretében sokakban felmerülhet a kérdés, hogy miért lenne szükség egy magyar chatbotra? Prószéky Gábor megfogalmazása szerint

a PULI „egy kicsit sárgább, egy kicsit savanyúbb, de a miénk, és ez az igazán fontos, hiszen mégiscsak magyar fejlesztésről van szó”.

Elismerte, hogy a magyar nyelvi modell nyilvánvaló módon nem tud majd versenyezni a ChatGPT-vel és nagy nemzetközi társaival, de reményeik szerint így is nagyon hasznos és értékes lesz, mivel „a magyar nyelvre van kihegyezve”, és sokkal nagyobb mennyiségben lehet általa magyar kulturális tudást „beletenni a közösbe” a világ nagy szoftvereihez képest. Utóbbiak vagy éppen a Wikipédia 100-150 millió szónyi magyar szöveget tartalmaznak, melyek révén egész jól lehet meg lehet érteni a magyar nyelvet, viszont ezek a szoftverek nem tudnak létrehozni magyar kulturális tartalmat. „Például nem tudják összevetni Arany János és Petőfi Sándor verseit” – magyarázta a Széchenyi-díjas matematikus, nyelvész.

Úgy véli, a PULI abban lehet „erősebb” a konkurenseknél, hogy magyar kulturális tartalmat tesz közzé. Kiemelte, hogy az egész világon elterjedt nagy chatbotok „nagyon jól tudnak magyarul”, ugyanakkor jelentős különbség érzékelhető a 130 millió versus 50 milliárd elérhető szó között, utóbbit a PULI tudja kínálni. Elismerte, hogy a nagy nemzetközi rendszerek fejlettebbek és sokkal kifinomultabbak, ugyanakkor kiemelte, hogy

a PULI-t adott esetben átadhatják egy magyar partnernek, amely aztán a saját hardverbázisán működtetni tudja.

Így „nem kell kiküldeni a Csendes-óceán partjára vagy bárhová a világba azt a tartalmat, ami esetleg érzékeny adatot tartalmaz” – tette hozzá a nyelvész.

Prószéky Gábor jelezte: a világnyelvek után a magyar és a svéd szakemberek fejlesztették ki elsőként hazájuk nyelvi modelljét, megelőzve például a portugálokat. „Nagyon korai fázisban jelentünk meg a magyar nyelvvel, és emiatt most nagyon jó helyzetben van a magyar számítógépes nyelvészet, illetve nyelvtechnológia. Ez nem azért van, mert magyar, hanem mert minden olyan tartalomra, ami lokálisan érzékeny, adott esetben akár más nyelven is rá lehet keresni” – magyarázta.

Kiemelte, hogy a PULI egy háromnyelvű rendszer, amelyben a magyar mellett angol és kínai szöveg is elérhető. Az 50 milliárd szónyi összefüggő magyar szöveg mellett 50-60 milliárd szónyi angol és körülbelül 100 milliárd jelnyi kínai tartalom is olvasható a magyar fejlesztésű modellnek köszönhetően. Prószéky Gábor szerint a PULI „a magyar rendszert, a magyar kultúrát nagyon fogja tudni, de ugyanígy az euroatlanti és a távol-keleti világot is”.

KAPCSOLÓDÓ HANG
Címlapról ajánljuk
Az Ukrajnának szánt harci felszerelések adományozása ügyében nyomoz a szlovák rendőrség
Tudósítónktól

Az Ukrajnának szánt harci felszerelések adományozása ügyében nyomoz a szlovák rendőrség

Szlovákiában a rendőrség Szervezett Bűnözés Elleni Hivatala létrehozott egy különleges nyomozócsoportot, melynek feladata az elmúlt választási időszakban Ukrajnának adott szlovák katonai felszerelések adományozásával kapcsolatos jogsértések felderítése. A vizsgálat kiterjed az akkori védelmi minisztérium és a kormány tagjainak döntéseire.

Fontos kérések az érkező havazás miatt, mindenkit érint

Bár a meteorológiai prognózisokban mindig van némi bizonytalanság, az aktuális előrejelzések szerint november 22-én, pénteken akár nagyobb mennyiségű hó is hullhat Budapesten.
VIDEÓ
inforadio
ARÉNA
2024.11.22. péntek, 18:00
Bernáth Tamás
Nyugat-Balkán szakértő, a Mathias Corvinus Collegium oktatója
Megjött az új extraprofitadó-rendelet: így marad 2025-ben velünk a bankok, kiskercégek, biztosítók plusz sarca

Megjött az új extraprofitadó-rendelet: így marad 2025-ben velünk a bankok, kiskercégek, biztosítók plusz sarca

Ahogyan arra számítani lehetett, megérkezett a 2025-ben még fennmaradó extraprofitadókról szóló kormánydöntés. A Magyar Közlöny csütörtök esti számában ugyanis megjelent a kormány legújabb rendelete, mely azt szabályozza, hogy miként marad velünk a bankok extraprofitadója, valamint a biztosítók és kiskereskedelmi cégek pótadója. Az eredetileg két évre ígért extraprofitadók egy jelentős része tehát négy évig hatályban marad. A kormány rendelete egyúttal azt is tartalmazza, hogy mely extraprofitadóktól szabadulhatnak meg jövőre az érintett ágazatok. Ezek szerint örülhetnek a gyógyszergyártók, a távközlési szektor cégei, valamint a megújuló energiát termelők, bányajáradék-alanyok.

EZT OLVASTA MÁR?
×
2024. november 21. 10:19
×
×
×
×