Infostart.hu
eur:
353.87
usd:
303.44
bux:
134616.81
2026. május 30. szombat Janka, Zsanett
YouTube-ot nézve tanul arcmimikát és beszédet a robot
Nyitókép: YouTube/ Columbia Engineering

Ez már a Terminátor? Arcmimikát tanul az emberszabású robot a YouTube-ról

A robotika egyik hiányzó láncszemével foglalkoznak amerikai kutatók. Célul tűzték ki, hogy humanoid robotjuknak olyan arckifejezése és ajakmozgatása legyen, mintha csak ember volna. A tanítása során pedig leültették a YouTube elé, hogy onnan okuljon.

A Columbia Egyetem mérnöki csapata bejelentette, hogy olyan robotot készítettek, amelyik képes megtanulni az ajakmozgásokat olyan feladatokhoz, mint a beszéd és az éneklés – írja a hvg.hu a Science Robotics cikke alapján.

A valósághű robot-ajakmozgatás elérése két okból is kihívást jelent:

  • először is, speciális, rugalmas arcbőrt tartalmazó hardverre van szükség, amelyet számos apró, csendben és együttesen működő motor hajt.
  • Másodszor, az ajakdinamika specifikus mintázata egy összetett funkció, amelyet a vokális hangok és fonémák szekvenciái határoznak meg.

Mindennek elérésére a kutatók egy egészen új megközelítést alkalmaztak. Ahelyett, hogy minden egyes magánhangzóra vagy fonémára kézzel kódolt szabályokat követett volna,

a robot kísérletezéssel és utánzással tanulta meg az ajakmechanikát.

Az arca, amely 26 miniatürizált motorra feszített puha szintetikus bőrből áll, képes reprodukálni a beszéd alapjául szolgáló finom izommozgásokat.

A robot először a tükörképét figyelve sajátította el 26 arcmotorjának használatát. Ahogy egy gyerek először vág grimaszokat a tükörbe, a robot több ezer véletlenszerű arckifejezést és ajakgesztust mutatott. Idővel megtanulta, hogyan mozgassa a motorjait, hogy bizonyos arckifejezéseket érjen el.

Ezt a megközelítést „látásból cselekvésbe” nyelvi modellnek (VLA) nevezik.

Ezután beszélgetésről és éneklésről készült YouTube-videókat kellett néznie a robotnak,

így az őt vezérlő mesterséges intelligencia megtanulhatta, hogyan mozog pontosan az emberek szája a kibocsátott különféle hangoknak megfelelően. E két modell birtokában a robot mesterséges intelligenciája közvetlenül az ajkak motoros mozgásává tudta alakítani a hangokat.

Jelenleg az ajakmozgás messze nem tökéletes. „Különös nehézségeink voltak az olyan kemény hangokkal, mint a 'B', és az ajakfixálást igénylő hangokkal, mint például a 'W'. De ezek a képességek valószínűleg idővel és gyakorlással, illetve az emberi interakciókkal fejlődni fognak” – mondta Hod Lipson, az egyetem Kreatív Gépek Laboratóriumának igazgatója, a gépészmérnöki tudományok professzora, kiemelve, hogy egy ilyen munka a robotika egy elhanyagolt dimenzióját, a robotika hiányzó láncszemét célozza meg.

A kutatók azt jósolják, hogy az élethű arcok egyre fontosabbá válnak, ahogy a humanoid robotok olyan területeken találnak alkalmazást, mint a szórakoztatás, az oktatás, az orvostudomány és az idősgondozás is. Viszont egyúttal elismerik az ilyen technológia pszichológiai és etikai összetettségét. Ahogy a robotok egyre rokonszenvesebbé válnak, elmosódó érzelmi határok alakulhatnak ki.

Címlapról ajánljuk
BL-döntő élőben: Paris Saint-Germain–Arsenal

BL-döntő élőben: Paris Saint-Germain–Arsenal

A PSG másodszor vagy az Arsenal először? Melyik gárda nyeri meg a labdarúgó Bajnokok Ligája 2025–2026-os döntőjét Budapesten?

Növekszik a társadalmi nyomás Egyiptomban – Lehet, hogy nem 1,1, hanem 10 millió migráns szivárgott be

A 2023-as szudáni konfliktus után szabályosan ömlöttek be az emberek, méghozzá mindenféle ellenőrzés nélkül, ez már pedig merőben más típusú migráció, mint amivel Jordánia, Törökország vagy Libanon küzd, ahol legalább van esély összeírni azokat, akik érkeznek. Sayfo Omar, a Migrációkutató Intézet kutatási igazgatója beszélt a részletekről az InfoRádióban.
inforadio
ARÉNA
2026.06.01. hétfő, 18:00
Kaiser Ferenc
a Nemzeti Közszolgálati Egyetem docense
EZT OLVASTA MÁR?
×
×
×