A kínai DeepSeek előrehozza az R2 nevű új modelljének bevezetését, amelyet eredetileg májusra terveztek. A vállalat azt reméli, hogy az új modell jobb kódolási képességekkel rendelkezik majd, és az angol mellett más nyelveken is képes lesz következtetések levonására - írja a Reuters híradása nyomán a Portfolio.
A januárban bemutatott R1 modellt gyengébb Nvidia chipekkel építették, mégis versenyre tudott kelni az amerikai tech-óriások sokkal drágább fejlesztéseivel.
A kínai modell bemutatása ezer milliárdos értékvesztést okozott a globális részvénypiacon.
A lap azt írja, a DeepSeek sikere Liang Wenfeng alapító vezetési stílusának is köszönhető. Az üzletember korábban kvantitatív fedezeti alapjával szerzett hírnevet, szakított a kínai technológiai ipar hagyományos, hierarchikus felépítésével. A cég sokkal inkább működik kutatólaborként, ahol a fiatal szakemberek és gyakornokok is komoly feladatokat kapnak. A siker másik kulcsa a költséghatékony architektúra. Olyan technikákat alkalmaznak, amiek jelentősen csökkentik a számítási költségeket. Mint írják, a Bernstein elemzői szerint a DeepSeek 20-40-szer kedvezőbb árszabású, mint a hasonló OpenAI.
Emellett a kínai kormány is támogatja a DeepSeek-et, ezt az is mutatja, hogy már legalább 13 városi önkormányzat és 10 állami energetikai vállalat integrálta rendszereibe a cég modelljét.
Ezzel szemben egyes országok adatvédelmi aggályokra hivatkozva eltávolíttatták a cég alkalmazásait az alkalmazásboltokból.
A vállalat legnagyobb kihívása továbbra is a fejlett AI chipekre vonatkozó amerikai exportkorlátozások, ezt maga az alapító is elismerte egy korábbi interjúban: "A mi problémánk sosem a finanszírozás volt, hanem a csúcskategóriás chipekre vonatkozó embargó."