Chinezii atacă agresiv piața inteligenței artificiale: Gigantul Alibaba a lansat un nou model

Compania chineză de tehnologie Alibaba a lansat miercuri o nouă versiune a modelului său de inteligență artificială, Qwen 2.5, despre care susține că e mai bună decât DeepSeek-V3.
Momentul neobișnuit al lansării Qwen 2.5-Max, în prima zi a Anului Nou chinezesc, când majoritatea chinezilor sunt liberi și petrec timpul cu familiile, arată presiunea pe care ascensiunea startup-ului chinez DeepSeek în ultimele trei săptămâni a pus-o nu doar asupra rivalilor internaționali, ci și asupra competiției interne.
„Qwen 2.5-Max depășește ... aproape în toate aspectele GPT-4o, DeepSeek-V3 și Llama-3.1-405B”, a anunțat divizia de cloud a Alibaba pe contul său oficial de WeChat, referindu-se la modelele avansate de inteligență artificială ale OpenAI și Meta, potrivit Reuters.
Ascensiunea DeepSeek
Firma chineză DeepSeek, un rival al OpenAI care a lansat ChatGPT, a declanșat o corecție globală a pieței, după ce a anunțat un produs cu performanțe superioare, la un cost de doar 2% din cel al proiectelor similare din SUA.
Noul model de inteligență artificială este gratuit și, potrivit companiei, folosește mai puține date și este mult mai ieftin. Lansarea a atras atenția la nivel mondial, deși scepticismul persistă.
Competitorul, CEO-ul OpenAI, Sam Altman, l-a numit „un model impresionant”.
„Evident, vom livra modele mult mai bune, dar este revigorant să avem un nou competitor!”, a scris Altman într-o postare pe rețelele sociale.
Totuși, competiția a devenit îngrijorată, iar cuvintele lui Trump după apariția bruscă a aplicației chineze au fost, probabil, o slabă consolare pentru companiile americane. El a numit acest moment un „semnal de alarmă” pentru industria tehnologică americană și a declarat că găsirea unei modalități de a face inteligența artificială mai ieftină este, în cele din urmă, un „lucru bun”, arată BBC.
Cursa în inteligență artificială
Puține lucruri sunt cunoscute despre startup-ul din Hangzhou care a creat DeepSeek, al cărui acționar majoritar este Liang Wenfeng, cofondator al fondului de hedging High-Flyer. Cercetătorii companiei au scris într-o lucrare publicată luna trecută că modelul DeepSeek-V3, lansat pe 10 ianuarie, a fost antrenat cu cipuri H800 de la Nvidia, mai puțin performante, la un cost sub 6 milioane de dolari.
Ministrul Digitalizării din Japonia, Masaaki Taira, a declarat că apariția DeepSeek a schimbat percepția convențională conform căreia inteligența artificială generativă din China este cu ani în urmă.
„Se spunea că inteligența artificială generativă din China ar fi cu aproximativ cinci ani în urmă, dar s-a dovedit că acest lucru este greșit, iar tehnologia pare să fie pe un drum destul de bun”, a spus Taira, adăugând că Japonia analizează mai atent sugestiile conform cărora modelul ar putea fi mai eficient din punct de vedere al costurilor.
Reacția competitorilor
CEO-ul OpenAI, Sam Altman, promite accelerarea lansărilor de produse și „modele mult mai bune” după ce DeepSeek a subminat avansul Silicon Valley în cursa globală a inteligenței artificiale.
Altman, care săptămâna trecută a anunțat că un consorțiu de investitori, inclusiv SoftBank, va investi până la 500 de miliarde de dolari pentru a construi o rețea de centre de date destinate alimentării modelelor de inteligență artificială, a subliniat că resursele de calcul sunt „mai importante ca niciodată”.
Potrivit datelor colectate de Visible Alpha, giganții Microsoft, Meta, Alphabet, Amazon și Oracle au alocat 310 miliarde de dolari în 2025 pentru cheltuieli de capital, inclusiv infrastructură dedicată inteligenței artificiale.
Însă abilitatea DeepSeek de a concura cu un buget semnificativ mai redus decât cel al OpenAI — evaluată recent la 157 de miliarde de dolari — și al rivalilor săi Anthropic, Google și Meta, ridică semne de întrebare legate de sumele uriașe investite până acum.
„Câștigătorii nu vor fi cei care ard cei mai mulți bani”, a declarat Aidan Gomez, fondator al Cohere, o companie din Toronto care construiește modele lingvistice pentru întreprinderi. El a adăugat că aceștia vor fi cei care „găsesc soluții eficiente”.
Această situație a expus, de asemenea, riscurile pentru jucătorii care au investit aproape 100 de miliarde de dolari în startup-uri din sectorul american anul trecut. „Acum există un model open-source care circulă pe internet și care poate fi folosit pentru a transforma orice model suficient de puternic într-un sistem de inteligență artificială rațional”, a spus Jack Clark, cofondator al Anthropic, într-un blog publicat luni.
„Capabilitățile de inteligență artificială la nivel global tocmai au făcut un salt ireversibil înainte”, a adăugat el. „Felicitări DeepSeek pentru curajul de a aduce o astfel de schimbare în lume!”
Succesul DeepSeek complică argumentul conform căruia resursele financiare masive creează un avantaj insurmontabil — un argument care a ajutat laboratoarele de top din Silicon Valley să strângă zeci de miliarde de dolari în ultimul an, potrivit Financial Times.
„Dacă ești Anthropic sau OpenAI, încercând să fii în avangardă, iar cineva poate oferi ceea ce oferi tu la o zecime din cost, asta este o problemă”, a spus Mike Volpi, care a condus Index Ventures în Cohere.
Lansarea bruscă a ultimului model al DeepSeek i-a surprins pe unii la Meta. „Principala frustrare este: «De ce nu ne-am gândit noi la asta primii?», având în vedere că avem mii dintre cele mai strălucite minți care lucrează la acest lucru”, a spus un angajat Meta.
CEO-ul Mark Zuckerberg — care săptămâna trecută a declarat că intenționează să aloce până la 65 de miliarde de dolari pentru extinderea echipelor de inteligență artificială și construirea unui nou centru de date — a făcut lobby intens pentru open-source, poziționând Meta în fruntea acestei mișcări în SUA. „Vrem ca SUA să stabilească standardul global pentru inteligență artificială, nu China”, a declarat compania, ca răspuns la ascensiunea DeepSeek.
Șeful echipei de inteligență artificială de la Meta, Yann LeCun, a spus că „rularea serviciilor de asistenți pentru miliarde” va necesita totuși un volum mare de resurse de calcul.
De altfel, reprezentanții companiilor rivale și investitorii au exprimat scepticism în privința costurilor scăzute declarate de DeepSeek pentru dezvoltarea modelelor sale. În decembrie, compania a afirmat că modelul său V3, utilizat de chatbotul aplicației sale, a costat 5,6 milioane de dolari pentru antrenare.
Totuși, această sumă a inclus doar ultima etapă de antrenare, nu întregul ciclu, și a exclus „costurile asociate cercetării preliminare și... experimentelor de arhitectură, algoritmi sau date”, a adăugat compania.