Motivul din spatele succesului uriaș al modelului AI DeepSeek. Experții explică de ce a fost dată peste cap lumea tehnologiei

Data publicării:
deepseek
Popularitatea DeepSeek a surprins piețele. Sursa foto: Profimedia Images

DeepSeek a dat peste cap lumea tehnologiei luna trecută și acest fapt este din motive întemeiate, potrivit experților în inteligență artificială, care spun că probabil că vedem doar începutul influenței startup-ului tehnologic chinez în domeniul AI, scrie CNN.

DeepSeek a făcut vâlvă la sfârșitul lunii ianuarie cu modelul său R1 AI, despre care compania spune că poate egala aproape performanța modelului o1 al Open AI la o fracțiune din costul acestuia. Acțiunile tech au scăzut în timp ce DeepSeek a dat jos pentru scurt timp ChatGPT devenind cea mai importantă aplicație din App Store.

Succesul i-a împins pe giganții tehnologiei să pună la îndoială poziția Americii în cursa AI împotriva Chinei și miliardele de dolari din spatele acestor eforturi. Deși vicepreședintele J.D. Vance nu a menționat numele DeepSeek sau China în declarațiile sale la Summitul AI de la Paris, marți, el a subliniat cât de mare este prioritatea pentru Statele Unite să conducă acest sector.

„Statele Unite ale Americii sunt lider în AI, iar administrația noastră intenționează să o mențină așa”, a spus el, deși a adăugat că „America vrea să colaboreze” cu alte țări.

Dar nu este vorba doar de eficiența și puterea DeepSeek. Modul în care DeepSeek R1 poate raționa și „gândi” prin răspunsuri pentru a oferi rezultate de calitate, împreună cu decizia companiei de a face publice părți cheie ale tehnologiei sale, vor împinge, de asemenea, domeniul înainte, spun experții.

Deși AI a fost folosită de mult timp în produsele tehnologice, a atins un punct critic în ultimii doi ani datorită creșterii ChatGPT și a altor servicii AI generative care au remodelat modul în care oamenii lucrează, comunică și găsesc informații. Prin urmare, orice dezvoltare care poate ajuta la construirea de modele mai capabile și mai eficiente va fi cu siguranță urmărită îndeaproape.

„Acesta cu siguranță nu este un hype”, a spus Oren Etzioni, fostul CEO al Institutului Allen pentru Inteligență Artificială. „Dar, de asemenea, aceasta este o lume în mișcare foarte rapidă.”

Hassabis: „Probabil cea mai bună lucrare pe care am văzut-o din China”

Liderii tehnologiei au răspuns rapid la ascensiunea DeepSeek. CEO-ul Google DeepMind, Demis Hassabis, a numit hype-ul din jurul DeepSeek „exagerat”, dar a spus, de asemenea, că modelul său este „probabil cea mai bună lucrare pe care am văzut-o din China”, potrivit CNBC.

CEO-ul Microsoft, Satya Nadella, a declarat, la apelul trimestrial al companiei privind veniturile din ianuarie, că DeepSeek are câteva „inovații reale”, în timp ce CEO-ul Apple, Tim Cook, a spus despre apelul privind veniturile producătorului de iPhone că „inovația care stimulează eficiența este un lucru bun”.

Dar atenția nu a fost toată pozitivă. Cercetătorul de semiconductori SemiAnalysis a pus la îndoială afirmațiile DeepSeek că antrenamentul AI a costat doar 5,6 milioane de dolari. OpenAI a declarat pentru Financial Times că a găsit dovezi că DeepSeek a folosit modelele companiei americane pentru a-și antrena propriul concurent.

„Suntem conștienți și analizăm indicii că DeepSeek ar putea să fi distilat în mod necorespunzător modelele noastre și vom împărtăși informații pe măsură ce știm mai multe”, a declarat un purtător de cuvânt al OpenAI într-un comentariu pentru CNN. DeepSeek nu a putut fi contactat imediat pentru comentarii.

Și o pereche de parlamentari americani au cerut deja ca aplicația să fie interzisă de pe dispozitivele guvernamentale, după ce cercetătorii în domeniul securității au evidențiat potențialele legături ale acesteia cu guvernul chinez, după cum au raportat Associated Press și ABC News. Îngrijorări similare au fost ridicate cu privire la populara aplicație de social media TikTok, care trebuie vândută unui proprietar american, altfel riscă să fie interzisă în SUA.

„DeepSeek este un TikTok al (modelelor lingvistice mari)”, a spus Etzioni.

Impresia lăsată de DeepSeek asupra lumii tehnologiei

Giganții tehnologiei se gândesc deja la modul în care tehnologia DeepSeek le poate influența produsele și serviciile.

„Ceea ce ne-a oferit DeepSeek a fost în esență rețeta sub forma unui raport tehnologic, dar nu ne-au oferit părțile suplimentare lipsă”, a spus Lewis Tunstall, cercetător senior la Hugging Face, o platformă AI care oferă instrumente pentru dezvoltatori.

Tunstall conduce un efort la Hugging Face pentru a deschide complet modelul R1 al DeepSeek; în timp ce DeepSeek a furnizat o lucrare de cercetare și parametrii modelului, nu a dezvăluit codul sau datele de antrenament.

Nadella a spus la apelul Microsoft privind veniturile că PC-urile Windows Copilot+, sau PC-urile construite după o anumită specificație pentru a suporta modele AI, vor putea rula modele AI distilate din DeepSeek R1 la nivel local. Producătorul de cipuri mobile Qualcomm a declarat marți că modelele distilate de la DeepSeek R1 rulează pe smartphone-uri și PC-uri alimentate de cipurile sale într-o săptămână.

Cercetătorii, academicienii și dezvoltatorii IA încă explorează ce înseamnă DeepSeek pentru progresul AI.

Modelul DeepSeek nu este singurul open-source și nici primul care poate să raționeze răspunsurile înainte de a răspunde; Modelul o1 al OpenAI de anul trecut poate face și asta.

Ceea ce face ca DeepSeek să fie semnificativ este modul în care poate raționa și învăța din alte modele, împreună cu faptul că comunitatea AI poate vedea ce se întâmplă în culise. Cei care folosesc modelul R1 în aplicația DeepSeek pot vedea, de asemenea procesul său de „gândire” în timp ce răspunde la întrebări.

„Puteți vedea roțile rotindu-se în interiorul mașinii”, a declarat pentru CNN Durga Malladi, vicepreședinte senior și director general pentru planificarea tehnologiei și soluții de vârf la Qualcomm.

Tunstall crede că putem vedea un val de modele noi care pot raționa ca DeepSeek într-un viitor nu prea îndepărtat. Acest lucru ar putea fi esențial, deoarece giganții tehnologici se întrec pentru a construi agenți AI, despre care Silicon Valley consideră în general următoarea evoluție a chatbot-ului și modul în care consumatorii vor interacționa cu dispozitivele - deși această schimbare nu s-a produs încă.

Grok 3, următoarea iterație a chatbot-ului de pe platforma de socializare X, va avea „capacități de raționament foarte puternice”, a declarat, joi, proprietarul său, Elon Musk, într-o apariție video în timpul Summitului Mondial al Guvernelor de la Dubai.

Deocamdată, comunitatea AI va continua să schimbe ceea ce DeepSeek are de oferit, cel puțin până la următoarea descoperire. „Cu siguranță prezic că în următoarele 12 luni, va fi înlocuit de altceva”, a spus Etzioni. „Dar este un avans foarte real.”

Editor : M.I.

Urmărește știrile Digi24.ro și pe Google News

Partenerii noștri
Playtech
Cea mai apropiată plajă din Grecia față de România. Ajungi în câteva ore, are distincția Blue Flag, iar...
Digi FM
Adrian Alexandrov, partenerul Elenei Udrea, primele declarații după ce aceasta a fost operată de urgență: „A...
Pro FM
LeAnn Rimes, moment jenant pe scenă. Și-a pierdut dinții în mijlocul concertului și a fugit în culise
Film Now
Cum a apărut Simone Ashley la premiera filmului „F1”, după ce rolul ei a fost eliminat la montaj: „Sunt...
Adevarul
Cine este Thomas Ferfelis, soțul Kirei Hagi, și ce tradiții machedonești are de respectat la nuntă. Părinții...
Newsweek
Cu cât au crescut pensiile în numai o lună? Care pensionari iau mai mulți bani decât în aprilie?
Digi FM
Punct final la „Nunta Secolului”. Jeff Bezos şi Lauren Sanchez au găzduit o petrecere în pijamale. Imaginile...
Digi World
Un bărbat a mâncat 150 de ouă, în doar cinci zile: „E o nebunie, corpul meu s-a subțiat considerabil”...
Digi Animal World
Momentul când un șoim atacă o vulpe pe o plajă din din California. Imaginile sunt virale
Film Now
Brad Pitt, despre vizitele la Alcoolici Anonimi, făcute după despărțirea de Angelina Jolie: "Aveam nevoie de...
UTV
Dorian Popa și-a cerut iubita în căsătorie. Andreea a fost surprinsă cu un inel spectaculos pe deget