GPT-4.5 a trecut testul Turing: inteligența artificială a fost confundată cu un om în 73% din interacțiuni

Data publicării: 20.04.2025 07:00

Ai,Artificial,Intelligence,,Digital,Chatbot,,Man,Chatting,With,Digital,Assistant — Foto. Shutterstock

Din articol

Un chatbot dezvoltat de OpenAI a trecut testul Turing, unul dintre cele mai cunoscute repere în evaluarea inteligenței artificiale, relatează Science Alert. Modelul GPT-4.5 a fost confundat cu un om în 73% dintre interacțiuni, potrivit unui studiu realizat de cercetători de la Universitatea din California, San Diego.

Lucrarea, aflată deocamdată în stadiul de preprint (neavând încă o evaluare științifică formală), a testat patru modele: ELIZA, GPT-4o, LLaMa-3.1-405B și GPT-4.5. În total, 284 de participanți au fost implicați în opt runde de conversații. În fiecare rundă, un „interogator” discuta prin mesaje text, simultan, cu doi „martori”: un om și un chatbot, fără să știe cine este cine. După cinci minute, participantul trebuia să indice care dintre cei doi este uman.

Rezultatele au fost clare: GPT-4.5 a fost identificat ca fiind uman în 73% dintre cazuri, iar LLaMa-3.1-405B în 56%. Modelele ELIZA și GPT-4o au reușit să inducă în eroare doar 23%, respectiv 21% dintre participanți.

Ce este testul Turing

Testul Turing a fost propus de matematicianul britanic Alan Turing în anii 1950, ca o modalitate de a determina dacă o mașină poate manifesta comportament inteligent echivalent cu cel al unui om. De-a lungul deceniilor, testul a fost considerat un reper în domeniul inteligenței artificiale, dar a fost și intens contestat.

Unii cercetători consideră că testul măsoară doar abilitatea de a imita comportamentul uman, nu inteligența reală. Alții spun că procesele interne ale unui computer nu pot fi comparate direct cu cele ale unei ființe umane, iar testul e prea limitat pentru a evalua cu adevărat inteligența.

Chiar și autorii studiului subliniază că succesul GPT-4.5 nu înseamnă că modelul este „inteligent” în sens uman. „Testul Turing este o măsură a substituibilității: dacă un sistem poate înlocui un om fără ca diferența să fie observată”, scriu cercetătorii.

Perioada scurtă de testare – doar cinci minute – este una dintre limitările menționate. În plus, fiecare model AI a fost instruit să adopte o anumită „personalitate” în timpul conversației, dar studiul nu explică în detaliu cum a influențat acest aspect percepția participanților.

Pentru moment, specialiștii sunt de acord că GPT-4.5 nu este la fel de inteligent ca un om, dar poate convinge cu ușurință mulți interlocutori că ar fi.

Editor : Ș.A.