Un chatbot dezvoltat de OpenAI a trecut testul Turing, unul dintre cele mai cunoscute repere în evaluarea inteligenței artificiale, relatează Science Alert. Modelul GPT-4.5 a fost confundat cu un om în 73% dintre interacțiuni, potrivit unui studiu realizat de cercetători de la Universitatea din California, San Diego.
Lucrarea, aflată deocamdată în stadiul de preprint (neavând încă o evaluare științifică formală), a testat patru modele: ELIZA, GPT-4o, LLaMa-3.1-405B și GPT-4.5. În total, 284 de participanți au fost implicați în opt runde de conversații. În fiecare rundă, un „interogator” discuta prin mesaje text, simultan, cu doi „martori”: un om și un chatbot, fără să știe cine este cine. După cinci minute, participantul trebuia să indice care dintre cei doi este uman.
Rezultatele au fost clare: GPT-4.5 a fost identificat ca fiind uman în 73% dintre cazuri, iar LLaMa-3.1-405B în 56%. Modelele ELIZA și GPT-4o au reușit să inducă în eroare doar 23%, respectiv 21% dintre participanți.
Ce este testul Turing
Testul Turing a fost propus de matematicianul britanic Alan Turing în anii 1950, ca o modalitate de a determina dacă o mașină poate manifesta comportament inteligent echivalent cu cel al unui om. De-a lungul deceniilor, testul a fost considerat un reper în domeniul inteligenței artificiale, dar a fost și intens contestat.
Unii cercetători consideră că testul măsoară doar abilitatea de a imita comportamentul uman, nu inteligența reală. Alții spun că procesele interne ale unui computer nu pot fi comparate direct cu cele ale unei ființe umane, iar testul e prea limitat pentru a evalua cu adevărat inteligența.
Chiar și autorii studiului subliniază că succesul GPT-4.5 nu înseamnă că modelul este „inteligent” în sens uman. „Testul Turing este o măsură a substituibilității: dacă un sistem poate înlocui un om fără ca diferența să fie observată”, scriu cercetătorii.
Perioada scurtă de testare – doar cinci minute – este una dintre limitările menționate. În plus, fiecare model AI a fost instruit să adopte o anumită „personalitate” în timpul conversației, dar studiul nu explică în detaliu cum a influențat acest aspect percepția participanților.
Pentru moment, specialiștii sunt de acord că GPT-4.5 nu este la fel de inteligent ca un om, dar poate convinge cu ușurință mulți interlocutori că ar fi.
Editor : Ș.A.