L’ultima versione di ChatGPT, ChatGPT-4, ha superato un rigoroso test di Turing, dimostrando alcune capacità pressoché indistinguibili da quelle delle controparti umane. Un team guidato da Matthew Jackson, professore di economia presso la Stanford School of Humanities and Sciences, USA, ha analizzato la personalità e il comportamento dell’intelligenza artificiale di ChatGPT utilizzando gli strumenti della psicologia e dell’economia comportamentale, portando a questo straordinario risultato riportato in un saggio pubblicato su “PNAS“.

Verso capacità umane

“Sempre più spesso, i bot verranno inseriti in ruoli in cui devono prendere decisioni, e il tipo di caratteristiche che avranno diventeranno più importanti“, ha affermato Jackson, che è anche senior fellow presso lo Stanford Institute for Economic Policy Research.

Nello studio, il gruppo di ricerca ha sottoposto le versioni 3 e 4 di ChatGPT a un test della personalità ampiamente utilizzato e ha anche chiesto ai chatbot di descrivere le loro mosse in una suite di giochi comportamentali in grado di prevedere comportamenti economici ed etici nel mondo reale. I giochi includevano esercizi stabiliti in cui i giocatori decidevano ad esempio come investire del denaro. Le risposte dei bot sono state confrontate con quelle di oltre 100.000 persone provenienti da 50 paesi.

Il test di Turing

La ricerca segna una delle prime volte in cui una fonte di intelligenza artificiale ha superato un rigoroso test di Turing. Un test di Turing, che prende il nome dal pioniere britannico dell’informatica Alan Turing, può consistere in un qualsiasi compito assegnato a una macchina per valutare se si comporta come un essere umano. Se la macchina sembra umana, supera il test.

I ricercatori hanno valutato i tratti della personalità dei bot utilizzando il test della personalità chiamato OCEAN Big-5, che valuta gli intervistati in base a cinque tratti fondamentali che modellano il comportamento. Nello studio, ChatGPT-4 è risultata entro intervalli normali per i cinque tratti, ma con una “capacità di piacere” piuttosto bassa. Il bot ha sì superato il test di Turing, insomma, ma “con scarse capacità di farsi degli amici” come riportato in una presentazione di Stanford. ChatGPT-4 si trova comunque una spanna sopra la versione 3. La versione precedente, infatti, con la quale molti utenti di Internet potrebbero aver interagito gratuitamente, è risultata infatti anche meno “gradevole“.

Per quel che riguarda i test dei giochi, i ricercatori hanno confrontato una mossa umana scelta casualmente con una tra le 30 sessioni giocate con ciascun dei bot. Nella maggior parte dei giochi, le mosse della Versione 4 avevano più probabilità di essere “umane” – vale a dire eguali a quelle delle controparti umane – che non. La versione 3 invece non ha superato questo test di Turing.

La ricerca ha rilevato che le scelte dei chatbot nei giochi sono spesso ottimizzate per il massimo beneficio sia per il bot che per la sua controparte umana. Le loro strategie erano coerenti con l’altruismo, l’equità, l’empatia e la reciprocità, portando i ricercatori a suggerire che i chatbot potrebbero funzionare bene come agenti del servizio clienti e mediatori di conflitti.

