L’intelligenza artificiale può davvero competere con l’uomo nei test di intelligenza generale?

Il test ARC-AGI mette alla prova l’IA con esercizi di ragionamento astratto basati su griglie di quadrati colorati
MeteoWeb

Negli ultimi anni, l’intelligenza artificiale (IA) ha raggiunto risultati sorprendenti, stimolando il dibattito su quanto possa avvicinarsi al livello cognitivo umano. L’ultimo progresso, ottenuto da un sistema sviluppato da OpenAI, ha segnato un importante traguardo: un punteggio dell’82,8% in un test progettato per valutare l’“intelligenza generale”. Questo risultato, secondo alcuni esperti, pone la macchina in competizione con l’uomo medio, ma solleva anche domande fondamentali su cosa significhi davvero essere “intelligenti”.

Un test oltre il classico Turing

Tradizionalmente, il punto di riferimento per valutare l’intelligenza artificiale è stato il test di Turing, introdotto nel 1950. Secondo questo criterio, una macchina dimostra intelligenza se riesce a convincere un essere umano che è una persona reale. Sebbene tecnologie come ChatGPT abbiano probabilmente superato questa sfida, gli scienziati stanno cercando metriche più sofisticate per misurare l’intelligenza artificiale.

A questo scopo, l’ingegnere e ricercatore di IA François Chollet ha sviluppato il test di benchmark ARC-AGI. Questo strumento è concepito per valutare la capacità di un sistema di apprendere nuove competenze al di fuori dei propri dati di addestramento. Secondo Chollet, “L’AGI è un sistema in grado di acquisire in modo efficiente nuove competenze al di fuori dei suoi dati di addestramento”.

Il successo di OpenAI: o3 e il record infranto

Il test ARC-AGI mette alla prova l’IA con esercizi di ragionamento astratto basati su griglie di quadrati colorati. Il compito è identificare i modelli che trasformano una griglia in un’altra, apprendendo da soli tre esempi forniti. Finora, il record apparteneva a Jeremy Berman, che aveva ottenuto un punteggio del 58,5%. Tuttavia, il sistema o3 di OpenAI ha superato ogni aspettativa, raggiungendo un impressionante 82,8%. Questo risultato è stato definito da Chollet come “un significativo balzo in avanti” e “una vera svolta nell’adattabilità e nella generalizzazione”.

In un articolo sul blog, Chollet ha enfatizzato l’importanza di questa conquista: “Questo non è solo un progresso incrementale; è un territorio nuovo e richiede una seria attenzione scientifica”.

Il miglioramento è particolarmente notevole se si considera il passato. Nel 2020, GPT-3 aveva ottenuto un risultato di appena lo 0%, mentre GPT-4o, nel 2024, era salito al 5%. La performance del sistema o3 rappresenta un salto quantico, anche se non mancano le limitazioni. Chollet stesso ha ammesso che il sistema fatica ancora in alcuni compiti apparentemente semplici, suggerendo che la strada verso una vera intelligenza generale è ancora lunga.

Cosa significa davvero “intelligenza generale”?

Un aspetto fondamentale è la distinzione tra capacità tecnica e vera intelligenza. ChatGPT, ad esempio, eccelle nella generazione di contenuti grazie alla sua capacità di analizzare enormi quantità di dati e prevedere con precisione le risposte più probabili. Tuttavia, secondo Chollet, “la vera intelligenza generale non riguarda tanto l’abilità di generare output, quanto quella di acquisire nuove abilità senza un’enorme mole di dati di addestramento”.

Questo pone un interrogativo fondamentale: può un sistema come o3 essere davvero considerato “intelligente”? O, piuttosto, si tratta di un’evoluzione limitata dalla natura stessa del suo funzionamento? Il risultato suggerisce che l’IA stia avanzando verso nuove frontiere, ma è ancora lontana dal replicare le capacità cognitive umane nella loro complessità.

Previsioni e scenari futuri

Nonostante i progressi, il mondo accademico rimane diviso sulla possibilità di raggiungere una vera AGI nel prossimo futuro. Alcuni esperti ipotizzano che questa tecnologia potrebbe emergere entro la fine del decennio, mentre altri sono più cauti. Ben Goertzel, fondatore di SingularityNET, ha recentemente dichiarato che “nel 2023 i computer avranno una potenza di calcolo equivalente a quella di un cervello umano”, aggiungendo che entro 10-15 anni un singolo computer potrebbe eguagliare “la potenza di calcolo di tutta la società umana”.

Tuttavia, simili previsioni devono essere considerate con prudenza. L’intelligenza umana non è definita esclusivamente dalla capacità computazionale, ma anche da qualità come la creatività, l’empatia e il giudizio etico, che rimangono fuori dalla portata delle macchine.

Il progresso del sistema o3 rappresenta senza dubbio un passo avanti nella comprensione e nello sviluppo dell’intelligenza artificiale. Tuttavia, come sottolineano molti esperti, è essenziale mantenere una prospettiva equilibrata. La strada verso una vera intelligenza generale è lunga e complessa, e ogni passo avanti solleva nuove domande sul rapporto tra uomo e macchina.

In definitiva, il risultato di OpenAI dimostra che l’IA sta evolvendo, ma la sua natura resta fondamentalmente diversa da quella dell’intelligenza umana. La vera sfida non è solo replicare la nostra capacità di apprendere, ma comprendere ciò che rende l’intelligenza umana unica e insostituibile.

Condividi