La società cinese DeepSeek ha presentato il suo nuovo modello di intelligenza artificiale, DeepSeek V3-0324, che promette alte prestazioni con un costo di sviluppo contenuto. Disponibile su Hugging Face con licenza MIT, l’IA può essere utilizzata gratuitamente anche per scopi commerciali.
Uno degli aspetti più sorprendenti del modello è la sua efficienza: con un budget di 5 milioni di dollari, DeepSeek è riuscita a sviluppare un sistema competitivo rispetto ai modelli delle big tech, il cui addestramento può costare fino a 100 milioni di dollari. In test interni, il nuovo modello ha dimostrato una velocità di oltre 20 token al secondo, superando rivali come Claude Sonnet 3.5 di Anthropic.
Dal punto di vista tecnico, DeepSeek V3 sfrutta un’architettura Mixture of Experts (MoE), attivando selettivamente 37 miliardi di parametri sui 685 miliardi totali, ottimizzando così i calcoli senza sacrificare le prestazioni. Grazie a questa tecnologia, il modello può funzionare su computer commerciali, come il Mac Studio con chip M3 Ultra.
DeepSeek V3 si è classificato tra i primi 10 su Chatbot Arena, la piattaforma di benchmarking dell’Università della California. Tuttavia, persistono dubbi sulla sicurezza e sulla gestione dei dati da parte dell’azienda, con il timore di possibili interferenze governative. Intanto, mentre l’app ufficiale di DeepSeek è scomparsa dagli store italiani di Apple e Google, il servizio resta accessibile via web nel nostro Paese.


Vuoi ricevere le notifiche sulle nostre notizie più importanti?