Il progetto di ricerca OpenGPT-X ha recentemente lanciato Teuken-7B, un modello linguistico di grandi dimensioni ora disponibile su Hugging Face. Con 7 miliardi di parametri, questo modello è stato sviluppato per supportare tutte le 24 lingue ufficiali dell’Unione Europea (UE) e offre un’alternativa open source e commerciale per applicazioni di intelligenza artificiale (AI). Finanziato dal Ministero Federale tedesco per gli Affari Economici e l’Azione per il Clima (BMWK), il progetto mira a rafforzare la sovranità digitale dell’Europa.
Un modello con una prospettiva europea
Teuken-7B si distingue per essere stato addestrato con il 50% di dati non in lingua inglese, dimostrandosi stabile e performante in contesti multilingue. Questo approccio è cruciale per aziende e organizzazioni con esigenze di comunicazione multilingue. Inoltre, essendo open source, il modello permette alle aziende di sviluppare soluzioni personalizzate mantenendo i dati sensibili al loro interno.
“La disponibilità gratuita del modello consentirà ad accademici e imprese di adattarlo per le proprie applicazioni,” afferma il Prof. Stefan Wrobel del Fraunhofer IAIS. Grazie a strumenti come un tokenizer multilingue efficiente, i costi di addestramento sono stati ridotti, un vantaggio per lingue europee con strutture complesse come il tedesco o l’ungherese.
Applicazioni e sicurezza
Teuken-7B è stato sviluppato con particolare attenzione alla protezione dei dati, conforme agli standard europei di sicurezza e privacy. Questa caratteristica lo rende ideale per ambiti critici come automotive, medicina e finanza, dove la trasparenza e il controllo sulla tecnologia sono fondamentali.
Il modello è stato ottimizzato per applicazioni pratiche come chatbot, grazie a una tecnica chiamata instruction tuning, che migliora la comprensione delle istruzioni degli utenti. È disponibile in due versioni: una per la ricerca e una con licenza Apache 2.0 per usi commerciali.
Collaborazioni e futuro
Il progetto OpenGPT-X rappresenta un esempio di collaborazione europea. Oltre ai Fraunhofer Institutes, il consorzio include partner accademici e industriali, come TU Dresden e Aleph Alpha. Il modello è stato addestrato utilizzando il supercomputer JUWELS presso il Forschungszentrum Jülich.
Con un finanziamento di 14 milioni di euro e l’ambizione di concludersi entro il 2025, OpenGPT-X punta a consolidare le basi per ulteriori sviluppi nel settore dell’AI europea.
