Martedì 23 luglio Meta ha annunciato Llama 3.1, ultima versione del suo Large Language Model (modello linguistico di grandi dimensioni) che secondo l’azienda è in grado di competere con quello di rivali quali GPT-4o di OpenAI e Claude 3.5 Sonnet di Anthropic.
Il nuovo modello arriva a soli tre mesi di distanza di Llama 3, è open source e secondo Mark Zuckerber supererà l’utilizzo di ChatGPT.
Llama 3.1 vanta 405 miliardi di parametri ed è in grado di competere con rivali in termini di conoscenza generale, abilità matematiche e traduzioni multilingua.
Il modello in questione è stato addestrato sfruttando oltre 16.000 GPU NVIDIA H100 (GPU che costano circa 25.000$ cadauna) per un totale di 39,3 milioni di ore e, a detta di Meta, può battere i rivali in oltre 150 benchmark.
I 405 miliardi di parametri ai quali abbiamo fatto cenno sopra, sono variabili interne che i modelli AI usano per “ragionare” e prendere decisioni. Maggiore è il numero di parametri che un modello AI può usare, maggiore sarà la sensazione di “intelligenza” percepita.
Llama 3.1 è disponibile per il download in tre versioni, 405B (“B” sta per “billions”, quindi “miliardi di parametri”), 70B e 8B.
Meta riferisce che Llama 3.1 è stato addestrato su 15.000 miliardi di token di dati (“fonti pubblicamente disponibili”) aggiornate a dicembre 2023; i dati per il “fine-tuning” (perfezionamento) includono, tra le altre cose, oltre 25 milioni di esempi generati usando altri modelli o algoritmi.
Gli sviluppatori possono scaricare Llama 3.1 dal sito ufficiale; i tradizionali utenti potranno provare questo modello con la Meta AI in WhatsApp (per fare domande o chiedere consigli in chat di gruppo menzionando @Meta AI) o partendo dal sito meta.ai (nel momento in cui scriviamo non funziona dall’Italia).
In una lettera pubblicata mercoledì, il CEO di Meta, Mark Zuckerberg, sottolinea che l’approccio open source nello sviluppo AI garantisce accesso più ampio a queste tecnologie, impedendo la concentrazione del potere tra poche grandi imprese, e consentirà implementazioni sicure dell’AI su vari livelli. Secondo quanto riferito da Zuckerberg, Meta si è data l’obiettivo di fare di Llama lo “standard del settore” per chiunque sviluppi app e servizi alimentati dall’AI.
Per il momento le novità sui servizi di Meta sono riservate agli USA (vi sono questioni da risolvere con le autorità di regolamentazione dell’UE circa l’uso dei dati pubblici di Facebook e Instagram per l’allenamento dei modelli IA). Gli sviluppatori possono ad ogni modo scaricare il modello linguistico Llama 3.1 anche dall’UE.
Tutte le notizie che parlano di Intelligenza Artificiale sono disponibili a partire da questa pagina di macitynet.