Il primo modello di intelligenza artificiale a sfiorare le capacità umane di ragionamento più profondo per risolvere problemi complessi è stato o1 di OpenAI introdotto a settembre: ora Google colma il divario con Gemini 2.0 Flash Thinking Experimental, il primo di Big G che ragiona. Nelle parole di Google:
La modalità di pensiero di Gemini 2.0 Flash è un modello sperimentale addestrato per generare il “processo di pensiero” che il modello segue nell’ambito della sua risposta.
Di conseguenza la modalità di pensiero è in grado di offrire risposte con capacità di ragionamento più avanzate rispetto al modello di base Gemini 2.0 Flash.
Finora i balzi nei progressi di chatbot e assistenti AI sono stati raggiunti per lo più con modelli sempre più grandi, con un numero spropositato di parametri e tanta potenza di calcolo per l’addestramento. Ma ultimamente con questa tecnica diversi ricercatori e società hanno riscontrato miglioramenti decrescenti con i modelli AI standard.
Per migliorare ulteriormente la qualità e la precisione dei risultati, soprattutto per problemi complessi, i nuovi modelli AI che ragionano integrano meccanismi di autocontrollo e cicli di feedback. In questo modo il compito principale viene suddiviso in più operazioni: il sistema valuta le possibili risposte per determinare quella migliore in base a ulteriori elaborazioni.
Come già rilevato da OpenAI per il suo o1, anche il team di Google dichiara che Gemini 2.0 Flash Thinking richiede più tempo e potenza di calcolo proprio perché ragiona. Quindi è più costoso da gestire.
Non solo: per alcuni problemi elementari e semplici l’impiego di modelli che ragionano è sconsigliato. Non solo perché costano di più, ma anche perché per il momento possono fornire risultati meno precisi, se non addirittura errati rispetto a un modello AI standard più semplice.
Come o1 anche Gemini 2.0 Flash Thinking è indicato per problemi complessi. Sbaglia però chi pensa si siano raggiunti i limiti del possibile con la tecnologia attuale.
Want to see Gemini 2.0 Flash Thinking in action? Check out this demo where the model solves a physics problem and explains its reasoning. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) December 19, 2024
Secondo Jeff Dean, capo scienziato Google DeepMind i risultati sono promettenti quando viene aumentato il calcolo del tempo di inferenza. In altre parole la corsa verso AI sempre più potenti, versatili e precise è ancora scandita dalla quantità di denaro e chip disponibili, possibilmente Nvidia.
I modelli AI sempre più evoluti, multimodali e che ragionano aprono la strada agli agenti intelligenti in arrivo nel 2025. Tutte le notizie che parlano di Intelligenza Artificiale sono disponibili nella sezione dedicata di macitynet.