Nonostante i rapidi progressi nell’intelligenza artificiale AI, i robot non possono definirsi esattamente intelligenti. Si tratta di macchine che, ancora oggi, compiono compiti specifici, ma non mostrano alcuna reale intelligenza nell’adattarsi ai compiti che svolgono. Le cose potrebbero cambiare, con DeepMind che ritiene di poter applicare grandi modelli di linguaggio (LLM) ai bracci robotici.
Sebbene i robot autonomi inizino ad essere applicati nel mondo reale, la loro capacità effettiva è ben distante da quanto accade con gli ultimi modelli LLM, che si sono dimostrati abili nel generalizzare le loro competenze in una vasta gamma di compiti, spesso in contesti sconosciuti. Questi modelli, potrebbero portare la a progressi importanti.
Nei nuovi risultati, i ricercatori di DeepMind hanno dimostrato che l’ AI chiamata RoboCat può, non solo imparare una vasta gamma di competenze, ma anche passare facilmente tra diversi corpi robotici e acquisire nuove competenze molto più velocemente del normale. Forse ciò che è più significativo, è in grado di accelerare il proprio apprendimento generando i propri dati di addestramento.
La nuova intelligenza artificiale si basa sul modello Gato che i ricercatori di DeepMind hanno presentato il mese scorso. È in grado di risolvere una vasta varietà di compiti, dal descrivere le immagini a giocare ai videogiochi e persino al controllo di bracci robotici. Ciò ha richiesto un addestramento su un dataset diversificato che includeva testo, immagini e dati di controllo robotico.
Per RoboCat, il team ha creato un dataset focalizzato specificamente su sfide robotiche. Hanno generato decine di migliaia di dimostrazioni di quattro diversi bracci robotici che svolgevano centinaia di compiti diversi, come impilare mattoncini colorati nell’ordine corretto o scegliere il frutto corretto da un cesto.
Uno dei principali vantaggi dell’architettura basata su questi robot transformer è la capacità di elaborare un volume di dati molto maggiore rispetto alle forme precedenti di intelligenza artificiale. Allo stesso modo, l’addestramento su grandi quantità di testo ha permesso ai LLM di sviluppare capacità linguistiche generali. I ricercatori affermano di essere stati in grado di creare un agente “generalista” in grado di affrontare una vasta gamma di compiti robotici utilizzando diverse configurazioni hardware.
Il robot che apprende da solo
Ancora più interessante, i ricercatori hanno dimostrato la capacità di RoboCat di migliorarsi autonomamente. Hanno creato diversi modelli derivati che sono stati ottimizzati per compiti specifici e poi hanno utilizzato questi modelli per generare circa 10.000 ulteriori dimostrazioni di uno stesso compito.
Queste sono state quindi aggiunte all’insieme di dati esistente e utilizzate per addestrare una nuova versione di RoboCat con prestazioni migliorate. Se inizialmente un RoboCat è stato in grado di completare un compito con una percentuale di successo del 36%, successivamente – dopo molte iterazioni di auto-miglioramento e addestramento su nuovi compiti – la percentuale è più che raddoppiata, arrivando al 74%.
Va ammesso che il modello non è ancora efficace in determinati problemi, con tassi di successo inferiori al 50% su diversi compiti e un punteggio del 13% su uno di questi. Tuttavia, la capacità di RoboCat di DeepMiond di padroneggiare molte sfide diverse e di acquisire rapidamente nuove abilità suggerisce che cervelli robotici adattabili potrebbero non essere così lontani.
Tutte le notizie che parlano di Intelligenza Artificiale sono disponibili a partire da questa pagina di macitynet.