[banner]…[/banner]
Non molti se ne sono accorti, ma gli scacchi sono cambiati per sempre. Di nuovo.
Il merito è di AlphaZero, divisione di Google, che ha doppiato il risultato dell’anno scorso quando con il nome AlphaGo è stato in grado di sconfiggere i migliori giocatori al mondo di Go, gioco che non si riusciva a contenere dentro una intelligenza artificiale per via delle sue eccessive variazioni e possibilità. Un anno dopo, è la volta di AlphaZero, ma con delle variazioni. Perché il gioco degli scacchi già da tempo era stato “smontato” e vinto dalle macchine. Tanto che il più improtante benchmark è quello di Stockfish, il motore per giocare a scacchi che viene utilizzato dai giocatori professionisti per allenarsi e che domina dal 2016 il campionato dei computer (ebbene sì, c’è un campionato dei computer che giocano a scacchi).
La partita è stata giocata su 100 match: 28 vinti da AlphaZero, 72 patte e zero sconfitte. È stato tutto fatot a porte chiuse, ma la sensazione è che sostanzialmente AlphaZero abbia “tritato” Stockfish, punto di arrivo di trent’anni di ricerca su come vincere agli scacchi con il computer. La cosa sorprendente?
Beh, AlphaZero ha “imparato” a giocare a scacchi in quattro ore, utilizzando l’infrastruttura DeepMind di Google con un nuovo tipo di machine learning dotato di rinforzi specifici per gli scacchi. Niente lezioni di strategia o riscaldamenti di base per apprendere a giocare, né tabelle con le situazioni di gioco e le loro possibili uscite. Invece, AlphaZero ha seguito la strada del machine learning, cioè una rete neurale che è stata programmata per imparare cosa fare in situazioni molto semplici (come muovere un pezzo da una casella all’altra) e che poi è stata esposta a migliaia di miliardi di mosse degli scacchi, imparando a reagire a suon di sbagli sino a che non ha capito da sola le regole. E le strategie.
Le ha capite tanto bene che, come hanno visto gli analisti del sistema, a differena di Stockfish che valuta 70 milioni di mosse al secondo (praticamente tenta tutto il tentabile e cerca di vedere quale mossa offra le migliori conseguenze), AlphaZero guarda “solo” 80mila mosse al secondo. Un po’ come fanno gli esseri umani, che non hanno bisogno di valutare tutte le possibili biforcazioni ma trovano il modo di selezionare e semplificare, oltre che andare in profondità. Con un livello e una qualità molto maggiori, però.
Per adesso si sa poco di quel che è successo: quelli di Google stanno lavorando a un paper di ricerca da pubblicare più avanti (la tecnologia è considerata ricerca di base, una esplorazione delle possibilità di uso, più che una applicazione commerciale) e quel che fa impressione non è soltanto la stracciante vittoria, quanto il tempo estremamente limitato necessario al computer per apprendere: indice dell’efficienza e della potenza dei sistemi di DeepMind.
Secondo il campione di scacchi a riposo, Gary Kasparov, un risultato di questo tipo è davvero notevole: “Ce lo potevamo aspettare dopo aver visto AlphaGo, ma la cosa davvero notevole è l’approccio di tipo B, alla maniera degli esseri umani, che avrebbe fatto la gioia di Claude Shannon e Alan Turing”.