L’evento Made by Google è dedicato al nuovo hardware di Big G, inclusi i nuovi Pixel 9 e Pixel Watch 3 ma, come prevedibile, l’intelligenza artificiale ha ricoperto un ruolo centrale, sia con le novità di Gemini che si appresta a mandare in pensione il fidato Assistente Google, sia con la novità assoluta Gemini Live, introdotto come il primo assistente colloquiale su smartphone.
Finora gli assistenti vocali sono stati limitati nella comprensione e nelle funzioni, ora tutto cambia con l’avvento dei modelli AI generativi multimodali. Google paragona Gemini Live a una chiacchierata al telefono con un esperto in praticamente qualsiasi campo, durante la quale l’utente può persino interrompere l’assistente mentre parla, per richiedere ulteriori precisazioni in merito alla domanda precedente. Il sistema comprende senza problemi le precisazioni richieste nel contesto della domanda precedente, senza che l’utente debba ripetere.
Tra gli esempi proposti una conversazione- riunione a due tra utente e Gemini Live su potenziali lavori adatti tenendo conto di competenze e titolo di studio. Anche qui è possibile mettere in pausa, per richiedere precisazioni ma anche semplicemente per riprendere in un secondo momento. Si può interagire con Gemini Live anche quando l’utente è occupato a fare altro, con l’app Gemini in background o persino quando lo smartphone è bloccato. Per rendere le cose più naturali è possibile scegliere tra ben 10 voci per Gemini Live, ognuna con tono e stile diversi per accontentare tutti.
Gemini Live: disponibilità
Al lancio Gemini Live è disponibile su Android solo in lingua inglese e richiede l’abbonamento Gemini Advanced. Google precisa che nelle prossime settimane sarà esteso anche nell’app per iPhone e iPad (Google Search), oltre che in altre lingue.
Più funzioni per Gemini
Funzioni vocali a parte, Gemini migliora con l’imminente integrazione delle estensioni per Keep, Task e Utilities, oltre che funzioni dedicate a YouTube.
Evitando di dover passare a mano da un’app all’altra e fare tutto personalmente, l’utente può chiedere all’assistente AI Gemini di ritrovare una mail in Gmail con una ricetta inviata da un’amica, poi inserire gli ingredienti nella lista della spesa in Keep, infine durante una festa di riprodurre musica fine anni ’90. Il sistema comprende sempre il contesto ed esegue quanto richiesto, anche se l’utente non fornisce ogni dettaglio.
Con l’estensione Calendario si può scattare la foto di un manifesto o di un volantino per mercati o concerti e chiedere a Gemini di verificare se una determinata data è compatibile con i nostri impegni e, nel caso, impostare un promemoria. Per attivare Gemini su Android, ora sempre più integrato nel sistema operativo, basta premere a lungo il pulsante di accensione oppure pronunciare “Ehi Google”.
Da qui è possibile richiedere informazioni su qualsiasi cosa visualizzata a schermo, incluse domande complesse anche su video YouTube. Per esempio è possibile chiedere l’elenco di tutti i ristoranti citati in un video, oltre che di aggiungerei a Google Maps. Sempre grazie all’integrazione Android, anche sotto forma di finestra sovra impressa fluttuante, è possibile chiedere a Gemini di generare una immagine ad hoc per il compleanno di un amico e incollarla al volo in Google Messaggi o Gmail.
Siamo ai primi passi e alle prime conversazioni: anche Google avverte che per certi compiti semplici i vecchi metodi potrebbero essere ancora quelli più veloci. Invece nelle operazioni più complessi a volte l’AI si può comportare in modo inaspettato, oppure fornire informazioni imprecise. Ma questo dovrebbe accadere sempre meno con l’arrivo di modelli più recenti e potenti come Gemini 1.5 Flash, quello ora impiegato da Google.
Tutte le notizie su Google sono disponibili da questa pagina di macitynet, invece per gli articoli dedicati all’intelligenza artificiale si parte da qui.