Google ha sviluppato un assistente vocale senza connessone Internet, abbastanza piccolo e leggero da poter essere eseguito in locale, senza connessione internet, quindi senza il supporto del calcolo su un server remoto con elevata potenza, come avviene con Siri, Google Now o Cortana
I ricercatori Google hanno sviluppato un modello di riconoscimento unico per due diverse tipologie di comando vocale, ovvero la dettatura e il riconoscimento dei comandi vocali, riuscendo a comprimere il loro sistema significativamente rispetto alle dimensioni originali (il modello acustico originale era di circa 80MB di dimensione).
Oggi i sistemi di riconoscimento vocale offline incorporati possono già gestire un comando come, “Invia una email a Mario Rossi: possiamo rimandare?” semplicemente trascrivendo il testo e successivamente eseguendo il comando; la trascrizione accurata richiede però l’integrazione dei dati personali, come ad esempio il nome del contatto, problema risolto integrando la lista dei contatti del dispositivo nel modello.
Per realizzare il modello acustico, i ricercatori hanno estratto tre milioni di espressioni, pari a 2.000 ore di ascolto, dalle ricerche vocali di Google, introducendo anche dei campioni di rumore dai video di YouTube.
Mountain View, si apprende, raggiunto l’obbiettivo di realizzare un applicativo di far girare l’applicativo con richieste di sistema accettabili (gli esperimenti sono stati condotti su un Nexus 5 con CPU 2.26GHz e 2GB di RAM e usando solo 20.3MB di spazio su disco), è quello di migliorare la precisione.
Attualmente il tasso di errore per parola è infatti pari al 13,5 per cento su un compito di dettatura, un livello ancora significativo che renderebbe il sistema non affidabile, ma è un buon punto di partenza.