Per scoprire la storia di Hey Siri e la direzione intrapresa da Apple nel suo sviluppo basta leggere il nuovo articolo pubblicato dall’azienda su Machine Learning Journal, il blog creato con lo scopo di documentare le ricerche e le innovazioni della società nel campo dell’intelligenza artificiale (AI) e dell’apprendimento automatico.
La funzione, introdotta con iOS 8 su iPhone 6, era inizialmente disponibile soltanto quando il dispositivo si trovava collegato a un alimentatore. Successivamente, grazie ad un processore a bassa potenza sempre attivo, i nuovi iPhone e iPad sono in grado di ascoltare costantemente il comando “Hey Siri”, eliminando così la necessità del collegamento alla rete elettrica, funzione estesa a tutti i dispositivi iOS delle ultime generazioni.
Nel corso del tempo il team che lavora sullo sviluppo di tale funzionalità ha creato reti neurali sempre più potenti, migliorando così le future interazioni di Siri con l’obiettivo di «Rendere i dispositivi sempre più personalizzabili e su misura degli utenti». Nell’articolo si scopre ad esempio che la frase “Hey Siri” è stata scelta per via del suo utilizzo naturale: numerosi utenti la pronunciavano mentre premevano il pulsante Home per attivarlo.
Il documento spiega che ci sono soltanto tre scenari in cui questo comando si rivela problematico, ovvero quando il proprietario del dispositivo pronuncia una frase simile, quando altri utenti dicono “Hey Siri” o quando gli stessi pronunciano una frase simile (secondo il team, quest’ultima è la falsa attivazione più fastidiosa di tutte).
Per ridurre le attivazioni accidentali di Siri, Apple starebbe potenziando il sistema di riconoscimento vocale: se inizialmente il sistema si concentrava soltanto su ciò che viene detto, l’obiettivo ora è quello di concentrare prima l’attenzione su chi sta parlando, imparando cioè a riconoscere le diverse voci per identificare il proprietario del dispositivo. Le future sfide – spiega l’azienda – saranno quelle di ottenere prestazioni migliori in ambienti dove c’è elevato riverbero (ad esempio all’interno di un’ampia stanza) e in quelli rumorosi (ad esempio nel bel mezzo del traffico).