Conflitti interni, cambi di strategia, frustrazioni tecniche e leadership in transizione. Siri ha navigato in un mondo in tempesta e sballottata da un punto all’altro è arrivata in ritardo, anzi non è ancora arrivata da nessuna parte. Quel che è capitato e quel che potrebbe capitare per l’assistente vocale di Apple, perno vitale di tutta la strategia di Apple Intelligence, lo racconta The Information.
Un’evoluzione mancata
Quello “spiacevole e imbarazzante” evento, la necessità di rinviare funzioni annunciate e addirittura pubblicizzate, è l’effetto di un progresso caotico ed incerto delle tecnologie Siri, eventi radicati nel DNA di Apple.
Nata nel 2011, se Siri è rimasta indietro rispetto a rivali come Alexa e Google Assistant e oggi appare arcaica ed inutile di fronte ai chatbot dell’intelligenza artificiale generativa, in primo luogo dipende dal fatto che Siri fin dall’inizio è stata considerata un progetto di secondo piano, portato avanti più per obbligo che per visione.
Il caos nel team AI/ML
Non sono mancati conflitti interni su questioni legate a retribuzioni più elevate, promozioni più rapide, richieste di vacanze più lunghe e giornate lavorative più corte per i colleghi del gruppo AI/ML. Del resto all’interno di Apple il gruppo Artificial Intelligence / Machine Learning, cui faceva riferimento Siri, guidato da John Giannandrea, veniva soprannominato “AIMLess” (senza scopo).
Quando poi si è deciso di darle un ruolo primario, la sua storia era già gravata da frequenti ristrutturazioni interne, dalla gestione da parte di team diversi senza focus strategico, e dalla mancanza di strumenti analitici basilari, come metriche sull’uso o sulla soddisfazione degli utenti.
Si sono spesi anni di sviluppo per modificare comandi vocali minori, come il passaggio da “Hey Siri” a un più immediato “Siri”, distogliendo risorse da funzionalità realmente evolute. Proposte più ambiziose, come l’uso di modelli linguistici per far riconoscere a Siri emozioni o situazioni di stress negli utenti, sono state archiviate troppo presto.
Il caso ChatGPT e la reazione tardiva
Il lancio di ChatGPT, nel 2022, ha colto Apple completamente impreparata mettendo Siri di fronte ad una strada anche più impervia. John Giannandrea, allora a capo del team AI, non credeva nel valore reale dei chatbot per l’utente medio e questa sottovalutazione ha ulteriormente rallentato la reazione di Apple all’esplosione dell’AI generativa.
A questo si è sommato il consueto approccio conservativo di Apple. Fino al 2023, gli ingegneri Apple non potevano utilizzare modelli esterni nei prodotti finali, ma solo confrontarli in test interni. E quei confronti, sempre secondo le fonti, non erano lusinghieri per i modelli sviluppati da Apple, spesso indietro rispetto ai concorrenti di OpenAI.
È stato respinto anche il tentativo di un team di ingegneri di usare LLM (Large Language Models) per dotare Siri di “maggiore sensibilità emotiva”, in grado di fornire risposte adeguate a utenti in difficoltà. Anche qui in ossequio, probabilmente, alle strategie storiche di Apple.
Mini Mouse, Mighty Mouse e il flop della demo
Giannandrea era convinto di poter risolvere i problemi di Siri con i giusti dati per l’apprendimento e un migliore web-scraping per domande generali. La spina dorsale dell’AI di Apple dovevano essere due modelli linguistici: “Mini Mouse” (locale su iPhone) e “Mighty Mouse” (cloud).
I dirigenti responsabili hanno però cambiato rotta, puntando su un unico modello LLM da gestire via cloud e rimandando altri cambiamenti tecnici. Il ritardo era tale da rendere impossibile dimostrare funzioni reali alla WWDC 2024. Alcune funzionalità mostrate, come la lettura delle email per creare promemoria o tracciare voli, erano in realtà simulate.
La dimostrazione avrebbe sorpreso perfino i membri del team Siri, che non avevano mai visto versioni funzionanti. L’unica cosa reale e funzionante? La luce colorata attorno allo schermo.
Apple in passato non aveva mai fatto nulla del genere. Alcune delle opzioni mostrate nello spot potrebbero costare ad Apple una causa per “pubblicità ingannevole”.
Nel frattempo, Robby Walker – responsabile dello sviluppo di Siri – riusciva a ottenere piccole vittorie, come tempi di risposta più rapidi e la rimozione del comando “Hey Siri”, ottenuta dopo oltre un anno di lavoro.
Il bazooka di Craig Federighi
Con l’addio di Giannandrea e l’arrivo di Craig Federighi e Mike Rockwell, tutto è cambiato. Federighi avrebbe detto chiaramente ai team Siri di usare qualsiasi tecnologia utile per rendere Siri all’altezza, inclusi modelli open-source di terze parti. Un vero bazooka che Apple mai avrebbe imbracciato prima.
La cultura aziendale di Apple, da sempre restia a integrare soluzioni esterne, ha evidentemente ritenuto che mettere da parte il suo DNA sia l’unico modo per colmare il ritardo e portare Siri nel futuro dell’intelligenza artificiale.