Google ha deciso di snellire l’enorme carico lavoro di transcodifica dei video caricati sulla piattaforma, creando allo scopo dei chip per server dedicati. L’azienda ha svelato l’esistenza dei chip denominati “Argos” in un post sul blog di YouTube; altri dettagli sono rivelati da C-Net e in documento diffuso a margine della conferenza ASPLOS (Architectural Support for Programming Languages) durante la quale il chip è stato presentato per la prima volta.
Così come è possibile sfruttare la potenza di calcolo delle GPU per workload massivi come il mining di criptovalute, o TPU (Tensor Processing Unit) per lavorare specificatamente con algoritmi di machine learning, il team che si occupa dell’infrastruttura di YouTube riferisce di avere creato una VCU, Video (trans)Coding Unit, a supporto delle transcodifiche dei filmati che per ogni caricamento devono essere convertiti in decine di versioni diverse e offrire fluidità con ogni larghezza di banda.
Secondo Jeff Calow di Google, il chip Argos apporta migliorie nell’ordine di 20-33x in termini di efficienza di elaborazione, rispetto ai precedenti sistemi sfruttati ed eseguiti su tradizionali server. Il package VCU consiste in una scheda PCI-E a lunghezza piena, alla stregua di una tradizionale scheda video. Su questa scheda sono presenti due chip ASIC Argos nascosti sotto un dissipatore passivo di alluminio; è presente anche quello che sembra un connettore 8-pin per alimentare la scheda che non ha sufficiente alimentazione dallo slot stesso.
In un diagramma Google evidenzia “10 encoder core” su ogni chip, e nel white paper con i dettagli tecnici si spiega che ogni encoder core è in grado di codificare filmati 2160p in tempo reale, fino a 60 FPS (frames per second) usando tre reference frame, e lo sfruttamento di più pipeline MOT (Multiple-Output Transcoding) codificando tutte le risoluzioni di uscita in parallelo.
La scheda è progettata per essere sfruttata nei sistemi di Scale Computing sfruttati da Google. Sfruttando 20 unità VCU per la codifica VP9, l’efficienza della gestione del video aumenta fino a 33 volte rispetto a una macchina Intel Skylake con 384 GiB (Gibibyte), con ovvio risparmio di tempo, di energia, di larghezza di banda e quindi costi.
Ogni minuto su YouTube gli utenti caricano più di 500 ore di video. Nel primo trimestre dello scoro anno, in concomitanza con lo scoppio della pandemia da coronavirus, il tempo di visione di contenuti su YouTube è cresciuto del 25%, e nei primi sei mesi i livestream sono cresciuti del 45%. YouTube è riuscita a gestire l’enorme flusso di materiale in ingresso grazie anche a queste VCU.