Dal tardo pomeriggio di ieri – a partire dalle 17.25 – per circa sei ore è stato impossibile accedere a Whatsapp, Instagram, Facebook e Oculus. Il problema a quanto pare è stato provocato da un errore commesso internamente da Facebook durante un cambiamento di configurazione.
L’azienda si è scusata, confermando che il problema è stato causato da errate configurazioni nei suoi data center. Da indiscrezioni circolate nella giornata di ieri sembra che all’origine del problema vi è stato un errato aggiornamento del Border Gateway Protocol (BGP), un protocollo di routing usato per connettere tra loro più router che appartengono a sistemi autonomi distinti, denominati router di bordo/confine.
Santosh Janardhan, vice presidente engineering and Infrastructure di Facebook, in un post sul blog aziendale, si è scusato per l’inconveniente, spiegando che cambiamenti nella configurazione di router hanno causato una interruzione nelle comunicazioni con i data center.
“Il nostri team di ingegneri hanno scoperto che cambiamenti nella configurazione nei router di confine che coordinano il traffico di rete tra i data center, hanno causato problemi interrompendo le comunicazioni”, ha scritto Janardhan. “Tale sconvolgimento al traffico di rete ha avuto un effetto a cascata nelle modalità con le quali comunicano i data center portando al blocco dei nostri servizi”.
Quanto riportato combacia con informazioni arrivate da Cloudflare (società USA che si occupa di occupa di content delivery network, servizi di sicurezza internet e servizi di DNS distribuiti), che ieri aveva attribuito i problemi a inconvenienti legati al protocollo BGP, il protocollo di Internet che determina l’instradamento (routing) dei dati da trasmettere. Dopo le prime ore dall’inconveniente era circolata l’ipotesi di qualche problema legato a configurazioni DNS ma la spiegazione è arrivata successivamente da Facebook.
Janardhan ha confermato di inconvenienti riscontrati anche con strumenti interni di Facebook, complicando gli sforzi per diagnosticare e risolvere i problemi. Il New York Times ha riferito che gli ingegneri che si occupano della sicurezza non riuscivano ad accedere fisicamente all’azienda perché i badge di controllo per accedere in sede non funzionavano (anche questi sfruttano vari servizi collegati ai server aziendali).
Something has also disappeared here at Roma #IXP. pic.twitter.com/CLkZdjSkZL
— Flavio Luciani (@flavioluciani81) October 4, 2021
Al termine di una brutta giornata per l’azienda, Instagram, Facebook e Whatsapp son ritornati a funzionare normalmente. Impressionante dalle prime analisi il grande vuoto lasciato sul traffico internet complessivo a livello mondiale, come se un enorme pezzo di internet fossse stato all’improvviso scollegato e scomparso.