Cela ne vous a sans doute pas échappé : hier soir, Facebook, de même que Whatsapp, Instagram, Messenger et OculusVR, ont subi une panne mondiale majeure rendant l’ensemble de ces services inaccessibles pendant plusieurs heures. Il s’agit de la pire panne du groupe depuis mars 2019, où un incident similaire avait rendu la plateforme inaccessible pendant près de 24 heures. Si certains ont d’abord cru à un piratage d’ampleur — vraisemblablement en réaction aux récentes révélations de Frances Haugen, ex-employée de Facebook —, le réseau social évoque ce matin des problèmes purement techniques.
La panne a commencé juste avant midi sur la côte est américaine (vers 18h, heure de Paris) et a duré près de six heures. Impossible d’envoyer le moindre message sur WhatsApp, tandis qu’Instagram affichait un message d’erreur et que Facebook annonçait un dysfonctionnement. The Verge rapporte que des ingénieurs de Facebook ont été immédiatement envoyés dans les centres de données américains de l’entreprise pour tenter de résoudre le problème, preuve que la panne était loin d’être anodine.
Un test des serveurs DNS des FAI via DNSchecker.org a montré que la plupart d’entre eux avaient réussi à trouver un itinéraire vers Facebook.com à 17h30 (HE) et l’ensemble des services étaient accessibles quelques minutes plus tard — certains d’entre eux n’étaient toutefois pleinement fonctionnels qu’après quelques heures supplémentaires. Facebook a affirmé dans un communiqué que la panne de ses réseaux et messageries avait été causée par un « changement de configuration défectueux » de ses serveurs ; les responsables ont ajouté qu’aucune donnée utilisateur n’avait été compromise.
L’une des pannes les plus massives jamais détectées
Évidemment, étant donné le nombre de services qui reposent aujourd’hui sur cette plateforme, la moindre panne entraîne un effet boule de neige qui ne passe pas inaperçu. Celle d’hier soir, qui a touché plus de 14 millions d’utilisateurs, est l’une des pannes les plus massives jamais détectées par le site DownDetector. Selon eMarketer, la publicité numérique portée par Facebook représente plus de 48 milliards de dollars par an, il était donc urgent de remédier à la situation. « Nos équipes d’ingénieurs ont appris que les changements de configuration sur les routeurs backbone qui coordonnent le trafic réseau entre nos centres de données ont causé des problèmes qui ont interrompu cette communication », explique le groupe, sans plus de détails.
Cette panne est d’autant plus gênante qu’elle intervient alors que le groupe doit faire face aux accusations d’une ancienne employée, une lanceuse d’alerte qui reproche à l’entreprise de faire passer ses profits avant la sécurité des utilisateurs ; elle a notamment divulgué des documents confidentiels révélant certains agissements peu scrupuleux. Ainsi, beaucoup ont pensé immédiatement à une cyberattaque visant à déstabiliser le groupe. Mais Facebook s’en tient à une explication technique : « Nous voulons préciser à ce stade que nous pensons que la cause première de cette panne était un changement de configuration défectueux. Nous n’avons également aucune preuve que les données des utilisateurs ont été compromises à la suite de ce temps d’arrêt ».
Mark Zuckerberg a immédiatement publié des excuses sur son compte Twitter : « Désolé pour la perturbation aujourd’hui — je sais à quel point vous comptez sur nos services pour rester en contact avec les personnes qui vous sont chères ». Si la situation a mis à mal de nombreux utilisateurs dont l’activité (et les revenus) dépendent totalement de ces services, elle a en tout cas bénéficié à certaines plateformes rivales, telles que Signal qui s’est réjouie sur Twitter de la hausse des inscriptions pendant ces quelques heures de black-out. Et pendant ce même laps de temps, le SMS a fait son grand retour…
Des routes « rayées » de la carte suite à une mise à jour
La panne a également affecté tous les systèmes de communication et outils collaboratifs utilisés par les employés de Facebook eux-mêmes. Ils ne pouvaient plus recevoir d’e-mails externes, et même leurs badges d’accès aux locaux de l’entreprise ne fonctionnaient plus !
Les experts n’ont pas tardé à pointer du doigt les serveurs DNS (Domain Name System) et le BGP (Border Gateway Protocol) pour expliquer l’incident. BGP est un protocole de routage d’Internet, cela signifie qu’il fournit des instructions pour que le trafic passe d’une adresse IP à une autre aussi efficacement que possible — une adresse IP étant l’adresse réelle d’un site Web donné. Sans BGP, les routeurs Internet ne sauraient pas quoi faire et Internet ne fonctionnerait pas. En résumé, les serveurs DNS fournissent l’adresse IP, et BGP fournit le moyen le plus efficace d’atteindre cette adresse.
Hier, Facebook et ses services affiliés étaient tous en panne, comme s’ils avaient été soudainement supprimés d’Internet, expliquent les spécialistes de la société Cloudflare : « Leurs noms DNS ont cessé de se résoudre et leurs adresses IP d’infrastructure étaient inaccessibles. C’était comme si quelqu’un avait « tiré les câbles » de leurs centres de données d’un seul coup et les avait déconnectés d’Internet ». Bryan Krebs, journaliste spécialisé en cybersécurité, rapporte qu’une source issue de Facebook aurait expliqué l’incident par une « mise à jour BGP de routine ». Cette mise à jour aurait effacé les informations de routage DNS dont Facebook a besoin pour que d’autres réseaux parviennent à joindre ses différents services. Effectivement, le CTO de Cloudflare confirme avoir détecté plusieurs changements étranges au niveau du BGP juste avant que l’incident ne se déclare.
Détail amusant : Facebook ayant été brièvement rayé de la carte, un tiers a tenté d’inclure son nom de domaine comme étant à vendre chez plusieurs acteurs du secteur, tels que DomainTools et GoDaddy, qui ont inclus cette annonce par erreur dans leur listing ! Aujourd’hui, tout est rentré dans l’ordre. Mais suite à l’incident, le cours de Facebook, déjà en baisse hier en début de séance, a plongé de 5% à Wall Street, faisant perdre près de 6 milliards de dollars à Mark Zuckerberg.