L’hébergeur OVH victime d’une panne géante

09/11/2017

2 minutes de lecture

Jeudi noir pour OVH. L’hébergeur français a été confronté à plusieurs pannes, notamment électriques, qui ont rendu de nombreux sites Internet inaccessibles en Europe, dont ceux de Nexity, du centre Pompidou ou encore de Konbini. Deux incidents ont touché dans la matinée le site de Strasbourg, qui compte 3 centres de données en fonctionnement, et le site de Roubaix, qui regroupe 7 centres de données. Malgré le caractère simultané des deux événements, Octave Klaba, fondateur et CEO d’OVH a précisé sur Twitter que les deux incidents «n’ont rien à voir l’un avec l’autre». Au total, OVH compte actuellement 27 centres de données et prévoit d’atteindre la barre des 50 centres de données d’ici 2025, à raison d’un nouveau centre de données tous les quatre mois.

A Strasbourg, l’alimentation électrique s’est arrêtée à 7h15. De plus, les groupes électrogènes, qui devaient se déclencher pour palier la rupture d’alimentation, ne se sont pas mis en route. Sur Twitter, Octave Klaba a indiqué à midi que l’alimentation avait été rétablie et que les services étaient en cours de redémarrage. L’hébergeur estime que le délai de rétablissement de la connexion pour ses clients est compris entre 5 minutes et 3-4 heures.

Nous avons un souci d’alimentation de SBG1/SBG4. Les 2 arrivées électriques EDF sont down (!!) et les 2 chaines de groupes électrogènes se sont mis en défaut (!!!). L’ensemble de 4 arrivées elec n’alimentent plus la salle de routage. Nous sommes tous sur le problème.

— Octave Klaba (@olesovhcom) 9 novembre 2017

Deuxième incident d’ampleur en 2017

Cependant, comme un malheur n’arrive jamais seul, un second incident a touché le site de Roubaix à 8h15. OVH a ainsi subi une panne impactant le réseau optique, qui permet de transporter les données de ses clients entre la plupart de ses centres de données via des points d’interconnexion à Paris, Francfort, Amsterdam, Londres et Bruxelles. A cause de cet incident, la connexion entre le centre de données de Gravelines, le plus important d’OVH, et celui de Roubaix, où l’entreprise est basée, a notamment été rompue. D’autres liaisons entre Roubaix et d’autres centres de données ont également été perturbées. A midi, l’incident était clos, d’après Octave Klaba. «Avec le constructeur, nous cherchons l’origine du bug software et aussi comment ne plus subir ce genre d’incident critique», a-t-il précisé sur Twitter.

Malgré les efforts des équipes d’OVH pour relancer ses serveurs, cela n’a pas suffi aux yeux des internautes, qui ne se sont pas privés pour déverser leur colère sur Twitter. Le hashtag #OVHGATE est même en tête des tendances France sur le site de microblogging ce jeudi 9 novembre. De plus, il ne s’agit pas du premier incident d’ampleur pour OVH en 2017. En juin dernier, une succession de problèmes (fuite d’eau qui a entraîné l’arrêt des serveurs dans un de ses centres de données et dysfonctionnement du système d’alerte) avait déjà touché plus de 50 000 sites Internet.

À propos
Articles récents

LA REDACTION DE FW.MEDIA

Pour nous contacter, nous vous avons préparé un petit formulaire pour bien gérer votre demande et pouvoir l'adresser en toute confidentialité. Cliquez ici pour y accéder

Les derniers articles par LA REDACTION DE FW.MEDIA (tout voir)

Un commentaire

Michel dit :

09/11/2017 à 15h52

En attendant, le serveur que je loue chez eux est redevenu accessible au bout de deux heures, sans avoir été redémarré d’après le monitoring. Donc c’était bien juste les routeurs (connections vers l’extérieur) qui étaient éteint. Idem pour deux services que je paie chez des fournisseurs tiers, qui eux même hébergent chez OVH.

Pour en revenir au serveur dédié que je loue (gamme « Kimsufi »), il n’a plus été redémarré depuis plus de 430 jours, et j’ai eu 3 incidents (de 5 minutes aux deux heures d’ajd) dans la période. Je rappelle qu’OVH (comme la plupart des hébergeurs) annoncent une disponibilité de 99,9%, et quand on fait le calcul … le contrat est rempli. Alors les râleurs … chuuuuuuut. Tout ce qui est fabriqué par l’homme (et encore plus l’électronique) est susceptible de casser / tomber en panne. Dans le cas présent, la panne a été rapidement détectée, identifiée, solutionnée, et la communication a été claire. Rien à redire