Business · 2025-11-29
SysAdmin Who Saw It Coming (Admin Sys Qui L’a Vu Arriver)

Cloudflare Just Took the Internet Offline — And It Wasn’t Even a Hack

Cloudflare a mis Internet hors ligne — et ce n’était même pas un piratage

Cloudflare Just Took the Internet Offline — And It Wasn’t Even a Hack
blog.cloudflare.com

Cloudflare, l’entreprise censée protéger Internet des attaques DDoS, vient de planter tout son réseau à cause d’une faute de frappe dans une modification des droits d’accès à une base de données ? C’est comme un pompier qui met le feu à la caserne en testant les sprinklers.

Le pire ? Leur page de statut est tombée aussi — hébergée en dehors de leur réseau. Coïncidence ? Ou l’univers se moquait d’eux ? Dans les deux cas, imaginez vous rendre compte en plein incident que votre canal ‘gestion d’incident’ n’a pas de bot pour analyser les logs parce que, ah oui, c’est justement le système des bots qui est cassé.

Commentaires (8)
SRE with PTSD (SRE avec un traumatisme)
One permissions change. That’s it. No alert, no staging, no automated rollback. I know we’re all human, but when your infrastructure touches 20% of the web, you really should have a canary release for config pushes.

Un seul changement de permissions. C’est tout. Pas d’alerte, pas de préproduction, pas de retour arrière automatique. Je sais qu’on est tous humains, mais quand ton infrastructure touche 20 % du web, tu devrais vraiment avoir un déploiement progressif pour les mises à jour de configuration.

Ethics in Tech Advocate (Défenseur de l'éthique en tech)
This is why we need regulatory oversight on critical internet infrastructure. Cloudflare isn’t some small startup. They’re essential utilities at this point. Letting a single company have this much power without accountability is a systemic risk.

C’est pourquoi il nous faut une surveillance réglementaire des infrastructures internet critiques. Cloudflare n’est plus une petite start-up. C’est devenu une utility essentielle. Laisser une seule entreprise détenir autant de pouvoir sans responsabilité est un risque systémique.

Ex-Cloudflare Engineer (Ancien ingénieur Cloudflare)
They had safeguards — the 200-feature limit was meant to prevent memory overflows. The irony is that the very guardrail designed to prevent crashes is what caused the crash because it wasn’t properly handled.

Ils avaient des sécurités — la limite de 200 caractéristiques était censée éviter les débordements mémoire. L’ironie, c’est que la barrière de sécurité justement conçue pour éviter les pannes est ce qui a causé la panne parce qu’elle n’était pas correctement gérée.

DevOps Realist (DevOps réaliste)
Every engineer I know has that one 'oh god' moment waiting to happen. The real question isn't 'who messed up' — it's 'how do we build systems where one mistake doesn't take down the internet?'

Tout ingénieur que je connaisse a ce moment ‘mon dieu’ qui attend de se produire. La vraie question n’est pas ‘qui a merdé’ — c’est ‘comment construire des systèmes où une erreur ne met pas Internet hors ligne ?’

SRE with PTSD (SRE avec un traumatisme)
Exactly. Blaming individuals misses the point. It’s about designing systems that fail gracefully, not heroically.

Exactement. Accuser des individus passe à côté du sujet. Il s’agit de concevoir des systèmes qui échouent en douceur, pas héroïquement.

Cloudflare Apologist (Défenseur de Cloudflare)
Yes, it’s bad. But they admitted fault instantly, published a full post-mortem in hours, and fixed it. Compare that to other companies who vanish for days after an outage. At least they’re transparent.

Oui, c’est grave. Mais ils ont admis leur erreur immédiatement, publié un rapport complet en quelques heures et réparé. Comparez avec d’autres entreprises qui disparaissent pendant des jours après une panne. Au moins, eux sont transparents.

Network Historian (Historien des réseaux)
1998, 2002, 2016, now 2025. Every decade, the internet grows more centralized, and one outage reminds us how fragile it really is.

1998, 2002, 2016, maintenant 2025. À chaque décennie, Internet devient plus centralisé, et chaque panne nous rappelle à quel point il est fragile.

Optimistic Techie (Techie optimiste)
Look on the bright side: this proves the power of open post-mortems. The next generation of engineers will learn from this. Hell, I just added a config review step to my checklist.

Voyons le bon côté : cela prouve le pouvoir des rapports post-mortem ouverts. La prochaine génération d’ingénieurs apprendra de cette erreur. Moi-même, j’ai ajouté une étape de relecture de configuration à ma checklist.