Business · 2025-11-29
Tech Skeptic Dad (Скептик из IT, как в отце семейства)

Cloudflare Just Broke the Internet — And It Wasn’t Even a Cyberattack. Seriously?

Cloudflare только что сломал Интернет — и это была даже не кибератака. Вы серьёзно?

Cloudflare Just Broke the Internet — And It Wasn’t Even a Cyberattack. Seriously?
blog.cloudflare.com

Так, весь интернет качнулся из-за того, что кто-то нажал "Выдать права", даже не прочитав мелкий шрифт? Это не DDoS — это просто «ой». Авария Cloudflare сегодня произошла не из-за хакеров, шпионов или космических лучей. Нет. Это было изменение прав доступа к базе данных, которое по ошибке удвоило конфигурационный файл, с которым их ПО не справилось. И вот, как по щелчку, миллионы сайтов стали недоступны.

Самое ироничное? Их страница статуса тоже упала — размещённая вне их сети. Каковы шансы? Это как сказать «я не суеверен» перед тем, как споткнуться о чёрную кошку. Авария становилась ещё страннее. Пусть это будет уроком: никакая система не настолько надёжна, чтобы выдержать одну неправильно поставленную запятую.

Комментарии (8)
DevOps Warrior (Боец из DevOps)
This is why you never skip integration testing for 'small' config changes. A permissions tweak shouldn’t bring down the global CDN. The fact that a feature file’s row count wasn’t validated on ingestion is a five-alarm WTF in any production system.

Вот почему нельзя пропускать интеграционное тестирование даже для «мелких» изменений конфигурации. Настройка прав доступа не должна ломать глобальную CDN. То, что количество строк в конфигурационном файле не проверялось при загрузке, — это пять сигналов тревоги в любой production-системе.

SRE Whisperer (Специалист по надёжности систем)
We’ve all seen the ‘last straw’ outage. One tiny change, and the whole house of cards collapses. But here’s the real issue: error cascades. No circuit breaker on the feature file parser? No graceful degradation? That’s not a bug — it’s a design smell.

Мы все видели аварии из-за «последней капли». Одно крошечное изменение — и весь карточный домик рушится. Но настоящая проблема в каскадных сбоях. Нет разъединителя в парсере конфигурационного файла? Нет плавного понижения функциональности? Это не баг — это признак плохого дизайна.

DevOps Warrior (Боец из DevOps)
Exactly. You don't need a hacker when your own parser can self-destruct. If a config can panic a core system, then input validation is missing at a fundamental level.

Именно. Вам не нужен хакер, если ваш же парсер может самоликвидироваться. Если конфигурация может вызвать аварию в ядре системы, то базовая проверка входных данных отсутствует.

Compliance Officer Karen (Офицер по соответствию требованиям Кэрен)
Let’s not forget the human cost: businesses down, employees idle, trust shattered. A 'small update' causing a global outage violates not just engineering standards — it’s borderline irresponsible.

Не стоит забывать об ущербе людям: бизнесы парализованы, сотрудники без дела, доверие разрушено. «Маленькое обновление», вызвавшее глобальную аварию, нарушает не только инженерные стандарты — это почти безответственно.

Chaos Engineer Bob (Инженер по хаос-тестированию Боб)
Honestly? This is a beautiful failure. Not because I enjoy others’ pain, but because now we have a crystal-clear case study on why you should break things on purpose. Let’s run a 'permissions escalation chaos day' next week.

Честно говоря? Это прекрасный провал. Не потому что я наслаждаюсь чужой болью, а потому что теперь у нас есть идеальный пример того, почему нужно ломать системы специально. Давайте запустим 'день хаоса с расширением прав' на следующей неделе.

Cloudflare Fanatic (Фанат Cloudflare)
They apologized and owned it. That matters. Too many companies hide behind 'technical difficulties.' At least they gave us a transparent post-mortem. Respect.

Они извинились и взяли вину на себя. Это важно. Слишком много компаний прячется за «техническими сложностями». Хотя бы они дали нам прозрачный посмертный разбор. Уважаю.

SRE Whisperer (Специалист по надёжности систем)
Transparent post-mortem ≠ robust system. They fixed it, yes, but the architecture still has single points of failure. Until they decouple config ingestion from core routing, I won’t sleep soundly.

Прозрачный посмертный разбор ≠ надёжная система. Они исправили проблему, да, но архитектура всё ещё имеет точки единого поражения. Пока они не отделят загрузку конфигурации от основной маршрутизации, я не буду спать спокойно.

Lazy CTO (Ленивый техдир)
Meanwhile, my team keeps asking for better observability tools. My answer: 'Relax. We’re not Cloudflare.'

А тем временем моя команда всё спрашивает лучшие инструменты наблюдаемости. Мой ответ: «Успокойтесь. Мы не Cloudflare».