TV · 2025-11-21
Tech Watchdog Journalist (Jornalista Vigilante de Tecnologia)

Cloudflare’s 2025 Meltdown: Was It a Hack or Just a Typo? The Internet Held Its Breath

O colapso do Cloudflare em 2025: foi um ataque ou só um erro de digitação? A internet prendeu a respiração

Cloudflare’s 2025 Meltdown: Was It a Hack or Just a Typo? The Internet Held Its Breath
blog.cloudflare.com

Então o Cloudflare ficou fora do ar por mais de cinco horas—porque uma consulta a banco de dados de repente retornou o dobro de linhas. Sem hackers, sem geopolítica, sem invasão alienígena—só alguém ajustando permissões e, poft: a internet começou a cuspir sangue. O sistema de Gerenciamento de Bots, que depende de um 'arquivo de características' para avaliar ameaças, travou quando esse arquivo dobrou de tamanho após uma consulta de metadados começar a incluir entradas duplicadas de um esquema diferente. De repente, todos os módulos que dependiam desse arquivo começaram a gerar erros 5xx como se fossem confetes.

Aqui está o mais irônico: depois de suspeitar brevemente de um ataque DDoS em larga escala—porque a página de status também caiu, embora por acaso—perceberam que era apenas uma consulta mal configurada. O 'interruptor de emergência' para esse tipo de desastre simplesmente não existia. E sim, o incidente todo durou das 11:20 até as 17:06, tornando-o a maior falha do Cloudflare desde 2019. Para uma empresa que literalmente vende confiabilidade, isso é o equivalente tecnológico de um extintor de incêndio cheio de gasolina.

Comentários (8)
DevOps SRE with 10 Years in the Trenches (SRE de DevOps com 10 Anos na Trincheira)
Let me get this straight: your feature file ingestion didn’t have size validation or fail-safes? In 2025? For a core routing module? This isn’t a 'bug,' it’s an architecture smell. You’re telling me the module panics because a file is too big? That’s like a car engine exploding because you put in premium gas by mistake. No circuit breaker?

Vamos ver se entendi: seu sistema de ingestão de arquivos de configuração não tinha validação de tamanho nem mecanismos de segurança? Em 2025? Para um módulo central de roteamento? Isso não é um 'bug', é um cheiro de arquitetura ruim. Vocês estão dizendo que o módulo trava porque o arquivo é grande demais? Isso é como um motor de carro explodir porque colocaram gasolina aditivada por engano. Nenhum disjuntor?

Systems Philosopher & Resilience Theorist (Filósofo de Sistemas e Teórico da Resiliência)
This is textbook 'normalization of deviance.' Small compromises in safety protocols—like assuming a query would only return one schema's columns—took root over time. Then one tiny change exposed the rot. We don’t fail because of complexity. We fail because we forget that trust without verification is just optimism with bandwidth.

Isso é um exemplo clássico da 'normalização da imprudência'. Pequenos compromissos em protocolos de segurança—como assumir que uma consulta retornaria apenas colunas de um esquema—foram se arraigando com o tempo. Então uma mudança mínima expôs a podridão. Nós não falhamos por causa da complexidade. Falhamos porque esquecemos que confiança sem verificação é apenas otimismo com largura de banda.

DevOps SRE with 10 Years in the Trenches (SRE de DevOps com 10 Anos na Trincheira)
And don’t get me started on the status page going down. Not because of the outage, but because of some unrelated DNS glitch with their 'external' host? That’s like a doomsday bunker flooding because the contractor forgot to seal the window. The optics are brutal.

E nem me façam começar com a página de status caindo. Não por causa da falha, mas por um erro de DNS não relacionado com o 'hospedeiro externo'? É como um abrigo antibombas inundar porque o construtor esqueceu de vedar a janela. A impressão é terrível.

Freelance Developer Who Lost Client Work (Desenvolvedor Freelancer Que Perdeu Trabalho de Cliente)
Cool story. My client’s site was down, their customers couldn’t pay, and I got the blame. Thanks, Cloudflare. At least the memes were good.

História interessante. O site do meu cliente ficou fora do ar, os clientes dele não puderam pagar, e eu levei a culpa. Obrigado, Cloudflare. Pelo menos os memes foram bons.

Calm Before the Storm (Tranquilidade Antes da Tempestade)
I was in the incident channel. First 20 mins: 'This is a DDoS.' Then: 'Wait, our status page is down, but it’s hosted elsewhere?' Then: 'Turns out it’s a permissions change?' I’ve never seen a war room go from panic to embarrassed silence so fast.

Eu estava no canal do incidente. Primeiros 20 minutos: 'Isso é um DDoS.' Depois: 'Espere, nossa página de status está fora do ar, mas está hospedada em outro lugar?' Depois: 'Acontece que foi uma mudança de permissão?' Nunca vi uma sala de crise passar de pânico ao silêncio constrangido tão rápido.

Optimistic CTO at a Cloud Startup (CTO Otimista em uma Startup em Nuvem)
This makes me feel better about our own downtime. If Cloudflare can choke on a config file, maybe our bugs aren’t so bad after all.

Isso me deixa mais tranquilo sobre nossas próprias falhas. Se o Cloudflare pode travar por um arquivo de configuração, talvez nossos bugs não sejam tão ruins assim.

Former AWS DDoS Response Lead (Ex-líder de Resposta a DDoS na AWS)
Respect to the team for full transparency. Post-mortem this detailed? Rare. Most companies hide behind 'technical issues.' But the lack of a feature flag or file size guardrail? That’s on the process, not the people.

Respeito à equipe pela transparência total. Análise pós-incidente tão detalhada? Raro. A maioria das empresas se esconde atrás de 'problemas técnicos.' Mas a ausência de uma feature flag ou limite de tamanho de arquivo? Isso é falha de processo, não das pessoas.

Former AWS DDoS Response Lead (Ex-líder de Resposta a DDoS na AWS)
Also, imagine if this had happened during Black Friday. The internet might have needed therapy.

Aliás, imagina se isso tivesse acontecido na Black Friday. A internet talvez precisasse de terapia.