Cloudflare’s 2025 Meltdown: Was It a Hack or Just a Typo? The Internet Held Its Breath
O colapso do Cloudflare em 2025: foi um ataque ou só um erro de digitação? A internet prendeu a respiração

Então o Cloudflare ficou fora do ar por mais de cinco horas—porque uma consulta a banco de dados de repente retornou o dobro de linhas. Sem hackers, sem geopolítica, sem invasão alienígena—só alguém ajustando permissões e, poft: a internet começou a cuspir sangue. O sistema de Gerenciamento de Bots, que depende de um 'arquivo de características' para avaliar ameaças, travou quando esse arquivo dobrou de tamanho após uma consulta de metadados começar a incluir entradas duplicadas de um esquema diferente. De repente, todos os módulos que dependiam desse arquivo começaram a gerar erros 5xx como se fossem confetes.
Aqui está o mais irônico: depois de suspeitar brevemente de um ataque DDoS em larga escala—porque a página de status também caiu, embora por acaso—perceberam que era apenas uma consulta mal configurada. O 'interruptor de emergência' para esse tipo de desastre simplesmente não existia. E sim, o incidente todo durou das 11:20 até as 17:06, tornando-o a maior falha do Cloudflare desde 2019. Para uma empresa que literalmente vende confiabilidade, isso é o equivalente tecnológico de um extintor de incêndio cheio de gasolina.
Vamos ver se entendi: seu sistema de ingestão de arquivos de configuração não tinha validação de tamanho nem mecanismos de segurança? Em 2025? Para um módulo central de roteamento? Isso não é um 'bug', é um cheiro de arquitetura ruim. Vocês estão dizendo que o módulo trava porque o arquivo é grande demais? Isso é como um motor de carro explodir porque colocaram gasolina aditivada por engano. Nenhum disjuntor?
Isso é um exemplo clássico da 'normalização da imprudência'. Pequenos compromissos em protocolos de segurança—como assumir que uma consulta retornaria apenas colunas de um esquema—foram se arraigando com o tempo. Então uma mudança mínima expôs a podridão. Nós não falhamos por causa da complexidade. Falhamos porque esquecemos que confiança sem verificação é apenas otimismo com largura de banda.
E nem me façam começar com a página de status caindo. Não por causa da falha, mas por um erro de DNS não relacionado com o 'hospedeiro externo'? É como um abrigo antibombas inundar porque o construtor esqueceu de vedar a janela. A impressão é terrível.
História interessante. O site do meu cliente ficou fora do ar, os clientes dele não puderam pagar, e eu levei a culpa. Obrigado, Cloudflare. Pelo menos os memes foram bons.
Eu estava no canal do incidente. Primeiros 20 minutos: 'Isso é um DDoS.' Depois: 'Espere, nossa página de status está fora do ar, mas está hospedada em outro lugar?' Depois: 'Acontece que foi uma mudança de permissão?' Nunca vi uma sala de crise passar de pânico ao silêncio constrangido tão rápido.
Isso me deixa mais tranquilo sobre nossas próprias falhas. Se o Cloudflare pode travar por um arquivo de configuração, talvez nossos bugs não sejam tão ruins assim.
Respeito à equipe pela transparência total. Análise pós-incidente tão detalhada? Raro. A maioria das empresas se esconde atrás de 'problemas técnicos.' Mas a ausência de uma feature flag ou limite de tamanho de arquivo? Isso é falha de processo, não das pessoas.
Aliás, imagina se isso tivesse acontecido na Black Friday. A internet talvez precisasse de terapia.