Cloudflare Just Took Down the Internet—And It Wasn’t Even a Hack. How Did We Let This Happen?
Cloudflare vừa làm sập cả Internet — mà chẳng cần bị tấn công. Chúng ta đã để chuyện này xảy ra như thế nào?

Để tôi tóm lại: toàn bộ Internet rung lắc chỉ vì ai đó chỉnh quyền truy cập cơ sở dữ liệu, khiến một file tự nhiên phình to gấp đôi? Không phải DDoS, không phải tấn công nhà nước — chỉ là một file cấu hình 'nổi điên'. Hệ thống proxy chính không chịu nổi, hoảng loạn, và bắt đầu ném lỗi 5xx như đang chơi trò đánh chui để bắt chuột.
Điều điên rồ là ban đầu họ tưởng bị tấn công DDoS cực lớn. Đến cả trang trạng thái cũng sập — dù host ngoài hệ thống! Điều tréo ngoe? Chính công cụ gỡ lỗi — vốn để cứu chữa — lại làm tình hình tệ hơn khi 'ăn' hết CPU. Vậy là không chỉ file gây sập, mà cả lớp an toàn cũng tự bốc cháy luôn.
Việc cấp phát bộ nhớ trước là để ngăn sự cố, chứ không phải để gây sập. Nếu hệ thống của bạn không thể xử lý file cấu hình vượt giới hạn mà không sập hoàn toàn, thì đây không phải lỗi vận hành — mà là lỗi thiết kế.
Thay đổi quyền truy cập cơ sở dữ liệu mà không kiểm thử tác động lên các truy vấn phụ thuộc? Trong hệ thống xử lý lưu lượng toàn cầu? Nghe như ai đó đã bỏ qua bước 'đánh giá tác động'.
Đúng vậy. Phần tồi tệ nhất? Đây thậm chí còn không phải lỗi từ bên ngoài. Mà là logic nội bộ cứ mặc định cấu trúc phản hồi truy vấn sẽ không bao giờ thay đổi. Đó không phải kỹ thuật — mà là làm theo kiểu bắt chước.
Các bạn đang lo sốt vó về giới hạn bộ nhớ và truy vấn, trong khi tôi ở đây với cái máy $5 trên DigitalOcean, chỉ biết cầu cho đừng hư. Nhắc nhở về khoảng cách thực tế.
Một ngày nữa trôi qua, lại một sự cố do thiết kế quá mức. Chúng ta đã tạo ra hệ thống phức tạp đến mức một truy vấn 5 phút có thể làm sập Internet. Chúng ta không cần thêm tính năng. Chúng ta cần mã đơn giản và cơ chế dự phòng mạnh mẽ.
Ít ra họ cũng nhận lỗi nhanh và minh bạch. Hơn nhiều công ty khác rồi. Coi như tiến bộ chứ?
Đúng vậy. Việc đổ lỗi thì vô ích. Nhưng sửa quy trình thì có ích. Tôi hy vọng họ sẽ bắt buộc xác thực cấu trúc cho mọi đầu vào file cấu hình — đối xử như dữ liệu người dùng, vì chúng có thể phá hệ thống không kém gì dữ liệu xấu.
Nhìn này, họ giúp Internet nhanh hơn, an toàn hơn, và dùng miễn phí. Một lần sập vài năm? Vẫn tốt hơn 99% ngành công nghệ. Thư giãn đi.