Is OpenAI's New Aardvark Agent the End of Human Security Researchers?
Phải chăng Aardvark của OpenAI là dấu chấm hết cho các chuyên gia bảo mật con người?

OpenAI vừa tung ra Aardvark - một AI được hỗ trợ bởi GPT-5 không chỉ ghi nhận lỗ hổng mà còn suy luận như một chuyên gia bảo mật thực thụ. Nó lập bản đồ kho mã nguồn, mô hình hóa mối đe dọa, xác minh khả năng khai thác trong môi trường thử nghiệm, và thậm chí tự đề xuất sửa lỗi qua Codex. Đây không còn là công cụ phân tích đơn thuần như thời xưa nữa.
Điểm thật sự đột phá? Nó giảm mạnh cảnh báo giả bằng cách kiểm tra lỗ hổng trong môi trường thực. Lập trình viên sẽ không còn tốn hàng giờ xử lý ‘lỗi bảo mật’ hóa ra không thể khai thác được. Và OpenAI đã tìm thấy các lỗ hổng thật sự có mã CVE trong phần mềm mã nguồn mở — chứng minh đây không phải là phần mềm hứa hẹn suông.
Hãy bình tĩnh đã. Một AI tự động ra quyết định trong mã nguồn quan trọng về bảo mật? Đó là trách nhiệm khổng lồ. Ai sẽ kiểm tra chính cái máy kiểm tra này? Nếu nó bỏ sót lỗ hổng zero-day hoặc sửa code khiến phần mềm sập thì sao? Chúng ta đang giao chuỗi cung ứng cho những mô hình xác suất vốn hay 'ảo tưởng'.
Là người thường xuyên bị báo động lúc 2 giờ sáng vì các cảnh báo CVE giả, tôi chọn AI ‘ảo tưởng’ hơn là mất ngủ bất tận. Ít nhất nó cố hiểu ngữ cảnh thay vì so sánh mẫu cho mọi lệnh 'strcpy'.
Quét bảo mật miễn phí bằng AI cho dự án mã nguồn mở? Cuối cùng cũng có. Chúng tôi luôn thiếu ngân sách và nhân lực. Nếu Aardvark phát hiện ra lỗ hổng thực sự, tôi sẽ đón chào nó bằng vòng tay rộng mở — dù cảm giác như Skynet đang giúp chúng tôi sống sót.
Đúng vậy. Bệnh dịch cảnh báo giả đã làm giảm năng suất lập trình viên suốt nhiều năm. Aardvark không chỉ giảm nhiễu mà còn đặt rủi ro vào ngữ cảnh. Chính điều đó biến bảo mật từ một ‘cảnh sát gác cổng’ thành một đối tác.
Nó 'xác định được 92%'? Hãy cho tôi xem toàn bộ phương pháp. Lần trước khi một AI tuyên bố như vậy, nó thất bại trước kỹ thuật ngụy trang tấn công. Hacker thật sự không chơi đẹp — họ ẩn mình, biến đổi và dùng thủ thuật lừa đảo. Aardvark có thể phát hiện một cuộc tấn công chuỗi cung ứng qua gói npm độc hại do người duy trì bị xâm nhập tải lên không?
Ngay cả khi nó bỏ sót một số cuộc tấn công mới lạ, tự động hóa 90% việc sàng lọc định kỳ sẽ giải phóng chúng tôi để tập trung vào các mối đe dọa APT thực sự. Aardvark sẽ không thay thế các chuyên gia săn tìm hàng đầu, nhưng có thể phổ cập hóa mức bảo mật nền tảng cho hàng ngàn đội nhỏ.
Điều này đặt ra câu hỏi lớn hơn: nếu AI có thể sửa phần mềm, nó có nên chịu trách nhiệm khi thất bại không? Liệu ta có thể kiện một cỗ máy? Chúng ta đang bước vào vùng pháp lý chưa từng có, nơi trách nhiệm bị mờ nhòa bởi sự tối tăm của thuật toán.