Is Nvidia’s AI Chip Empire Finally Showing Cracks? Amazon’s Trainium3 Just Went 4x Faster — Can CUDA Be Dethroned?
Đế chế chip AI của Nvidia cuối cùng cũng có vết nứt? Amazon vừa ra mắt Trainium3 nhanh gấp 4 lần — Liệu CUDA có thể bị lật đổ?

Amazon không đang cố giết Nvidia — mà đang xây dựng một vũ trụ song song nơi khách hàng AWS nhận được hiệu năng trên giá tốt hơn khi đào tạo AI, và Nvidia chỉ còn là một lựa chọn, chứ không còn là mặc định. Với Trainium3 đạt tốc độ nhanh gấp 4 lần với mức tiêu thụ điện thấp hơn, và hơn một triệu chip đã được triển khai, đây không phải là ‘sản phẩm trên giấy’. Đây là một cuộc tấn công toàn diện được gói gọn dưới lớp vỏ nâng cấp khiêm tốn.
Và hãy thành thật đi — khi Amazon nói ‘đang có đà tăng trưởng mạnh’ và ‘doanh thu tỷ đô’, ý họ là ‘chúng tôi đang in tiền’. Cộng thêm Dự án Rainier với 500.000 chip hỗ trợ Claude của Anthropic, và bạn sẽ nhận ra đây không chỉ là về chip. Đây là về một ‘rào chắn AI’: dữ liệu, mô hình, silicon và đám mây đều nằm dưới một mái nhà.
Ổn thôi, lại một con chip tùy chỉnh nữa. Nhưng hãy nói về CUDA. Phần lớn các mô hình AI được xây dựng, đào tạo và triển khai trên hệ sinh thái của Nvidia vì CUDA. Viết lại để chạy trên Trainium? Đó không chỉ là vấn đề kỹ thuật — mà là tự sát chính trị trong hầu hết các đội AI.
Chính xác. CUDA không chỉ là phần mềm — đó là sự phụ thuộc đã kéo dài 15 năm với hàng triệu dòng mã được tối ưu. Bạn nghĩ một con chip nhanh hơn trên lý thuyết có thể vượt qua quán tính đó ư? Giống như tung ra một đầu VHS tốt hơn vào năm 2005 vậy.
Với chúng tôi, chi phí là vấn đề sống còn. Nếu AWS cung cấp hiệu suất gấp 4 lần với một nửa giá, chúng tôi sẽ viết lại bất cứ thứ gì. Sự phụ thuộc vào CUDA bị thổi phồng — chúng tôi đâu phải đang huấn luyện ResNet-50; phần lớn các startup dùng các framework cấp cao mà thôi.
Mọi người đều tập trung vào tốc độ và lợi nhuận, nhưng còn sự tập trung quyền lực thì sao? AWS + Anthropic + Trainium = một vòng khép kín phát triển AI không chịu trách nhiệm trước ai. Điều đó đáng sợ hơn bất kỳ cuộc đua chip nào.
Chiến lược thật sự ở đây không phải là giành chiến thắng về chip — mà là hiện tượng hóa tính toán AI hiệu năng cao. Nếu AWS có thể làm cho việc đào tạo AI cấp cao trở nên rẻ và nhàm chán, họ sẽ thắng. Lợi nhuận của Nvidia được xây dựng từ sự khan hiếm. Lợi thế của Amazon? Quy mô và tích hợp.
Ồ tuyệt vời, giờ tôi phải học một nền tảng chip mới nữa. Vừa lúc tôi nghĩ cuộc đời mình đã không thể phấn khích hơn: lỗi kernel, xung đột driver, và mấy ‘tải trọng tối ưu’ lại bị lỗi vào thứ Ba.
Cạnh tranh là tốt. Nếu Amazon đẩy mạnh hiệu suất và giảm chi phí, tất cả chúng ta đều thắng. Ngay cả Nvidia cũng sẽ phải đổi mới nhiều hơn. Độc quyền không tạo nên hệ sinh thái lành mạnh — các đối thủ mới làm được điều đó.
Chúng tôi cam kết với AWS vì họ cam kết với chúng tôi. Dự án Rainier không chỉ là quảng cáo — hiện tại đã có 500.000 chip đang chạy Claude 3.5. Đây là hạ tầng thực sự, không phải PowerPoint.