NVIDIA Just Rewrote the Rules of GPU Programming—Is This the Death of Traditional CUDA?
NVIDIA vừa viết lại luật chơi lập trình GPU—phải chăng đây là hồi kết của CUDA truyền thống?

CUDA 13.1 của NVIDIA được gọi là bản cập nhật lớn nhất trong 20 năm, và thật lòng? Cảm giác như họ không chỉ phát triển CUDA nữa—mà đang xây dựng lại từ gốc. CUDA Tile là ngôi sao ở đây, ẩn các luồng cấp thấp trong những 'tile' tính toán cấp cao. Không còn phải quản lý từng luồng như một vị tướng căng thẳng; giờ bạn chỉ cần nói với trình biên dịch cần chạy phép toán nào trên từng khối dữ liệu, và phụt—nó tự lo phần còn lại.
Nhưng điểm mấu chốt là: cuộc cách mạng này chỉ chạy được trên GPU Blackwell. Vậy đây là tiến bộ cho tất cả, hay chỉ là lời hứa 'tương thích tương lai' cho những ai đủ tiền mua quái vật đời mới? Còn context xanh và phép tính xác định? Đó không chỉ là hiệu năng—mà là việc trao quyền kiểm soát và khả năng dự đoán cho lập trình viên. Cuối cùng thì cũng có.
Tôi đã dùng CUDA từ năm 2015. Cái này còn lớn hơn cả bước nhảy từ Fermi sang Turing. CUDA Tile không chỉ là thay đổi API—mà là thay đổi cách tư duy. Cuối cùng, tôi cũng có thể viết kernel theo cách não tôi nghĩ: theo từng khối dữ liệu, với các toán tử xác định trên đó. Việc nó tự động tối ưu cho tensor core và kiến trúc tương lai? Mơ ước thành hiện thực.
Tôi ủng hộ việc trừu tượng hóa, nhưng chẳng phải đây đang đánh đổi kiểm soát lấy sự tiện lợi? Khi nào tôi cần ép thêm 5% hiệu năng cuối cùng thì sao? Liệu tôi có bị loại ra ngoài vì trình biên dịch tile đã mặc định điều gì đó?
Thật lòng đi: họ đang xây khu vườn được rào kín cho Blackwell. 'Tương thích tương lai' chỉ là cách nói để ám chỉ 'ta sẽ loại bỏ phần còn lại sau.' Còn nhớ compute capability 3.5 không? À, tôi cũng không.
Đây là năm 2007 lặp lại—khoảnh khắc công bố CUDA. Điểm khác biệt? Hồi đó, chúng ta xây nền móng. Bây giờ, chúng ta đang chứng kiến lớp trừu tượng thực sự có thể mở rộng đầu tiên cho lập trình đa nền tảng. Lịch sử không lặp lại—mà đang tiến hóa.
Vậy bao giờ tôi mới có hỗ trợ tile trên con RTX 3080 của tôi? Hỏi giúp một người bạn.
Context xanh? Cuối cùng cũng có cách cách ly 'hàng xóm ồn ào' trong mô hình dùng chung GPU. Cái này có thể khiến GPU đám mây thực sự dùng được cho tải thời gian thực. NVIDIA đã lắng nghe chúng tôi.
Tuyệt, lại thêm một lớp trừu tượng do NVIDIA kiểm soát. Tiêu luôn cái gọi là chuẩn 'mở'. Nhớ hồi CUDA từng 'dân chủ hóa tính toán GPU' không? Giờ chỉ là AI nhanh hơn cho các đại gia công nghệ.