NVIDIA's CUDA 13.1 Drops the Biggest Update in 20 Years — Is This the Death of Traditional GPU Coding?
NVIDIA представила обновление CUDA 13.1 — крупнейшее за 20 лет. Конец традиционному GPU-программированию?

NVIDIA только что представила CUDA 13.1, и честно говоря — это не просто ещё одно «небольшое ускорение». Они полностью пересмотрели, как пишутся ядра, и представили CUDA Tile, убрав необходимость возиться с SIMT, будто мы программируем в NumPy. Теперь среда выполнения предоставляет «зелёные контексты», что означает лучшее разделение ресурсов GPU для задач с жёсткими требованиями к задержкам. И да, руководство по CUDA полностью переписано — теперь они всерьёз хотят привлечь новичков.
Но подвох в том, что CUDA Tile пока работает только на GPU Blackwell. Так что, хоть идея будущих тайлов и вдохновляет, большинству из нас остаётся ждать. В это время кубЛЭС и кубСОЛВЕР уже дают прирост: особенно FP8 и эмуляция тензорных ядер. Это обновление для фанатиков или для практичных программистов? Решать вам.
Как человек, который десять лет выжимал максимум из SIMT, я чувствую двояко. CUDA Tile звучит как мечта для прототипирования, но абстракция всегда требует жертв. Сколько контроля мы реально теряем? Последнее, что нужно HPC, — это ещё один «лёгкий режим», который подводит в масштабах.
Ты слишком мелко мыслишь. Речь не о контроле, а о скорости. CUDA Tile позволяет исследователям ИИ писать сложные ядра за дни, а не месяцы. Если ты переживаешь о «потере контроля», ты, вероятно, никогда не сдавал рабочую модель вовремя.
«Зелёные контексты» — незаметный победитель. Возможность изолировать SM для инференса в реальном времени? Это меняет правила игры для устройств на периферии. Мы годами делали это через костыли MPS.
Ещё одна стратегия привязки. Python DSL? C++ «в следующей версии»? Похоже, NVIDIA снова пытается захватить весь стек. Где открытая альтернатива?
Патчинг на этапе компиляции в Compute Sanitizer? Наконец-то! Теперь можно ловить ошибки памяти без замедления в 50 раз. Для меня одна эта функция повышает продуктивность больше, чем весь стек Tile.
Переписали руководство? Отлично. Теперь мне надо всё переучивать, чтобы просто сохранить работу. Спасибо, NVIDIA.
Подождите — новое руководство правда дружелюбно к новичкам? Я пробовал CUDA в прошлом году и бросил после трёх страниц «предполагается, что вы всё знаете». Если это правда, я скачиваю его сегодня вечером.