Is Nvidia's AI Chip Empire Finally Cracking? Amazon’s Trainium3 Just Went 4x Faster – Can the Rest of the World Keep Up?
엔비디아의 AI 칩 독점 체제가 드디어 흔들리고 있을까? 아마존의 Trainium3, 성능 4배로 '껑충' — 다른 회사들은 이제 따라올 수 있을까?

엔비디아는 수년간 AI 칩 시장에서 독보적인 위치를 지켜왔고, 스타트업부터 대기업까지 모두 CUDA와 Hopper GPU에 의존해왔죠. 하지만 이제 아마존이 도전장을 내밀었습니다. 선대모델보다 4배 빠르다는 Trainium3를 내세우며 실제 시장에서도 존재감을 보이고 있죠. 100만 개 이상의 칩이 배포되었고, 10만 개 이상의 기업이 사용 중이며, 연간 수십억 달러 규모의 매출을 기록하고 있습니다. 이것은 허풍이 아니라 실질적인 성과입니다.
핵심은 뭘까요? 아마존은 엔비디아를 정면에서 무너뜨리려는 것도 아닙니다. AWS 고객들을 위한 자체 칩이 더 잘 작동하는 별도의 레인을 만들고 있는 거죠. 게다가 Anthropic를 위해 50만 개 이상의 Trainium2 칩으로 구동되는 Project Rainier까지 운영하면서, 아마존은 '가격이 낮고 효율적이다'는 점이 순수한 성능 지배보다 더 낫다고 내기를 걸고 있습니다. 그런데 묘한 점은, Trainium4는 엔비디아 칩과도 함께 작동하도록 설계된다는 거예요. 이게 정상적인 경쟁일까요… 아니면 위장된 협력일까요?
이건 마치 90년대가 다시 온 느낌이에요. SPARC와 인텔의 전쟁 기억하시나요? 그때 SPARC는 더 우수한 아키텍처를 제공했지만, 인텔은 대량 생산과 생태계, x86 호환성으로 승리했죠. 지금의 엔비디아 CUDA는 당시의 x86과 같습니다. AI 워크로드를 Trainium으로 포팅하는 건 오라클 데이터베이스를 솔라리스로 옮기는 것과 같아요. 기술적으로 가능하지만, 꽤나 골치 아프죠. AWS가 진입 비용을 낮추는 것은 현명한 전략이에요.
지금도 AWS 청구서를 직접 보고 있는 사람으로서 — 정말 고맙습니다, 아마존. Trainium이 개발 시간을 크게 희생하지 않고 비용을 줄여준다면, 저는 눈 깜짝할 사이에 전환할 겁니다. 지금 이 순간에도 규모 기반으로 10%만 절감해도 수백만 달러에 달하니까요. 하지만 도구들이 제 PyTorch 스크립트를 다시 쓰라고 강요하지 않는다는 전제 하에 말이죠.
도구들이 바로 병목 지점이에요. CUDA는 단순한 소프트웨어가 아니에요. 15년 동안 쌓아온 라이브러리, 디버깅 도구, 커뮤니티의 노하우 그 자체죠. 이걸 옮기면 그 모든 걸 잃게 됩니다. 스타트업이라면 감수할 수 있겠지만, 우리에게는 말이죠? 저희 코드베이스는 너무 오래됐어요. AWS가 완전한 CUDA 호환 계층을 제공하지 않는 한 우리는 갇힌 셈입니다.
우리는 극한의 수직 계열화를 목격하고 있습니다. 아마존은 칩을 제작하고, 클라우드를 소유하며, Anthropic에 투자하고, 고객들을 자사 기술 스택으로 유도하고 있죠. 이것은 단순한 경쟁이 아니라, 생태계 내 고립을 유도하는 시도입니다. FTC는 지금 당장 주의 깊게 봐야 합니다.
다들 칩 이야기만 하고 있는데, 정작 '누가 이득을 보는가'를 묻는 사람은 없네요. 아마존이 더 저렴한 AI를 밀어붙이고 있는 건 맞아요. 하지만 이게 사회 전체의 비용을 낮추는 걸까요, 아니면 기업들이 더 많은 일자리를 자동화하게 되는 걸까요? 기술은 중립적이지 않습니다. 칩 하나를 결정하는 일에도 반드시 사람들의 삶에 대한 대가가 따릅니다.
들어보세요, 저는 언제나 독점보다 실질적인 경쟁을 선호합니다. 아마존이 AI 컴퓨팅 비용을 20% 줄인다면, 이건 전 산업에 걸쳐 수십억 달러의 비용 절감을 의미하니까요. 이게 바로 혁신입니다. 선택권이 늘어난다는 건 가격도 더 좋아진다는 뜻이에요. 미쳤다고 하시겠지만, 이건 스타트업과 소비자 모두에게 좋은 일입니다.