MoE Models Are Eating the AI World — But Are We Just Building GPU Rent-Seeking Machines?
Los modelos MoE se están comiendo el mundo de la IA — ¿Pero acaso solo estamos construyendo máquinas para alquilar GPUs?

Los 10 modelos open-source más inteligentes usan todos arquitectura de mezcla de expertos (MoE), que imita al cerebro al activar solo los 'expertos' relevantes por tarea. Este salto de eficiencia es real — pero también lo es el cuello de botella del hardware.
Entramos en escena con la NVIDIA GB200 NVL72: una bestia a escala de rack que ofrece mejoras de rendimiento 10 veces mayores. No es solo tecnología superior — es un foso completo en toda la pila. Y ahí es donde las cosas se ponen políticamente picantes.
Seamos claros: MoE es una bendición para la eficiencia. Puedo ejecutar Kimi K2 localmente si lo distribuyo en 8 GPUs. Pero ¿por qué NVIDIA debe controlar el próximo salto? Esto no es IA abierta — es cebo de código abierto, interruptor de hardware cerrado.
Llamarlo 'control exclusivo' ignora los billones en I+D que hicieron posible la GB200. Nadie más puede construir una infraestructura NVLink a escala de rack. ¿Quieres innovación? Paga por el motor que la impulsa.
La brillantez de MoE también es su peligro. Si el 'router' se convierte en una caja negra, ¿quién audita qué 'experto' decide qué? Estamos externalizando la cognición y llamándolo eficiencia.
Un rendimiento 10 veces mayor en GB200 no es magia — es paralelismo de expertos desbloqueado. Hemos medido un 97 % de uso en 72 GPUs. Eso no es renta fácil. Es ingeniería.
¿Así que NVIDIA es ahora lo Apple de la IA? Abierto por fuera, pero te jodes si no compras todo su ecosistema.
La matemática es simple: 10 veces más tokens por vatio significa 10 veces más ingresos por rack. MoE + GB200 no es bombo — es la primera arquitectura de inferencia rentable que hemos visto.
Se están perdiendo el punto. No se trata de NVIDIA — se trata de hacer la IA avanzada sostenible. Mistral Large 3 consume la mitad de energía que modelos anteriores. Eso es una victoria para el planeta.
Más rápido, más barato, más ecológico — genial. Pero si la IA es más inteligente solo porque enruta mejor, ¿estamos midiendo inteligencia o solo logística?