Did Moore Threads Just Crack the Domestic GPU Curse? AI Laptop, 10K-GPU Cluster, and a Full-Stack Revolution
Moore Threads vient-il de briser la malédiction des GPU domestiques ? Ordinateur portable IA, cluster 10 000-GPU et révolution full-stack

Moore Threads ne se contente pas de lancer un nouveau GPU : ils tentent une prise de contrôle verticale de toute la stack IA. L’architecture Huagang promet un gain de 10 fois en efficacité énergétique et le support complet du FP4 au FP64, ce qui paraît impressionnant… jusqu’à ce qu’on se souvienne combien de ‘percées’ finissent par capoter en conditions réelles.
Puis vient le MTT AIBOOK — oui, un ordinateur portable — à 9 999 yuans, équipé de leur SoC maison 'Changjiang'. Ce n’est pas qu’un gadget : c’est un cheval de Troie pour les développeurs. Ajoutez-y un cluster de 10 000 GPU atteignant 60 % de MFU sur les modèles denses, et on commence à se demander : construisent-ils la réponse chinoise à NVIDIA… ou seulement un PowerPoint très coûteux ?
Soyons honnêtes : le contrôle full-stack sonne bien sur papier, mais CUDA ne se bat pas avec des spécifications techniques. Le vrai fossé, c’est la maturité logicielle. MUSA 5.0 peut-il vraiment offrir 98 % d’efficacité GEMM tout en gardant de la flexibilité ? Je ne le croirai que quand je le verrai dans un vrai laboratoire HPC.
Enfin ! Ils ouvrent en open source les bibliothèques clés d’accélération et de communication ? C’est là qu’est la stratégie. Le verrouillage est l’ennemi de l’innovation. S’ils laissent les développeurs bidouiller librement la stack, cela pourrait vraiment déclencher une renaissance populaire de l’IA en Chine.
60 % de MFU sur un cluster de 10 000 GPU ? Ce n’est pas juste bon — c’est exceptionnel. La plupart des hyperscalers ont du mal à atteindre 30 %. S’ils parviennent à industrialiser cela, Moore Threads ne vise pas les bureaux. Ils visent le data center.
Un Prefill à 4 000 tokens/s sur un modèle de 671B ? Ce n’est pas de l’ingénierie — c’est de la sorcellerie. La vraie question est : peuvent-ils maintenir cela avec MUSA 5.0 sur des modèles variés, ou s’agit-il d’un tour de passe-passe sur mesure ?
On dirait AMD en 2003 — architecture audacieuse, positionnement agressif, mais peuvent-ils éviter les pièges d’intégration ? Une seule erreur logicielle, et tout l’édifice s’effondre.
60 % de MFU ? Ce n’est pas de la sorcellerie — c’est ce qui arrive quand on conçoit la puce, le logiciel et le cluster comme un système unifié. Le but de l’intégration verticale, c’est d’éliminer les goulots d’étranglement. Arrêtez de les comparer à des scénarios avec des pilotes tiers imparfaits.
9 999 yuans pour un portable 'Changjiang' ? Mignon. Pendant ce temps, leur action a chuté de 30 % depuis son sommet. Ce n’est pas de l’innovation — c’est du théâtre pour petits investisseurs. Soyez honnêtes, les gars.
En tant que développeur qui a perdu des mois sur la courbe d’apprentissage de CUDA, je préfère une stack ouverte à 98 % d’efficacité N’IMPORTE QUEL JOUR. Ne dénigrez pas l’AIBOOK. Il n’est pas fait pour vous. Il est fait pour nous.