Le mois dernier, la PDG d’AMD, Lisa Su, a déclaré lors d’un appel aux résultats que même si le MI300X sera disponible pour échantillonnage cet automne, il commencerait à être expédié en plus gros volumes l’année prochaine. Su a partagé plus de détails sur la puce lors de sa présentation mardi.

Bien qu’AMD n’ait pas divulgué de prix, cette décision pourrait exercer une pression sur les prix des GPU de Nvidia, tels que le H100, qui peut coûter 30 000 $ ou plus. La baisse des prix des GPU peut aider à réduire le coût élevé des applications d’IA génératives.

« Nous pensons à l’accélérateur d’IA du centre de données [market] passant de quelque chose comme 30 milliards de dollars cette année, à un taux de croissance annuel composé de plus de 50 %, à plus de 150 milliards de dollars en 2027 », a déclaré Su.

La PDG d’AMD, Lisa Su, a déclaré mardi aux investisseurs et aux analystes à San Francisco que l’IA était « l’opportunité de croissance à long terme la plus importante et la plus stratégique de l’entreprise ».

Si les puces AI d’AMD, qu’il appelle des « accélérateurs », sont adoptées par les développeurs et les fabricants de serveurs comme substituts des produits Nvidia, cela pourrait représenter un grand marché inexploité pour le fabricant de puces, qui est surtout connu pour ses processeurs informatiques traditionnels.

L’annonce d’AMD représente le défi le plus important pour Nvidia qui domine actuellement le marché des puces IA avec plus de 80 % de part de marché, selon les analystes.

DMLA a déclaré mardi que son GPU le plus avancé pour l’intelligence artificielle, le MI300X, commencera à être livré à certains clients plus tard cette année.

AMD a déclaré que sa nouvelle puce MI300X et son architecture CDNA étaient conçues pour les grands modèles de langage et d’autres modèles d’IA de pointe.

« Au centre de cela se trouvent les GPU. Les GPU permettent l’IA générative », a déclaré Su.

Le MI300X peut utiliser jusqu’à 192 Go de mémoire, ce qui signifie qu’il peut s’adapter à des modèles AI encore plus grands que les autres puces. Le rival de Nvidia, le H100, ne prend en charge que 120 Go de mémoire, par exemple.

Les grands modèles de langage pour les applications d’IA génératives utilisent beaucoup de mémoire car ils exécutent un nombre croissant de calculs. AMD a fait la démonstration du MI300x exécutant un modèle de 40 milliards de paramètres appelé Falcon. Le modèle GPT-3 d’OpenAI compte 175 milliards de paramètres.

« La taille des modèles est de plus en plus grande et vous avez en fait besoin de plusieurs GPU pour exécuter les derniers grands modèles de langage », a déclaré Su, notant qu’avec la mémoire supplémentaire sur les puces AMD, les développeurs n’auraient pas besoin d’autant de GPU.

AMD a également annoncé qu’il proposerait une architecture Infinity combinant huit de ses accélérateurs M1300X dans un seul système. Nvidia et Google ont développé des systèmes similaires qui combinent huit GPU ou plus dans un seul boîtier pour les applications d’IA.

L’une des raisons pour lesquelles les développeurs d’intelligence artificielle ont toujours préféré les puces Nvidia est qu’elles disposent d’un progiciel bien développé appelé CUDA qui leur permet d’accéder aux principales fonctionnalités matérielles de la puce.

AMD a déclaré mardi avoir son propre logiciel pour ses puces AI qu’il appelle ROCm.

« Maintenant, bien qu’il s’agisse d’un voyage, nous avons fait de très grands progrès dans la construction d’une pile logicielle puissante qui fonctionne avec l’écosystème ouvert de modèles, de bibliothèques, de cadres et d’outils », a déclaré le président d’AMD, Victor Peng.