Tech

Bienvenue à nouveau L’Intel Xeon 6900P réaffirme le leadership d’Intel dans le domaine des serveurs

Cache pour Intel Xeon 6900P
Cache pour Intel Xeon 6900P

Bienvenue à Intel ! Intel Xeon est à la traîne d’AMD EPYC en termes de nombre de cœurs P depuis environ sept ans. Il y a cinq ans, AMD a pris une longueur d’avance avec la série AMD EPYC 7002 « Rome » et n’a jamais regardé en arrière en termes de calcul brut. C’est la première fois depuis 86 mois qu’Intel dispose à nouveau d’un processeur x86 de serveur de premier plan. La série Intel Xeon 6 avec cœurs P, plus justement appelée série Intel Xeon 6900P, apporte 128 cœurs, 12 canaux de mémoire, des accélérateurs, une nouvelle technologie de processus et bien plus encore à Intel Xeon.

Bien sûr, il se passe beaucoup de choses ici, alors allons-y.

Version vidéo – À venir

Nous n’avons eu que très peu de temps pour le faire. La semaine dernière, nous étions chez Intel dans l’Oregon pour en savoir plus sur les nouvelles puces, mais nous sommes allés ensuite filmer ce qui sera notre plus grande vidéo de l’année juste après. Notre système de préproduction « Granite Rapids-AP » est arrivé et nous avons eu le week-end pour travailler dessus, ce qui a été un défi lorsque certains tests ont pris plus d’une journée pour être exécutés via des scripts de test sur le système à 512 threads.

Intel nous a néanmoins fourni un système de développement de pré-production à utiliser avec ses puces haut de gamme. Il faut dire que ce système est sponsorisé par Intel. Pour certaines des données de puissance que nous souhaitons généralement publier lors d’un article de sortie comme celui-ci, nous allons attendre un système OEM avec des courbes de ventilateur plus réalistes. La plate-forme Intel était un peu brute sur les bords. C’est-à-dire que nous allons en dire plus sur cette histoire. Nous aurons également une vidéo, mais elle sera mise en ligne un peu plus tard dans la journée. Lorsqu’elle sera en ligne, nous intégrerons la vidéo.

Allons-y.

Quand un Xeon n’est pas seulement un Xeon, mais un XEON

Il est essentiel de comprendre que le Xeon 6 est une sorte de déploiement lent ultime. Aujourd’hui, nous avons la série Intel Xeon 6900P, la partie haut de gamme avec 128 P-cores. Il y a quelques mois, nous avons testé la série Intel Xeon 6700E « Sierra Forest », qui dispose de 144 cœurs E et utilise un socket différent et a la moitié du TDP. Les deux sont des processeurs Intel Xeon 6, mais ils sont très différents. La famille Xeon 6 couvre donc un large champ d’application, mais pas nécessairement dans le même produit.

Lancement de la famille Xeon 6 d'Intel Xeon 6 Granite Rapids AP
Lancement de la famille Xeon 6 d’Intel Xeon 6 Granite Rapids AP

Pendant des années, lorsque nous évoquions une génération de processeurs Intel Xeon, il s’agissait du même socket et de la même architecture de cœur, tant que nous ignorions les abréviations telles que les LGA1356 Sandy Bridge-EN et Ivy Bridge-EN. Aujourd’hui, nous avons en fait une matrice 2×2 de cœurs E et de cœurs P. Le lancement d’aujourd’hui est celui de la plateforme P-core à 12 canaux.

Plan de déploiement du processeur Intel Xeon 6
Plan de déploiement du processeur Intel Xeon 6

Il est important de noter qu’il ne s’agit pas du lancement de 288 cœurs « Sierra Forest-AP » à nombre élevé de cœurs pour les charges de travail natives du cloud évolutives. L’Intel Xeon 6900P « Granite Rapids-AP » est le gros Xeon à double socket d’Intel pour le calcul haute performance. Nous obtenons 12 canaux de mémoire DDR5-6400 ou 8800MT/s MRDIMM/MCR DIMM (plus d’informations à ce sujet dans un instant), ce qui permet à Intel d’égaler les canaux de mémoire d’AMD et de dépasser la bande passante mémoire d’AMD. 128 cœurs P complets, c’est plus que ce qu’AMD propose actuellement (96 avec Genoa puisque Bergamo est le cœur de cache inférieur). Il y a 96 voies PCIe Gen5 par CPU pour un total de 192 voies, et il y a la prise en charge de CXL 2.0, tout en permettant 6 voies UPI complètes pour la bande passante socket à socket. Le cache L3 n’est plus un « AMD a bien plus » sur ses composants grand public (non Genoa-X) maintenant que l’Intel Xeon 6980P dispose de 504 Mo de cache L3.

Présentation du lancement de l'Intel Xeon 6 Granite Rapids AP 1
Présentation du lancement de l’Intel Xeon 6 Granite Rapids AP 1

Bien que nous nous concentrions beaucoup sur les références haut de gamme, de nombreuses entreprises achètent des composants de milieu de gamme. C’est quelque chose qu’Intel va déployer à l’avenir dans ses conceptions de sockets plus petites. C’est important car Intel disposera de composants modernes pour ceux qui souhaitent 32 cœurs par socket, mais qui ne vont pas peupler 12 canaux de mémoire et dépenser beaucoup d’argent pour des cartes mères coûteuses capables de gérer des sockets plus grands.

Lancement de la série P Core du processeur Intel Xeon 6 Granite Rapids AP
Lancement de la série P Core du processeur Intel Xeon 6 Granite Rapids AP

Étant donné qu’Intel dispose d’un autre socket et d’autres familles de processeurs, la série Xeon 6900P ne comprend que cinq références publiques allant de 72 à 128 cœurs. Seule la partie à 128 cœurs n’est pas un nombre total de cœurs divisible par 3, nous nous attendons donc à ce que les hyperscalers et autres aient des références personnalisées basées sur la partie à 120 cœurs (Intel Xeon 6979P), mais Intel possède la référence à 128 cœurs. Il convient également de noter que quatre des cinq présentent un TDP de 500 W, ce qui est une nouveauté pour les processeurs.

Références de lancement du processeur Intel Xeon 6 Granite Rapids AP
Références de lancement du processeur Intel Xeon 6 Granite Rapids AP

Un autre élément intéressant est l’Intel Xeon 6960P avec 72 cœurs, le même que la partie CPU d’un processeur NVIDIA Grace Hopper. Intel utilise SMT, il s’agit donc techniquement d’une partie 72 cœurs/144 threads, mais cela donne également à Intel environ 6 Mo de cache L3 par cœur et des vitesses d’horloge plus élevées. Pour les serveurs IA, Intel a remporté des sockets même sans ces nouveaux processeurs monstrueux, et nous verrons pourquoi plus tard dans cet article.

Pack Intel Xeon 6900P
Pack Intel Xeon 6900P

Passons maintenant aux puces, voici la sortie lscpu de l’Intel Xeon 6980P, la partie 128 cœurs/256 threads de premier ordre dans une configuration à double socket. Comme vous pouvez le voir, nous avons plus de 1 Go de cache L3 dans le système et beaucoup de cœurs.

Sortie SMT du processeur Intel Xeon 6980P Lscpu sur 1 nœud NUMA par processeur
Sortie SMT du processeur Intel Xeon 6980P Lscpu sur 1 nœud NUMA par processeur ou mode HEX

Dans le même temps, nous nous attendons à ce que bon nombre de ces systèmes fonctionnent comme trois nœuds NUMA en raison de la manière dont le silicium est construit.

Sortie SMT du processeur Intel Xeon 6980P Lscpu sur 3 nœuds NUMA
Sortie SMT du processeur Intel Xeon 6980P Lscpu sur 3 nœuds NUMA SNC3

Intel conserve ses contrôleurs de mémoire sur la même matrice physique ou sur la même tuile de calcul que ses cœurs. Par conséquent, garder l’accès à la mémoire localisé sur ces tuiles peut améliorer les performances.

Modes de clustering de lancement du processeur Intel Xeon 6 Granite Rapids AP
Modes de clustering de lancement du processeur Intel Xeon 6 Granite Rapids AP

Cela donne également une topologie quelque peu bizarre puisque deux des nœuds NUMA SNC3 ont 43 cœurs et un en a 42. Intel a un SKU de 120 cœurs qui pourrait être plus populaire à la fois pour le rendement et pour des raisons d’équilibre. Néanmoins, il aurait été intéressant qu’Intel utilise une conception de 3x 43 tuiles pour créer un processeur à 129 cœurs juste comme SKU marketing pour dire qu’il a 129 cœurs, soit un de plus qu’AMD.

Topologie double Intel Xeon 6980P 3 nœuds NUMA par processeur
Topologie double Intel Xeon 6980P 3 nœuds NUMA par processeur

Vous pouvez facilement voir cette infrastructure en mosaïque en regardant les graphiques de latence de cœur à cœur. Même si cela semble illisible après avoir été compressé pour le Web, sachez simplement qu’il s’agit de la version 128 cœurs sans hyper-threading. La version à double socket 512 cœurs a pris une éternité à fonctionner, mais était encore plus un tableau de bord.

Latence du processeur Intel Xeon 6980P Core-2-Core
Latence du processeur Intel Xeon 6980P Core-2-Core

Le comportement ci-dessus peut s’expliquer par la conception d’Intel, qui place trois grandes tuiles de calcul sur une puce avec deux matrices d’E/S.

Présentation du SoC Intel Xeon 6 Granite Rapids AP
Présentation du SoC Intel Xeon 6 Granite Rapids AP

Ce qui permet à Intel de revenir dans l’orbite des composants haut de gamme d’AMD et d’être compétitif avec la prochaine génération de Turin d’AMD, c’est qu’il utilise une nouvelle technologie de processus. Intel 3 est utilisé pour la matrice de calcul qui dispose également de ses contrôleurs de mémoire et Intel 7 pour la matrice d’E/S avec les puces UPI, PCIe et les accélérateurs.

Tuiles de calcul et d'E/S pour le lancement du processeur Intel Xeon 6 Granite Rapids AP
Tuiles de calcul et d’E/S pour le lancement du processeur Intel Xeon 6 Granite Rapids AP

AMD a pris de l’avance en 2019 avec Rome, en partie grâce à la conception de puces et en partie parce que le 10 nm d’Intel a pris beaucoup de retard. Nous verrons davantage de ses puces maintenant que la technologie de processus d’Intel s’améliore rapidement. Intel relie désormais les puces à des boîtiers EMIB plus avancés, ce qui explique pourquoi ses tuiles semblent plus serrées tandis que les tuiles de calcul d’AMD ressemblent à leurs propres îles par rapport aux matrices d’E/S d’AMD.

Intel Xeon 6900P décapsulé
Intel Xeon 6900P décapsulé

Le changement d’approche d’Intel est néanmoins très notable dans cette génération. Au lieu de se concentrer uniquement sur les charges de travail accélérées par les accélérateurs intégrés de la société, Intel dispose désormais d’une puce monstrueuse capable de rivaliser avec AMD sur les performances brutes du processeur, mais qui dispose également de ses accélérateurs intégrés.

Cependant, l’une des fonctionnalités les plus importantes d’Intel est l’intégration de ces contrôleurs de mémoire dans les tuiles de calcul, puis l’offre d’options de mémoire très rapides, alors passons à cela ensuite.

Source link