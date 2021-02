Une unité de traitement (CPU, GPU ou autre) et la RAM sont généralement des éléments séparés construits sur des puces séparées. Mais que faire s’ils faisaient partie de la même puce, tous mélangés ensemble? C’est exactement ce que Samsung a fait pour créer la première mémoire à bande passante élevée (HBM) au monde avec un matériel de traitement AI intégré appelé HBM-PIM (pour le traitement en mémoire).

Il a pris ses puces HBM2 Aquabolt et ajouté des unités de calcul programmables (PCU) entre les banques de mémoire. Ceux-ci sont relativement simples et fonctionnent sur des valeurs à virgule flottante 16 bits avec un jeu d’instructions limité – ils peuvent déplacer des données et effectuer des multiplications et des ajouts.







PCU mélangés aux banques de mémoire • Le PCU est un processeur FP16 très limité

Mais il existe de nombreuses PCU et elles se trouvent littéralement à côté des données sur lesquelles elles travaillent. Samsung a réussi à faire fonctionner les PCU à 300 MHz, ce qui correspond à une puissance de traitement de 1,2 TFLOPS par puce. Et il a conservé la même consommation d’énergie (par puce) tout en transférant les données à 2,4 Gbps par broche.

La consommation d’énergie par puce peut être la même, mais la consommation d’énergie globale du système diminue de 71%. En effet, un processeur typique aurait besoin de déplacer les données deux fois – lire l’entrée puis écrire le résultat. Avec HBM-PIM, les données ne vont vraiment nulle part.

Il ne s’agit pas seulement d’économiser de l’énergie, l’utilisation de PIM pour les tâches d’apprentissage automatique et d’inférence, les chercheurs ont vu les performances du système plus que doubler. C’est une situation gagnant-gagnant.

La conception HBM-PIM est rétrocompatible avec les puces HBM2 classiques, il n’est donc pas nécessaire de développer de nouveau matériel – le logiciel doit simplement indiquer au système PIM de passer du mode normal au mode de traitement en mémoire.

Il y a un problème avec cela et c’est que les PCU occupent de l’espace précédemment occupé par les banques de mémoire. Cela réduit la capacité totale de moitié – jusqu’à 4 gigabits. Samsung a décidé de diviser la différence et de combiner 4 puces PIM gigabit avec 8 matrices HBM2 régulières gigabit. En utilisant quatre de chaque, il a créé 6 piles de gigaoctets.

Il y a d’autres mauvaises nouvelles – il faudra un certain temps avant que HBM-PIM n’arrive dans le matériel grand public. Pour l’instant, Samsung a envoyé des puces à tester par des partenaires développant des accélérateurs d’intelligence artificielle et s’attend à ce que la conception soit validée d’ici juillet.

HBM-PIM sera présenté à la Conférence virtuelle internationale sur les circuits à semi-conducteurs cette semaine, nous pouvons donc nous attendre à plus de détails.

