in

Intel opte pour la mémoire à large bande passante avec ses processeurs Xeon Max et ses GPU

Il semble que le dernier plan d’Intel pour éloigner ses rivaux des charges de travail informatiques hautes performances implique un processeur avec de grandes piles de mémoire à large bande passante et de nouveaux types d’accélérateurs, ainsi que son GPU de centre de données tant attendu qui ira en tête-à-tête contre Les puces les plus puissantes de Nvidia.

Intel opte pour la mémoire à large bande passante avec ses processeurs Xeon Max et ses GPU

Le processeur Intel Xeon Max fait partie de la nouvelle image de marque de la société pour les produits HPC. Avec la série Max GPU, les nouveaux processeurs Xeon Max sont optimisés pour les déploiements HPC. Dans cette génération, il s’agit du produit précédemment connu sous le nom de « Sapphire Rapids HBM » combinant un processeur Xeon de nouvelle génération avec HBM intégré pour augmenter la bande passante mémoire pour les applications HPC.

Les processeurs Xeon Max
La série Xeon Max contiendra jusqu’à 56 cœurs de performance, basés sur les mêmes fonctionnalités de microarchitecture Golden Cove que les processeurs Intel Core de 12e génération, qui ont fait leurs débuts l’année dernière. Comme les puces vanille Sapphire Rapids à venir l’année prochaine, ces puces prendront en charge DDR5, PCIe 5.0 et Compute Express Link (CXL) 1.1, ce qui permettra à la mémoire d’être directement attachée au CPU via PCIe 5.0.

Xeon Max, qui est livré avec une puissance de conception thermique (TDP) de 350 W, est livré avec 20 accélérateurs intégrés pour l’intelligence artificielle et les charges de travail HPC. Ces types d’accélérateurs incluent Intel Advanced Vector Extensions 512 (AVX-512) et Intel Deep Learning Boost (DL Boost), Intel Data Streaming Accelerator (DSA) et Intel Advanced Matrix Extensions (AMX).

Avec AVX-512, Intel a affirmé qu’un système basé sur Xeon Max peut fournir le double des performances d’apprentissage en profondeur d’un système utilisant le processeur Epyc 7763 haut de gamme d’AMD, en utilisant le benchmark MLPerf DeepCAM. Mais avec AMX, la société a déclaré que le système Xeon Max peut fournir des performances 3,6 fois plus rapides. Comme d’habitude, nous devons prendre toutes les revendications de performance avec un grain de sel.

Contrairement à la vanille Sapphire Rapids, Xeon Max sera livré avec 64 Go de HBM2e, ce qui donnera au processeur environ 1 To/s de bande passante mémoire et plus de 1 Go par cœur.

Avec 64 Go de HBM2e, un serveur à double socket avec deux processeurs Xeon Max contiendra 128 Go au total. Ceci est important car vous pouvez utiliser le HBM comme mémoire système et, par conséquent, oublier de mettre des modules DRAM si vous êtes d’accord avec ce type de capacité.

McVeigh a déclaré que cette configuration, appelée mode HBM uniquement, peut aider les opérateurs de centres de données à économiser de l’argent ainsi que de l’énergie, et qu’il n’est pas nécessaire de modifier le code pour que le logiciel reconnaisse HBM.

Mais pour les opérateurs de centres de données qui souhaitent utiliser la mémoire DDR comme capacité supplémentaire ou comme mémoire système, il existe des options. En mode plat HBM, HBM et DDR agissent comme deux régions de mémoire, mais pour que le logiciel reconnaisse cela, des modifications de code sont nécessaires. En mode de mise en cache HBM, le HBM agit comme un cache pour le DDR ; cela ne nécessite aucune modification du code.

McVeigh a affirmé que HBM aide Xeon Max à fournir une amélioration majeure des performances par watt par rapport à l’Epyc 7773X axé sur HPC d’AMD, qui est livré avec 768 Mo de cache L3. Avec la mémoire DDR5 installée, Intel a déclaré qu’un système basé sur Xeon Max utilise 63 % d’énergie en moins que le système basé sur Epyc pour fournir le même niveau de performances pour le benchmark High-Performance Conjugate Gradients. Avec uniquement HBM, le système Xeon Max utilise 67 % d’énergie en moins, selon Intel.

Les GPU Xeon Max
Alors que la série Data Center GPU Max d’Intel n’a pas de nom de marque créatif comme Xeon, la société espère que l’accélérateur anciennement connu sous le nom de Ponte Vecchio rendra l’entreprise plus compétitive avec les GPU de centre de données de Nvidia, qui a une solide avance, et AMD, qui est rattraper.

Le fabricant de puces a appelé le GPU Max Series son «processeur à plus haute densité» en raison de la façon dont il intègre plus de 100 milliards de transistors dans un système sur boîtier comprenant 47 puces, appelées «tuiles» dans le jargon Intel. Ces tuiles sont réunies sur le boîtier à l’aide des technologies de conditionnement avancées d’Intel : pont d’interconnexion multi-puces intégré (EMIB) et Foveros.

Le GPU Max Series est livré avec jusqu’à 128 cœurs basés sur la microarchitecture Intel Xe HPC, une branche axée sur HPC de l’architecture GPU Xe du fabricant de puces. McVeigh a déclaré que cela permet à la configuration la plus puissante du GPU de fournir 52 téraflops de débit FP64 de pointe, une mesure clé pour HPC.

Le GPU est également livré avec jusqu’à 128 unités de traçage de rayons, qui sont adaptées aux logiciels de simulation traditionnels ainsi qu’aux applications de création de contenu numérique et de prévisualisation. Chaque GPU dispose de 16 ports Xe Link pour permettre à plusieurs GPU de communiquer directement entre eux.

Comme Xeon Max, le GPU Max Series est équipé de HBM2e, sauf que la capacité dans ce cas va jusqu’à 128 Go. Le GPU contient également beaucoup de cache, avec un maximum de 408 Mo de cache Rambo L2 (Rambo signifie « mémoire à accès aléatoire, bande passante optimisée ») et jusqu’à 64 Mo de cache L1.

45secondes est un nouveau média, n’hésitez pas à partager notre article sur les réseaux sociaux afin de nous donner un solide coup de pouce. 🙂