Sapphire Rapids est un tournant critique pour Intel

Avec le lancement du 4e génération de processeurs Intel Xeon Scalable et la série Xeon CPU Max, qui portaient le nom de code Sapphire Rapids, Intel trace une nouvelle voie d’architecture de serveur pour l’avenir qui aura un impact significatif sur Intel et le reste de l’industrie. Le lancement comprend 52 nouveaux SKU de produits destinés à des charges de travail de serveur spécifiques, notamment l’intelligence artificielle (IA), la mise en réseau, les réseaux radio 5G (RAN), le chiffrement et la sécurité des données et le calcul haute performance (HPC). Intel y parvient grâce à diverses améliorations architecturales du processeur, à l’intégration de dix accélérateurs fonctionnels, à de nouvelles extensions d’instructions et, dans certains cas, à l’intégration de la mémoire à bande passante élevée (HBM). La société est même passée à l’utilisation d’une configuration chiplet (multi-die). Le résultat est une série de produits qui ont une apparence et des performances différentes de celles de tout autre produit Intel avant lui.

Le but de cet article est de mettre en évidence la raison du changement radical d’Intel dans la conception des processeurs de serveur et l’impact probable de ce changement. Le premier est le pourquoi. Le x86 est une architecture mature qu’Intel réinvente et fait évoluer depuis plus de quatre décennies. Il s’agit de l’architecture de calcul intensif la plus performante jamais produite, en partie en raison de sa nature polyvalente et de son large support industriel. Cependant, la nature de l’informatique, en particulier dans les centres de données, a changé. Non seulement les types de charges de travail différentes ont augmenté, mais de nombreuses charges de travail sont devenues plus spécifiques et définies, d’autant plus que la mise à l’échelle a entraîné des problèmes thermiques et d’alimentation. Ceci, combiné aux défis de la mise à l’échelle de la lithographie, l’un des facteurs influençant la loi de Moore, a entraîné de plus petites améliorations des performances d’une génération à l’autre.

Par conséquent, ces changements conduisent à une manière différente d’architecter les processeurs – pour inclure des accélérateurs matériels dédiés qui exécutent des fonctions spécifiques mieux et plus efficacement que le processeur à usage général, tout comme les avantages attribués aux accélérateurs externes tels que les GPU. Ironiquement, ce changement s’éloigne des références de performances SPECint qu’Intel vante depuis plusieurs décennies. Ces nouveaux processeurs ne remporteront aucun prix de performance SPECint, mais comme de nombreux professionnels de l’informatique l’indiqueront, SPECint n’est que la première étape dans l’évaluation du potentiel d’un nouveau processeur. Le test de performance ultime consiste à exécuter les charges de travail prévues, sur lesquelles Intel compte pour les futurs gains de conception. Selon Intel, les charges de travail prévues verront une amélioration de 50% à 1000% des performances.

Intel expédie apparemment certains de ces nouveaux produits Xeon à certains clients depuis plus d’un an et offre maintenant une disponibilité générale à l’ensemble du marché. L’une des raisons a été les problèmes de fabrication des produits. Certains des problèmes de fabrication d’Intel ont été très médiatisés. Cependant, un autre problème est probablement le logiciel. L’ajout d’accélérateurs entraîne une surcharge logicielle importante pour garantir une transition transparente vers la nouvelle architecture. Ce logiciel supplémentaire inclut la prise en charge par les systèmes d’exploitation et les applications critiques pour les applications prévues. Veuillez noter que cela n’a pas été confirmé ou démenti par Intel. Il ne s’agit que de pure spéculation de la part de TIRIAS Research, mais Intel a également annoncé plus de 400 modèles vérifiés dans le cadre de sa suite logicielle AI, ce qui représente un investissement important dans de nouveaux logiciels uniquement pour les charges de travail AI.

Un autre changement clé est le passage aux mises à niveau à la demande des processeurs. Cela permettra aux clients d’activer certaines fonctionnalités/accélérateurs ultérieurement ou uniquement en cas de besoin. On ne sait toujours pas comment cela sera reçu au niveau de l’achat du serveur, mais cela s’intègre parfaitement dans le modèle de service hyperscale où les clients paient pour le temps et les ressources nécessaires pour chaque charge de travail.

L’autre point clé est l’impact des nouveaux produits. Ces produits ont mis deux ans de plus à être commercialisés que prévu initialement. Cependant, j’appellerais ce “moment zen” d’Intel. Il y a plusieurs années, le principal concurrent d’Intel, AMD, est retourné à la planche à dessin pour développer une nouvelle architecture de serveur appelée Zen, qui a conduit aux processeurs de serveur Epyc, désormais très performants. AMD a fait un geste audacieux en incorporant des fonctionnalités architecturales de nombreux autres processeurs de serveur, y compris ceux employés par Intel comme le multithreading. De plus, la société a adopté une approche controversée en utilisant une architecture de puces multi-puces. Comme tout nouveau produit en silicone, toutes les fonctions ou caractéristiques de conception prévues n’ont pas été intégrées à la première génération. En fait, la deuxième génération a entraîné des changements de conception majeurs. La troisième génération qui est maintenant disponible et est une famille de processeurs de serveur hautement raffinés et très compétitifs. Un sous-produit positif du retard de produit d’Intel a été le développement d’une suite de validation étendue qui a fait ses preuves pour les charges de travail du monde réel.

Le 4e/ La génération Sapphire Rapids des processeurs Xeon Scalable et Xeon CPU Max représente un geste audacieux similaire d’Intel. Nous verrons probablement des changements importants dans l’architecture au cours des prochaines générations qui affineront et amélioreront encore les performances de la famille de produits. L’une pourrait consister à séparer les accélérateurs de la puce CPU pour offrir une flexibilité et une personnalisation accrues. Un autre peut être d’autres types d’accélérateurs pour d’autres charges de travail, y compris des accélérateurs personnalisés de clients ou 3rd des soirées. Mais quelles que soient les améliorations à venir, il s’agit d’une transition majeure pour Intel à bien des égards et qui changera la dynamique concurrentielle du marché d’une performance brute à une performance de charge de travail. Tirias Research estime qu’il s’agit d’un changement dans la bonne direction car il correspond à des changements dans l’architecture des serveurs et des centres de données qui comprendront d’autres architectures de traitement/accélérateur et une personnalisation supplémentaire pour augmenter l’efficacité des performances. Cela peut également avoir un impact sur la décision des clients d’acheter des solutions de cloud privé plutôt que de louer du temps sur des solutions de cloud public pour diverses charges de travail. Cependant, l’adoption d’une nouvelle architecture de processeur, en particulier dans les serveurs, prend généralement plusieurs années.

Leave a Comment