DMLA a récemment publié un brevet pour répartir la charge du rendu sur plusieurs chiplets GPU. Une scène de jeu est divisée en blocs individuels et distribuée aux chiplets pour optimiser l’utilisation des shaders dans les jeux. Le regroupement de puces à deux niveaux est utilisé pour cela.

AMD publie un brevet pour l’application des puces GPU afin de créer une meilleure utilisation de la technologie de shader

Le nouveau brevet publié par AMD ouvre davantage de perspectives sur ce que la société prévoit de faire avec la technologie GPU et CPU de niveau supérieur dans les années à venir. Fin juin, cinquante-quatre demandes de brevet ont été révélées pour être envoyées pour publication. On ne sait pas lequel des plus de cinquante brevets publiés sera utilisé dans les plans d’AMD. Les applications discutées dans les brevets détaillent les approches de l’entreprise au cours des années suivantes.

Une application qui a été remarquée par un membre de la communauté @ ETI1120 sur le site Web OrdinateurBasenuméro de brevet US20220207827, traite des données d’image critiques en deux étapes pour transmettre efficacement les charges de rendu d’un GPU sur de nombreux chiplets. CPU l’a initialement appliqué à l’Office américain des brevets à la fin de l’année dernière.

Lorsque les données d’image sur un GPU sont tramées par des moyens standard, l’unité de shader, également connue sous le nom d’ALU, effectue la même tâche et attribue un nom de couleur à des pixels individuels. À leur tour, les polygones texturés trouvés au pixel spécifique dans une scène de jeu particulière sont mappés directement sur le pixel. Enfin, la tâche formulée conservera des principes atypiques et ne différera que par d’autres textures situées à des pixels différents. Cette méthode est appelée SIMD, ou Single Instruction – Multiple Data.

Pour la plupart des jeux actuels, l’ombrage n’est pas la seule tâche lancée par un GPU. Mais à la place, plusieurs éléments de post-traitement sont inclus après l’ombrage initial. Les actions que le GPU ajouterait, par exemple, seraient l’anticrénelage, l’ombrage et les occlusions de l’environnement de jeu. Cependant, le lancer de rayons se produit en tandem avec l’ombrage, créant une nouvelle méthode de calcul.

Lorsque l’on parle du GPU contrôlant les graphismes dans les jeux actuels, la charge créée par l’ordinateur est augmentée de façon exponentielle en milliers d’unités de calcul.

Dans les jeux sur GPU, cette charge de calcul évolue jusqu’à plusieurs milliers d’unités de calcul de manière assez idéale. Cela diffère des processeurs en ce sens que les applications doivent être spécifiquement écrites pour ajouter plus de cœurs. Le planificateur de CPU crée cette action, divisant le travail du GPU en tâches plus digestes traitées par les unités de calcul, également appelées binning. L’image du jeu est rendue puis divisée en blocs séparés contenant un nombre défini de pixels. Le bloc est calculé par une sous-unité du processeur graphique, où il est ensuite synchronisé et créé. Après cette action, les pixels en attente de calcul sont inclus dans un bloc jusqu’à ce que le sous-ensemble de la carte graphique soit finalement utilisé. Des considérations sont prises pour la puissance de calcul des shaders, la bande passante mémoire et les tailles de cache.

Source : AMD via ComputerBase

AMD explique dans le brevet que la division et la jonction exigent une connexion de données approfondie et complète entre tous les éléments du GPU, ce qui pose problème. Les liens de données non situés sur le die ont un niveau de latence élevé, ce qui ralentit le processus.

Les processeurs ont effectué cette transition vers les chiplets sans effort grâce à la possibilité d’envoyer la tâche sur plusieurs cœurs, ce qui la rend accessible aux chiplets. Les GPU n’offrent pas la même flexibilité, plaçant leur ordonnanceur comparable à un processeur dual-core d’introduction.

Source : AMD via ComputerBase

AMD reconnaît la nécessité et tente d’apporter des réponses à ces problèmes en modifiant le pipeline de rastérisation et en envoyant les tâches entre plusieurs chiplets GPU, similaires aux CPU. Cela nécessite une technologie de binning avancée, que la société introduit “binning à deux niveaux”, également connu sous le nom de “binning hybride”.

2-640-90ad82f9
1-640-ba183ee2

Dans l’hyper binning, la division est traitée en deux étapes distinctes au lieu d’être traitée directement en blocs pixel par pixel. La première étape consiste à calculer l’équation, en prenant un environnement 3D et en créant une image bidimensionnelle à partir de l’original. L’étape s’appelle l’ombrage des sommets et est terminée avant la rastérisation, et le processus est très minime sur le premier chiplet du GPU. Une fois terminée, la scène de jeu commence à être regroupée, se développant en bacs grossiers et se transformant en un seul chiplet GPU. Ensuite, les tâches de routine telles que la rastérisation et le post-traitement peuvent commencer.

9-312-37907b0e
7-312-3ba6f6ab

On ne sait pas quand AMD a l’intention de commencer à utiliser ce nouveau processus ou s’il sera approuvé. Cependant, cela nous donne un aperçu de l’avenir d’un traitement GPU plus efficace.

Sources d’actualité : OrdinateurBase, Brevets gratuits en ligne

Leave a Reply

Your email address will not be published.