Translations:OpenACC Tutorial - Optimizing loops/20/fr
Jump to navigation
Jump to search
À la fin de la procédure, les renseignements suivants devraient être affichés : Nous avons ici plusieurs renseignements importants :
- le texte indique clairement que la performance est limitée par la taille des blocs, ce qui correspond à la taille des gangs en OpenACC;
- la ligne Active Threads nous informe que le GPU exécute 512 fils sur les 2048 possibles;
- la ligne Occupancy montre que le GPU est utilisé à 25% de sa capacité; il s'agit du ratio de l'utilisation réelle sur l'utilisation possible du GPU. Remarquez qu'une occupation à 100% ne donne pas nécessairement la meilleure performance, mais 25% est plutôt bas;