Translations:OpenACC Tutorial - Optimizing loops/20/fr

From Alliance Doc
Jump to navigation Jump to search

À la fin de la procédure, les renseignements suivants devraient être affichés : Fifth step of guided analysis Nous avons ici plusieurs renseignements importants :

  • le texte indique clairement que la performance est limitée par la taille des blocs, ce qui correspond à la taille des gangs en OpenACC;
  • la ligne Active Threads nous informe que le GPU exécute 512 fils sur les 2048 possibles;
  • la ligne Occupancy montre que le GPU est utilisé à 25% de sa capacité; il s'agit du ratio de l'utilisation réelle sur l'utilisation possible du GPU. Remarquez qu'une occupation à 100% ne donne pas nécessairement la meilleure performance, mais 25% est plutôt bas;