Cedar/fr: Difference between revisions

Jump to navigation Jump to search
no edit summary
No edit summary
No edit summary
Line 83: Line 83:
La plupart des applications peuvent être exécutées sur les nœuds Broadwell et Skylake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez <code>--constraint=skylake</code> ou <code>--constraint=broadwell</code>; consultez [[Running_jobs/fr#Sélectionner_une_architecture_CPU|Sélectionner une architecture CPU]].
La plupart des applications peuvent être exécutées sur les nœuds Broadwell et Skylake et la différence en performance ne devrait pas être significative en comparaison des temps d'attente. Nous vous recommandons de ne pas spécifier le type de nœud pour vos tâches. Par contre, s'il est nécessaire de demander un type particulier, utilisez <code>--constraint=skylake</code> ou <code>--constraint=broadwell</code>; consultez [[Running_jobs/fr#Sélectionner_une_architecture_CPU|Sélectionner une architecture CPU]].


<div class="mw-translate-fuzzy">
==Performance==
==Performance==
Cedar a en théorie un total de 58&nbsp;416 cœurs CPU de calcul et 584 accélérateurs GPU. La performance théorique maximale en double précision est de 936 teraflops pour les CPU auxquels s'ajoutent 2744 teraflops pour les GPU, pour un total de 3.6 petaflops. Il y a 22 ilots de 32 nœuds complètement connectés par une interconnexion non-blocante (''Omni-Path fabric''), chacun avec un total de 1024 cœurs; chaque ilot devrait générer plus de 30 teraflops de performance double précision mesurée. Il y a un facteur de blocage de 2:1 entre les ilots de 1024 cœurs.
Cedar a en théorie un total de 58&nbsp;416 cœurs CPU de calcul et 584 accélérateurs GPU. La performance théorique maximale en double précision est de 936 teraflops pour les CPU auxquels s'ajoutent 2744 teraflops pour les GPU, pour un total de 3.6 petaflops. Il y a 22 ilots de 32 nœuds complètement connectés par une interconnexion non-blocante (''Omni-Path fabric''), chacun avec un total de 1024 cœurs; chaque ilot devrait générer plus de 30 teraflops de performance double précision mesurée. Il y a un facteur de blocage de 2:1 entre les ilots de 1024 cœurs. Les nœuds Skylake sont répartis sur 20 ilots non-blocants de 32 nœuds, chacun offrant 1536 cœurs.
</div>


<noinclude>
<noinclude>
</noinclude>
</noinclude>
rsnt_translations
53,464

edits

Navigation menu