Frequently Asked Questions/fr: Difference between revisions

Jump to navigation Jump to search
Created page with "==Temps d’attente des tâches== Vous pouvez savoir pourquoi vos tâches ont le statut <tt>PD</tt> (''pending'' pour en attente), en exécutant la commande <tt>squeue -u <use..."
(Updating to match new version of source page)
Tags: Mobile edit Mobile web edit
(Created page with "==Temps d’attente des tâches== Vous pouvez savoir pourquoi vos tâches ont le statut <tt>PD</tt> (''pending'' pour en attente), en exécutant la commande <tt>squeue -u <use...")
Line 59: Line 59:
Notez que ce message survient dans certains cas même lorsque Slurm a accepté la tâche.
Notez que ce message survient dans certains cas même lorsque Slurm a accepté la tâche.


== Why are my jobs taking so long to start? ==
==Temps d’attente des tâches==
You can see the reason why your jobs are in the state <tt>PD</tt> (pending) int the column <tt>(REASON)</tt>, which will typically have the value <tt>Resources</tt> or <tt>Priority</tt>. In the former case, the cluster is simply very busy and you will have to be patient or perhaps consider where you might submit a job that asks for fewer resources (e.g. nodes, memory, time). In the latter case however, your job is waiting to start due to its lower priority. This is because you and other members of your research group have been over-consuming your just share of the cluster resources in the recent past, something you can track using the command <tt>sshare</tt> as explained in [[Job scheduling policies]]. The column <tt>LevelFS</tt> gives you information about your over- or under-consumption of cluster resources; when <tt>LevelFS</tt> is greater than unity you are consuming fewer resources than your just share, while if it is less than unity you are consuming more. The closer <tt>LevelFS</tt> becomes to zero, the more you are over-consuming resources and greater the degree to which your jobs will have their priority diminished. There is a memory effect to this calculation so the scheduler gradually forgets about any potential over- or under-consumption of resources from months past. Finally, note that this scheduler priority is unique to a specific cluster - your <tt>LevelFS</tt> on one cluster is independent of its value on another.
Vous pouvez savoir pourquoi vos tâches ont le statut <tt>PD</tt> (''pending'' pour en attente), en exécutant la commande <tt>squeue -u <username></tt>.
 
La colonne <tt>(REASON)</tt>, contient <tt>Resources</tt> ou <tt>Priority</tt>.
* <tt>Resources</tt> : la grappe est très occupée. Vous pouvez soit attendre, soit soumettre une tâche qui exige moins de ressources en termes de nœuds, mémoire ou temps d’exécution.
* <tt>Priority</tt> : la tâche est en attente en raison de sa basse priorité. Ceci survient lorsque vous et les autres membres du groupe de recherche avez utilisé plus que votre juste part des ressources récemment. Vous pouvez faire le suivi de votre utilisation des ressources avec la commande <tt>sshare</tt> (voir [[Job scheduling policy/fr|Politique d’ordonnancement des tâches]]).
 
La colonne <tt>LevelFS</tt> indique votre utilisation des ressources de la grappe.
* une valeur plus grande que un (1) indique que vous utilisez moins que votre juste part,
* une valeur plus petite que un (1) indique que vous consommez plus que votre juste part.
Plus la valeur est proche de zéro, plus vous sur-utilisez les ressources et plus vos tâches baissent en priorité. L’ordonnanceur «oublie» graduellement les sous-utilisations ou sur-utilisations potentielles des derniers mois. Notez également que la valeur de LevelFS est spécifique à la grappe en question.
rsnt_translations
53,464

edits

Navigation menu