Frequently Asked Questions/fr: Difference between revisions

Jump to navigation Jump to search
Created page with "Vous pourriez recevoir ce message d'erreur si l'ordonnanceur est surchargé (voir la page Exécuter des tâches). Nous tentons toujours d'augmenter la tol..."
(Created page with "==''sbatch: error: Batch job submission failed: Socket timed out on send/recv operation'' ==")
(Created page with "Vous pourriez recevoir ce message d'erreur si l'ordonnanceur est surchargé (voir la page Exécuter des tâches). Nous tentons toujours d'augmenter la tol...")
Line 37: Line 37:
==''sbatch: error: Batch job submission failed: Socket timed out on send/recv operation'' ==
==''sbatch: error: Batch job submission failed: Socket timed out on send/recv operation'' ==


You may see this message when the load on the [[Running jobs|Slurm]] manager or scheduler process is too high. We are working both to improve Slurm's tolerance of that and to identify and eliminate the sources of load spikes, but that is a long-term project. The best advice we have currently is to wait a minute or so. Then run <code>squeue -u $USER</code> and see if the job you were trying to submit appears: in some cases the error message is delivered even though the job was accepted by Slurm. If it doesn't appear, simply submit it again.
Vous pourriez recevoir ce message d'erreur si l'ordonnanceur est surchargé (voir la page [[Running jobs/fr|Exécuter des tâches]]). Nous tentons toujours d'augmenter la tolérance de Slurm à cet effet et d'éliminer les sources de surcharge ponctuelle, mais ceci est un projet de longue haleine. Notre recommandation est d'attendre environ une minute, puis d'utiliser <code>squeue -u $USER</code> pour voir si la tâche soumise paraît. Si la tâche n'est pas listée, soumettez-la à nouveau.
Notez que ce message survient dans certains cas même si Slurm a accepté la tâche.
rsnt_translations
53,464

edits

Navigation menu