Running jobs/fr: Difference between revisions

Jump to navigation Jump to search
Created page with "=== Surveillance d'une tâche en cours === Il est possible de se connecter à un nœud sur lequel une tâche est en cours et d'y exécuter de nouveaux processus. Ceci est util..."
(Updating to match new version of source page)
(Created page with "=== Surveillance d'une tâche en cours === Il est possible de se connecter à un nœud sur lequel une tâche est en cours et d'y exécuter de nouveaux processus. Ceci est util...")
Line 214: Line 214:
  #SBATCH --mail-type=ALL
  #SBATCH --mail-type=ALL


=== Attaching to a running job ===
=== Surveillance d'une tâche en cours ===
It is possible to connect to the node running a job and execute new processes there. You might want to do this for troubleshooting or to monitor the progress of a job.
Il est possible de se connecter à un nœud sur lequel une tâche est en cours et d'y exécuter de nouveaux processus. Ceci est utile par exemple pour des opérations de dépannage ou pour suivre le déroulement d'une tâche.


Suppose you want to run the utility [https://developer.nvidia.com/nvidia-system-management-interface <code>nvidia-smi</code>] to monitor GPU usage on a node where you have a job running. The following command runs <code>watch</code> on the node assigned to the given job, which in turn runs <code>nvidia-smi</code> every 30 seconds, displaying the output on your terminal.
Suppose you want to run the utility [https://developer.nvidia.com/nvidia-system-management-interface <code>nvidia-smi</code>] to monitor GPU usage on a node where you have a job running. The following command runs <code>watch</code> on the node assigned to the given job, which in turn runs <code>nvidia-smi</code> every 30 seconds, displaying the output on your terminal.
rsnt_translations
53,109

edits

Navigation menu