Sur un cluster SLURM, on peut utiliser squeue
pour obtenir des informations sur les travaux sur le système.
Je sais que "R" signifie r unning; et "PD" signifiant p fr d ing, mais qu'est-ce que "CG"?
Je comprends que c'est "annuler" ou "échouer" par expérience, mais "CG" s'applique-t-il lorsqu'un travail réussit c perd? Qu'est-ce que le G ?
"CG" signifie " c ompletin g " et il arrive à un travail qui ne peut pas être interrompu, probablement en raison d'une opération d'E/S.
Des informations plus détaillées dans le Guide de dépannage Slurm
J'ai trouvé cela dans la section 'squeue' du Guide de dépannage Slurm:
etat
État du travail, formulaire étendu: EN ATTENTE, EN COURS D'EXÉCUTION, ARRÊTÉ, SUSPENDU, ANNULÉ, TERMINÉ, TERMINÉ, CONFIGURATION, ÉCHEC, DÉLAI D'ATTENTE, PRÉEMPTE, NODE_FAIL, REVOKED et SPECIAL_EXIT. Voir la section CODES D'ÉTAT DU TRAVAIL ci-dessous pour plus d'informations. (Valable pour les travaux uniquement)
statecompact
État du travail, forme compacte: PD (en attente), R (en cours d'exécution), CA (annulé), CF (configuration), CG (terminé) , CD (terminé), F (échoué), TO (délai d'attente), NF (échec de nœud), RV (révoqué) et SE (état de sortie spécial). Voir la section CODES D'ÉTAT DU TRAVAIL ci-dessous pour plus d'informations (Valable pour les travaux uniquement)