web-dev-qa-db-fra.com

Comment enquêter sur la cause du blocage total?

Ma machine d'arche est parfois suspendue, ne répond soudainement pas de la souris ou du clavier. Le curseur est gelé. Ctrl-Alt-SackSP n'arrête pas x11 et Ctrl-Alt-del fait exactement rien. Les parcelles de la CPU, du réseau et de l'activité de disque dans Congy et Icewm arrêtent la mise à jour. Dans quelques minutes, le ventilateur s'allume. Le seul moyen de rendre l'ordinateur faire quoi que ce soit, c'est éteindre l'alimentation.

Lorsqu'il démarre, la température de la CPU montre 70 à 80 ° C. Avant le suspendre, je faisais habituellement une activité de faible intensité comme la navigation sur le Web autour de 50 ° C.

Les journaux ne montrent rien de spécial par rapport à un arrêt normal. Le vérificateur de mémoire fonctionne bien avec zéro défauts.

Comment puis-je enquêter pourquoi il a raccroché? Y a-t-il des informations supplémentaires que je peux trouver pour un indice? Y a-t-il quelque chose de moins drastique que la mise hors tension pour obtenir une sorte d'action, si seulement une coquille limitée ou simplement des bips, mais peut donner une idée?

La machine est une passerelle P6860 17 "Laptop (volumineuse mais puissante) et elle tourne la voûte 64 bits, à jour (à partir de mars 2011). J'avais une arcade pendant longtemps avec ce problème, passait à Ubuntu pendant environ une semaine puis retiré à une nouvelle installation d'arc. C'est quand les suspensions ont commencé.

MISE À JOUR: Oui, c'est sûr que c'est surchauffe. À une température, la souris et le clavier arrêtent de fonctionner, devenant parfois fonctionnels après plusieurs minutes de refroidissement. À une température plus élevée, les choses pires se produisent, comme le non-respect total, y compris l'ignorant SysRQ. Cette condition est sous peu suivie d'une éteinte soudaine. J'ai résolu le problème en achetant un nouvel ordinateur 8D

19
DarenW

La réponse de Frederik impliquant des décharges de SysRQ et de noyau de la magie fonctionnera si le noyau est toujours en marche et non à accrocher. Le noyau pourrait simplement être en boucle d'occupation pour une raison quelconque.

Le fait qu'il ne répond pas à Ctrl-Alt-Del me dit que ce n'est probablement pas le cas et que la machine se bloque fort. Cela signifie une défaillance matérielle, ou quelque chose de étroitement lié, comme un mauvais pilote.

Votre test de contrôle de la mémoire est bon, si vous le laissez courir assez longtemps. Vous devriez également essayer d'autres choses à essayer de souligner le système, comme - StressLinux . Les repères de longue date sont bons aussi.

Une autre chose à essayer est de démarrer le système avec un CD Ubuntu en direct et d'essayer d'utiliser le système comme normal. Si vous revenez temporairement à Ubuntu, comme cela ne cause pas le problème de se reproduire, il y a une bonne chance que ce ne soit pas réellement brisé, mais l'une des choses liées comme un mauvais pilote ou un noyau incorrectement configuré. Il est tout à fait possible qu'une distribution plus populaire comme Ubuntu puisse avoir une configuration de noyau plus stable que celle d'une arche, simplement en raison du plus grand nombre de machines, il a été essayé lors de la phase de test de la distribution.

7
Warren Young

En ce qui concerne le gel, il y a quelques options:

  • utilisation d'un port série Si votre boîte en a une pour obtenir la décharge en ajoutant console=ttyS0 Pour les options de démarrage, comme décrit ICI . Vous avez besoin d'une deuxième machine avec un port série et un câble de modem nul pour attraper le fichier de vidage.

  • utilisation de NetConsole pour obtenir le dépotoir sur le réseau, voir ici .

  • Utilisation de KEXEC/KDUMP de cette façon, vous obtenez une vidange locale, voir ici .

Concernant le problème de l'alimentation propre, je vous suggère d'utiliser la touche clé SYSRQ Magic pour "S'ync the Disques", vous allez-les, puis rejouez la boîte (les lettres sont les lettres ceux que vous devriez taper avec Alt-SysRQ.

EDIT: Si vous publiez les OOPS/TRACE sur le LKML, vous devez utiliser une version récente (de préférence la dernière) du noyau et aucun modules propriétaires.

11
Frederik Deweerdt