web-dev-qa-db-fra.com

Blocage matériel entre plusieurs processeurs Ubuntu 16.04 (Xenial)

Je poursuis ce problème depuis environ 6 semaines, depuis que je suis passé à Xenial. Au départ, je pensais que c'était aléatoire, mais l'utilisation d'adaptateurs série USB a provoqué le problème. Peu importait qu'il s'agisse d'un port USB2 ou d'une carte d'extension PCI-E USB3. Cela entraînerait les messages suivants sur la console texte et/ou la console série (que j'avais activés sur un port série ob-board):

NMI watchdog: Watchdog detected hard LOCKUP on cpu 0
NMI watchdog: Watchdog detected hard LOCKUP on cpu 2
NMI watchdog: Watchdog detected hard LOCKUP on cpu 3
NMI watchdog: Watchdog detected hard LOCKUP on cpu 4
NMI watchdog: Watchdog detected hard LOCKUP on cpu 5
NMI watchdog: Watchdog detected hard LOCKUP on cpu 6
NMI watchdog: Watchdog detected hard LOCKUP on cpu 8
NMI watchdog: Watchdog detected hard LOCKUP on cpu 11

etc.

La machine dispose de 16 cœurs et tous se verrouillent rapidement, ce qui nécessite une réinitialisation.

J'utilisais le dernier noyau (linux-image-4.4.0-72-generic). J'ai essayé la version 4.8, mais j'ai été affecté par le bogue du MTU ( https://bugs.launchpad.net/ubuntu/+source/linux-hwe-Edge/+bug/167982 ). J'ai essayé 4.10, mais cela a une sorte de bogue KVM (je suis aussi en train d'exécuter quelques VM sur l'hôte).

J'ai essayé de remplacer la mémoire (même si la mémoire ECC), de remplacer la carte mère, de remplacer les cartes réseau, tout en vain. Je ne pouvais trouver personne d'autre signalant le blocage multiple du processeur non lié à un processus utilisateur spécifique, alors j'ai pensé que mon matériel était défectueux.

1
Terry Hardie

J'ai suivi les instructions pour créer mon propre noyau pour la version 4.8 ( https://wiki.ubuntu.com/Kernel/BuildYourOwnKernel ) et construire linux-image-4.8.0-53-generic. Cela a corrigé mes blocages, mes problèmes de MTU et pas de panique KVM. Depuis que j'ai perdu 6 semaines à résoudre ce problème, j'espère que quelqu'un d'autre le trouvera utile.

2
Terry Hardie