web-dev-qa-db-fra.com

Redémarrage aléatoire du serveur Ubuntu 16.04

Mon serveur Ubuntu se redémarre de manière aléatoire. Au début, je soupçonnais des mises à jour automatiques, même si cela serait étrange lors d’une nouvelle installation du serveur. Je me suis assuré qu'il était désactivé.

Je ne trouve rien dans dmesg, syslog ou kern.log sur la cause.

Ce qui est vraiment bizarre, ce sont les entrées dans "dernier redémarrage"

reboot   system boot  4.4.0-21-generic Thu Apr 28 17:06   still running
reboot   system boot  4.4.0-21-generic Mon Apr 25 20:32   still running
reboot   system boot  4.4.0-21-generic Mon Apr 25 20:25 - 20:31  (00:05)
reboot   system boot  4.4.0-21-generic Sat Apr 23 20:40 - 20:31 (1+23:51)
reboot   system boot  4.4.0-21-generic Sat Apr 23 19:16 - 20:39  (01:23)

Selon cela, le démarrage précédent est toujours en cours d'exécution?

Uptime dit

 23:10:41 up  6:04,  1 user,  load average: 0,00, 0,01, 0,05

le serveur a donc redémarré.

Des idées?

6
chripede

Si le système ne plante pas, il est en train de redémarrer pour installer une mise à jour qui nécessite un redémarrage.

Les redémarrages automatiques sont contrôlés dans le fichier /etc/apt/apt.conf.d/50unattended-upgrades. La ligne qui la contrôle commence par Unattended-Upgrade::Automatic-Reboot et prend une valeur true ou false. Si vous n'autorisez pas les redémarrages automatiques, vous devez être averti qu'un redémarrage est requis lorsque vous vous connectez.

Outre les mises à niveau sans assistance, d'autres packages peuvent déclencher un redémarrage. Ils devraient tous invoquer apt à faire la mise à niveau. Vérifiez /var/log/apt/history.log pour voir si des mises à jour sont en cours avant le redémarrage.

Si les redémarrages se produisent à peu près au même moment, il se peut que quelque chose dans les crontabs soit à l'origine du redémarrage.

Si le système plante vraiment, le BIOS peut le redémarrer. Vous souhaiterez peut-être modifier le paramètre d'état de mise sous tension.

Les commandes

  1. dmesg - très utile si le système est toujours opérationnel

Des dossiers

  1. /var/log/syslog - Enregistreur à l'échelle du système, utilisez tail /var/log/syslog ou less /var/log/syslog
  2. /var/log/kern.log - Journal du noyau, comme ci-dessus
  3. /var/log/*

Vérifiez cat /proc/sys/kernel/panic, si sa valeur est 1, le serveur redémarre immédiatement en cas de panique. De mauvais pilotes/logiciels/logiciels peuvent provoquer une panique du noyau.

Si ce n'est pas la panique vérifier le dernier numéro de redémarrage, peut-être que la surchauffe est le problème.

last reboot
4
Valeriy Solovyov