web-dev-qa-db-fra.com

Le système se fige constamment avec Ryzen x1700 et Ubuntu 18.04

J'ai commandé un serveur dédié avec AMD Ryzen x1700, installé ici Ubuntu 18.04

Kernel is 4.15.0-29-generic

Il y a 2x500SSD et 1x4000HDD, ils sont montés et fonctionnent. RAM 64 Go.

root @ 159: ~ # fdisk -l

Disk /dev/sda: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0xf3b7577b

Device     Boot    Start        End   Sectors   Size Id Type
/dev/sda1           2048   67110911  67108864    32G 82 Linux swap / Solaris
/dev/sda2       67110912   68159487   1048576   512M 83 Linux
/dev/sda3       68159488 1000213167 932053680 444.4G 83 Linux


Disk /dev/sdb: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/sdc: 3.7 TiB, 4000787030016 bytes, 7814037168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes

root @ 159: ~ # free

              total        used        free      shared  buff/cache   available
Mem:       65985312     1111648    63810352       31760     1063312    64219256
Swap:      33554428           0    33554428

Le système se bloque tous les jours 1 à 3 fois de manière constante la semaine dernière. Rien de suspect dans syslog/dmesg. La dernière fois que cela se produit, connectez-vous à l'écran (heure précédente - rien): http://prntscr.com/kjd2wl Il suffit de geler et il devient inaccessible jusqu'au redémarrage brutal.

J'ai vérifié les disques durs via fsck -f, c'est bien.

Les températures de la CPU et des disques durs sont correctes, serveur sans charge. Je ne sais pas quoi vérifier d'autre. J'y ai déjà lu de nombreux sujets, mais rien de semblable chez moi, tous les sujets sont anciens ou pour les anciennes versions de kernel/ubuntu.

2
wtfowned

Problème résolu. J'ai commandé une vérification complète du matériel et l'hôte m'a envoyé une critique.

Cher client,

Malheureusement, votre serveur est tombé en panne pendant la vérification du matériel. Nous avons donc décidé de remplacer le serveur, mais de reconnecter les anciens disques.

Ensuite, nous avons vérifié vos disques et constaté que votre disque 4 TB est en panne et ne démarre plus. Veuillez donc confirmer la perte de données sur le lecteur.

Votre serveur est maintenant démarré dans le système de secours.

Je vais essayer de travailler avec du nouveau matériel, si le problème persiste, je vous le ferai savoir.

0
wtfowned

Après 2 jours de travail, le serveur a de nouveau gelé avec un nouveau disque dur. Maintenant, ils ont corrigé le BIOS et cela fonctionne 2 jours sans blocage. Gagner?

0
wtfowned