web-dev-qa-db-fra.com

Comment faire de SmartD est-il fermé sur un secteur non corritable particulier?

J'ai un disque dans un logiciel de deux disques RAID-1 pour lequel récemment un "secteur non corrostible hors ligne" est apparu dans le SMART Statut.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

Ceci apparemment n'est qu'un signe d'échec de disque imminent si cela se produit de plus en plus souvent (et puisque le lecteur est reflété, il n'y a pas de risque de perte de données réelle non plus). À l'époque, un auto-test a également échoué à un moment donné et smartd m'a envoyé un email pour en informer de cela car il devrait bien sûr le faire.

Cependant, l'écriture sur le secteur endommagé entraîne généralement le disque d'utiliser l'un de ses secteurs de rechange à la place, ce qu'il a apparemment fait parce que depuis I dded sur le disque, tous les auto-tests ont fonctionné tout simplement bien. Et badblocks a également trouvé aucune raison de se plaindre.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

Le nombre de secteurs défectueux n'a pas diminué cependant qu'il ne devrait pas, vraiment, puisque le secteur brisé est toujours là, bien qu'il soit inutilisé. Cependant, smartd continue de m'envoyer des courriels tous les soirs:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

Ceci est extrêmement ennuyeux évidemment et engourdit mon réflexe panique sain à smartd mails.

Le disque est un Western Digital WD20 et la version smartd est 5.41 2011-06-09 R3365.

19
Christian

il y a deux possibilités d'où proviennent ces mails. SmartD est capable d'envoyer des mails seuls, mais il n'est probablement pas configuré de cette façon, donc je suppose que ces mails sont envoyés par LogCheck. Si cette hypothèse est fausse, vous n'avez pas à lire plus loin.

logcheck analyse les fichiers journaux et envoie des mails s'il pense que vous devriez vous inquiéter de tout ce qui est arrivé à/sur votre système.

Vous avez la possibilité d'écrire une règle d'Ignore de logcheck qui indique à LogCheck de ne pas envoyer de messages correspondant à un modèle spécifique.

Vous pouvez (sous Systèmes basés à Debian) Créer un fichier appelé "/etc/logCheck/ignore.d.server/smartd_own" avec le contenu suivant:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

Cela devrait filtrer les courriers ennuyeux, mais vous écrirez à nouveau si le compteur de secteurs non corritable augmente.

0
hennr