J'ai un serveur Dell exécutant CentOS 6
en utilisant PERC H710
Carte contrôleur Raid avec configuration Raid 5 et je souhaite surveiller la défaillance du disque dur/l'état de fonctionnement derrière le contrôleur Raid.
Ensuite, je devrais pouvoir utiliser un script bash pour surveiller l'état du disque dur et envoyer des e-mails d'alerte en cas de problème.
Le LSI MegaRAID SAS
outil de commande (À propos de LSI MegaRAID SAS Outils Linux) pour CentOS/Red Hat/Linux ne prend PAS en charge PERC H710 et smartctl
ne prend PAS en charge non plus.
Basé sur le site Web de Dell, CentOS
IS non pris en charge pour ce serveur (NX3200 PowerVault
) et je n'ai pas pu télécharger de programme Linux pour surveiller le disque dur.
[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)
[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
Vendor: Dell
Product: PERC H710
Revision: 3.13
User Capacity: 299,439,751,168 bytes [299 GB]
Logical block size: 512 bytes
Logical Unit id: ....
Serial number: ....
Device type: disk
Local Time is: Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART
Error Counter logging not supported
Device does not support Self Test logging
Tout le monde sait comment surveiller l'état du disque dur derrière le raid matériel sur Dell PERC H710 avec CentOS 6?
S.M.A.R.T. n'est pas le dernier mot dans la surveillance du disque ou du stockage !! C'est un composant, mais les contrôleurs RAID modernes l'utilisent avec d'autres méthodes pour déterminer la santé des disques et des baies.
Je suppose que c'est un contrôleur PERC dans un serveur Dell PowerEdge.
L'approche Linux normale pour la surveillance de la santé du matériel Dell consiste à installer les agents Dell OMSA pour Linux via Yum - http://linux.Dell.com/wiki/index .php/Repository/OMSA # Yum_setup
yum install srvadmin-all
installera la suite complète d'agents. Une fois installé, vous pouvez utiliser la commande omreport
pour obtenir des informations sur votre tableau.
Exemples:
$ omreport storage vdisk
$ omreport storage pdisk controller=0
$ omreport storage vdisk controller=0 vdisk=1
Vous pouvez voir l'état SMART des disques avec la commande smartctl et c'est -d
argument. Par exemple, pour voir le premier disque de la baie:
# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Device Model: ST91000640NS
Serial Number: ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity: 1,000,204,886,016 bytes [1.00 TB]
Sector Size: 512 bytes logical/physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#
C'est sur Scientific Linux 6 (un autre OS basé sur RHEL6) avec smartmontools-5.43-1.el6.x86_64.
La réponse acceptée recommande l'audace qui est yum install srvadmin-all
. Blecch. Voici comment le rendre légèrement moins blecch-y (mais toujours blecch-y néanmoins; vous pouvez devenir beaucoup plus maigre sur la plate-forme HP. Mais je m'égare ...) J'entends par là, n'installer que les composants nécessaires pour gérer le stockage sur votre machine .
BTW, la réponse directe à la question de l'utilisateur réside dans l'élément "Afficher les disques physiques sur le vdisk 0" dans la liste ci-dessous.
wget -q -O - http://linux.Dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices
Ajoutez au .bashrc de root:
export PATH=$PATH:/opt/Dell/srvadmin/bin
Prendre plaisir:
Afficher tous les disques physiques sur le contrôleur 0
$ omreport storage pdisk controller=0
Afficher tous les disques logiques sur le contrôleur 0
$ omreport storage vdisk controller=0
Afficher tous les disques physiques sur vdisk 0
$ omreport storage pdisk controller=0 vdisk=0
Reconfigurez un disque virtuel à raid1 à partir de raid0 ( COOL !!!!)
$ Sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
Créez un vdisk sur un nouveau disque:
$ Sudo omconfig storage controller controller=0 action=clearforeignconfig
$ Sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
BTW, puisque cette IS rien de plus qu'une carte LSI MegaCLI de marque Dell, vous trouverez peut-être la réponse de Han Solo encore mieux! Je n'ai pas encore essayé, cependant.
Voici un exemple de la sortie d'omreport, acheminée via grep pour un délicieux ensemble de données:
$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root
Controller PERC H700 Integrated (Embedded)
ID : 0:0:0
Status : Ok
Name : Physical Disk 0:0:0
State : Online
Power Status : Spun Up
Bus Protocol : SAS
Media : HDD
Failure Predicted : No
Revision : HT64
T10 PI Capable : No
Certified : Yes
Encryption Capable : No
Capacity : 136.13 GB (146163105792 bytes)
Used RAID Disk Space : 136.13 GB (146163105792 bytes)
Available RAID Disk Space : 0.00 GB (0 bytes)
Hot Spare : No
Vendor ID : Dell(tm)
Product ID : ST9146852SS
Serial No. : 6TB1AFDT
Part Number : CN0X162K7262213800JTA01
Negotiated Speed : 6.00 Gbps
Capable Speed : 6.00 Gbps
Sector Size : 512B
Manufacture Day : 05
Manufacture Week : 10
Manufacture Year : 2011
SAS Address : 5000C500395E44C5
ID : 0:0:1
Status : Ok
Name : Physical Disk 0:0:1
State : Online
Power Status : Spun Up
Bus Protocol : SAS
Media : HDD
Failure Predicted : No
Revision : HT64
T10 PI Capable : No
Certified : Yes
Encryption Capable : No
Capacity : 136.13 GB (146163105792 bytes)
Used RAID Disk Space : 136.13 GB (146163105792 bytes)
Available RAID Disk Space : 0.00 GB (0 bytes)
Hot Spare : No
Vendor ID : Dell(tm)
Product ID : ST9146852SS
Serial No. : 6TB1AFEY
Part Number : CN0X162K7262213800FPA01
Negotiated Speed : 6.00 Gbps
Capable Speed : 6.00 Gbps
Sector Size : 512B
Manufacture Day : 05
Manufacture Week : 10
Manufacture Year : 2011
SAS Address : 5000C500395E3C1D
J'avais aussi du mal à le faire fonctionner dans CentOS et j'ai trouvé un package de travail ici http://mirror.ndchost.com/software/lsi/
appelé " MegaCli-8.07.10-1.noarch.rpm "
La référence de commande http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS
J'espère que ça aide.
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC D906
Device: FUJITSU MBE2147RC Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
La commande perccli
peut également vous montrer beaucoup d'informations sur le lecteur si vous le demandez gentiment:
# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.
Drive /c0/e32/s0 :
================
-------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
-------------------------------------------------------------------------
32:0 0 UGood - 278.875 GB SAS HDD N N 512B ST3300657SS U
-------------------------------------------------------------------------
EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded
Drive /c0/e32/s0 - Detailed Information :
=======================================
Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes
Cela doit être répété pour chaque emplacement de boîtier, ou du moins je n'ai pas trouvé de moyen de l'imprimer en une seule fois avec une seule commande perccli
.
Il est également facile à installer par rapport à d'autres options plus complètes:
# curl -C - -O 'https://downloads.Dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/
perccli
est PAS une suite de surveillance complète comme Delll OMSA, mais il semble que beaucoup de gens ne veulent pas quelque chose de complet et ont plutôt besoin d'une solution décente , outil simple.