J'ai un serveur HP avec un contrôleur SmartArray P400 (y compris 256 Mo de cache/sauvegarde de batterie) avec un lecteur logique avec disque physique défectueux remplacé qui ne se reconstruit pas.
Voici à quoi cela ressemblait lorsque j'ai détecté l'erreur:
~ #/usr/sbin/hpacucli ctrl slot = 0 show config Smart Array P400 dans Slot 0 (Embedded) (sn: XXXX) array A (SATA, espace inutilisé: 0 Mo) Lecteur logique 1 (698,6 Go, RAID 1, OK) Lecteur physique 1I: 1: 1 (port 1I: boîtier 1: baie 1, SATA, 750 Go , OK) Lecteur physique 1I: 1: 2 (port 1I: boîtier 1: baie 2, SATA, 750 Go, OK) Baie B (SATA, espace inutilisé: 0 Mo) Lecteur logique 2 (2,7 To, RAID 5, échec) Lecteur physique 1I: 1: 3 (port 1I: boîtier 1: baie 3, SATA, 750 Go, OK) physicaldrive 1I: 1: 4 (port 1I: boîtier 1: baie 4, SATA, 750 Go, OK) physicaldrive 2I: 1: 5 (port 2I: boîtier 1: baie 5, SATA, 750 Go, OK) Lecteur physique 2I: 1: 6 (port 2I: boîtier 1: baie 6, SATA, 750 Go, échec) Lecteur physique 2I: 1: 7 (port 2I: boîtier 1: baie 7 , SATA, 750 Go, OK) Non affecté Lecteur physique 2I: 1: 8 (port 2I: boîtier 1: baie 8, SATA, 750 Go, OK) ~ #
Je pensais que j'avais le lecteur 2I: 1: 8 configuré comme disque de secours pour le tableau A et le tableau B, mais il semble que ce n'était pas le cas :-(. J'ai remarqué le problème en raison d'erreurs d'E/S sur l'hôte, même si seul 1 lecteur physique du RAID5 est en panne.
Est-ce que quelqu'un sait pourquoi cela pourrait arriver? Le lecteur logique doit passer en mode "Dégradé" mais être toujours entièrement accessible depuis le système d'exploitation de l'hôte!?
J'ai d'abord essayé d'ajouter le lecteur 2I: 1: 8 non affecté en tant que disque de rechange à la commande logique 2, mais cela n'a pas été possible:
~ #/usr/sbin/hpacucli ctrl slot = 0 array B add spares = 2I: 1: 8 Erreur: Cette opération n'est pas prise en charge avec la configuration actuelle. Utilisation la commande "show" sur les appareils pour afficher des détails supplémentaires sur la configuration. ~ #
Il est intéressant de noter qu'il est possible d'ajouter le lecteur non attribué au premier module RAID sans problème. Je pensais que peut-être le contrôleur mettait la baie en état "échoué" en raison de la pièce de rechange manquante et protégeait les baies défectueuses contre toute modification. J'ai donc essayé de réactiver le lecteur logique (pour ajouter le disque de rechange par la suite):
~ #/usr/sbin/hpacucli ctrl slot = 0 ld 2 modifie réactiver Avertissement: Toutes les données déjà existantes sur le lecteur logique peuvent ne pas être valides ou récupérables. Continuer? (y/n) y Erreur: cette opération n'est pas prise en charge avec la configuration actuelle. Utilisez la commande "show" sur les appareils pour afficher des détails supplémentaires à propos de la configuration. ~ #
Mais comme vous pouvez le voir, réactiver le lecteur logique, cela n'a pas été possible.
Maintenant, j'ai remplacé le disque défectueux en le faisant correspondre avec le disque non attribué. Le statut ressemble maintenant à ceci:
~ #/usr/sbin/hpacucli ctrl slot = 0 show config Smart Array P400 dans Slot 0 (Embedded) (sn: XXXX) array A (SATA, espace inutilisé: 0 Mo) Lecteur logique 1 (698,6 Go, RAID 1, OK) Lecteur physique 1I: 1: 1 (port 1I: boîtier 1: baie 1, SATA, 750 Go , OK) Lecteur physique 1I: 1: 2 (port 1I: boîtier 1: baie 2, SATA, 750 Go, OK) Baie B (SATA, espace inutilisé: 0 Mo) Lecteur logique 2 (2,7 To, RAID 5, échec) Lecteur physique 1I: 1: 3 (port 1I: boîtier 1: baie 3, SATA, 750 Go, OK) physicaldrive 1I: 1: 4 (port 1I: boîtier 1: baie 4, SATA, 750 Go, OK) physicaldrive 2I: 1: 5 (port 2I: boîtier 1: baie 5, SATA, 750 Go, OK) Lecteur physique 2I: 1: 6 (port 2I: boîtier 1: baie 6, SATA, 750 Go, OK) Lecteur physique 2I: 1: 7 (port 2I: boîtier 1: baie 7 , SATA, 750 Go, OK) ~ #
Le lecteur logique n'est toujours pas accessible. Pourquoi ne reconstruit-il pas?
Que puis-je faire?
Pour info, voici la configuration de mon contrôleur:
~ #/usr/sbin/hpacucli ctrl slot = 0 afficher Smart Array P400 dans l'emplacement 0 (intégré) Interface de bus: PCI Emplacement: 0 Numéro de série: XXXX Numéro de série du cache: XXXX État RAID 6 (ADG): activé État du contrôleur: OK Emplacement du châssis: Révision matérielle: Rév E Version du micrologiciel: 5.22 Priorité de reconstruction: moyenne Priorité d'extension: moyenne Délai de numérisation de la surface: 15 secondes Notification d'incohérence d'analyse de surface: désactivée Tampon d'écriture Raid1: désactivée Délai d'expiration de l'invite: 0 seconde Carte de cache présente: vrai État du cache: OK Ratio d'accélérateur: 25% en lecture/75% en écriture Cache d'écriture du lecteur: désactivé Taille totale du cache: 256 Mo Cache d'écriture sans batterie: désactivé Source d'alimentation de sauvegarde du cache: Batteries Nombre de batteries/condensateurs: 1 État de la batterie/condensateur: OK SATA NCQ pris en charge: Vrai ~ #
Merci de votre aide à l'avance.
La réponse n'est pas agréable. Il y a une forte probabilité que votre baie soit dans un état "en attente de reconstruction", où il y a un autre disque défaillant dans l'ensemble de baies RAID5 qui empêche la récupération de achèvement. C'est pourquoi vous devriez éviter le RAID5 de nos jours . Cela n'aide pas que ce soient des disques SATA ... La probabilité de problèmes est encore plus élevée. Essayez d'éteindre le système (en laissant tourner les disques) et de le rallumer. Suivez les invites à l'écran de la matrice du BIOS et choisissez F2
option pour "réactiver toutes les unités logiques". Cela peut démarrer le processus de reconstruction.
Sinon, c'est une reconstruction/récupération avec de nouveaux disques.
Vous devriez démarrer dans ACU et voir exactement ce qui se passe. si l'intégralité du lecteur logique est inaccessible, vous pouvez le réactiver.