web-dev-qa-db-fra.com

Comment dois-je graver sur des disques durs?

Google a fait une étude très approfondie sur les pannes de disques durs qui a révélé qu'une partie importante des disques durs tombaient en panne au cours des 3 premiers mois d'utilisation intensive.

Mes collègues et moi pensons que nous pourrions mettre en œuvre un processus de rodage pour tous nos nouveaux disques durs, ce qui pourrait nous éviter de perdre du temps sur les nouveaux disques non testés. Mais avant de mettre en œuvre un processus de rodage, nous aimerions obtenir des informations d'autres personnes plus expérimentées:

  • Quelle est l'importance de graver sur un disque dur avant de commencer à l'utiliser?
  • Comment implémentez-vous un processus de rodage?
    • Combien de temps gravez-vous sur un disque dur?
    • Quel logiciel utilisez-vous pour graver des disques?
  • Combien de stress est trop pour un processus de rodage?

EDIT: En raison de la nature de l'entreprise, les RAID sont impossibles à utiliser la plupart du temps. Nous devons compter sur des disques uniques qui sont envoyés fréquemment à travers le pays. Nous sauvegardons les disques dès que possible, mais nous rencontrons toujours des pannes ici et là avant d'avoir la possibilité de sauvegarder les données.

MISE À JOUR

Mon entreprise a mis en place un processus de rodage depuis un certain temps maintenant, et il s'est avéré extrêmement utile. Nous brûlons immédiatement tous les nouveaux disques que nous avons en stock, ce qui nous permet de trouver de nombreuses erreurs avant l'expiration de la garantie et avant de les installer dans de nouveaux systèmes informatiques. Il s'est également avéré utile de vérifier qu'un disque a mal tourné. Lorsqu'un de nos ordinateurs commence à rencontrer des erreurs et qu'un disque dur est le principal suspect, nous réexécutons le processus de gravure sur ce lecteur et examinons toutes les erreurs pour nous assurer que le lecteur était réellement le problème avant de démarrer le processus RMA ou de lancer à la poubelle.

Notre processus de rodage est simple. Nous avons un système Ubuntu désigné avec beaucoup de ports SATA, et nous exécutons des badblocks en mode lecture/écriture avec 4 passes sur chaque disque. Pour simplifier les choses, nous avons écrit un script qui affiche un avertissement "LES DONNÉES SERONT SUPPRIMÉES DE TOUS VOS LECTEURS", puis exécute des badblocks sur chaque lecteur à l'exception du lecteur système.

41
Phil

Quelle est l'importance de graver sur un disque dur avant de commencer à l'utiliser?

Si vous avez une bonne sauvegarde et de bons systèmes à haute disponibilité, alors pas beaucoup. Depuis la restauration d'un échec devrait être assez facile.

Comment implémentez-vous un processus de rodage? Quel logiciel utilisez-vous pour graver des disques? Combien de stress est trop pour un processus de rodage?

Je vais généralement exécuter badblocks sur un lecteur ou un nouveau système lorsque je l'obtiens. Je l'exécuterai chaque fois que je ressusciterai un ordinateur de la pile de pièces de rechange. Une commande comme celle-ci (badblocks -c 2048 -sw /dev/sde) écrira en fait à chaque bloc 4 fois à chaque fois avec un modèle différent (0xaa, 0x55, 0xff, 0x00). Ce test ne fait rien pour tester de nombreuses lectures/écritures aléatoires, mais il devrait prouver que chaque bloc peut également être écrit et lu.

Vous pouvez également exécuter bonnie ++ , ou iometer qui sont des outils d'analyse comparative. Ceux-ci devraient essayer de stresser un peu vos lecteurs. Les disques ne devraient pas échouer même si vous essayez de les maximiser. Vous pourriez donc aussi bien essayer de voir ce qu'ils peuvent faire. Je ne fais pas cela cependant. Obtenir une référence d'E/S de votre système de stockage au moment de l'installation/configuration peut être très utile à l'avenir lorsque vous examinez les problèmes de performances.

Combien de temps gravez-vous sur un disque dur?

À mon avis, une seule série de badblocks est suffisante, mais je pense avoir un système de sauvegarde très solide et mes besoins en HA ne sont pas si élevés. Je peux me permettre un temps d'arrêt pour restaurer le service sur la plupart des systèmes que je supporte. Si vous êtes si inquiet, que vous pensez qu'une configuration multi-passes peut être requise, alors vous devriez probablement avoir un RAID, de bonnes sauvegardes et une bonne configuration HA de toute façon.

Si je suis pressé, je peux sauter un burn-in. Mes sauvegardes et RAID devraient convenir.

36
Zoredache

IMNSHO, vous ne devriez pas compter sur un processus de rodage pour éliminer les mauvais disques et "protéger" vos données. Le développement de cette procédure et sa mise en œuvre prendront du temps qui pourrait être mieux utilisé ailleurs et même si un disque passe avec rodage, il peut encore échouer des mois plus tard.

Vous devez utiliser le RAID et les sauvegardes pour protéger vos données. Une fois que cela est en place, laissez-le s'inquiéter des lecteurs. De bons contrôleurs RAID et sous-systèmes de stockage auront des processus de "nettoyage" qui parcourent les données de temps en temps et garantissent que tout est bon.

Une fois que tout est pris en charge, il n'est plus nécessaire de nettoyer le disque, mais comme d'autres l'ont mentionné, cela ne fait pas de mal de faire un test de charge du système pour s'assurer que tout fonctionne comme prévu. Je ne me soucierais pas du tout des disques individuels.


Comme cela a été mentionné dans les commentaires, cela n'a pas beaucoup de sens d'utiliser des disques durs pour votre cas d'utilisation particulier. Les expédier est beaucoup plus susceptible de provoquer des erreurs de données qui ne seront pas présentes lors de la gravure.

Le support de bande est conçu pour être expédié. Vous pouvez obtenir 250 Mo (ou jusqu'à 650 Mo compressés) avec un seul lecteur IBM TS1140 qui devrait être plus rapide que votre disque dur. Et aussi plus gros - une seule cartouche peut vous donner jusqu'à 4 To (non compressé).

Si vous ne souhaitez pas utiliser de bande, utilisez des disques SSD. Ils peuvent être traités beaucoup plus brutalement que les disques durs et répondent à toutes les exigences que vous avez données jusqu'à présent.


Après tout ça, voici mes réponses à vos questions:

  • Quelle est l'importance de graver sur un disque dur avant de commencer à l'utiliser?
    Pas du tout.
  • Comment implémentez-vous un processus de rodage?
    • Combien de temps gravez-vous sur un disque dur?
      Un ou deux passages.
    • Quel logiciel utilisez-vous pour graver des disques?
      Une simple exécution de, disons, shred et badblocks suffira. Vérifiez ensuite les données SMART.
  • Combien de stress est trop pour un processus de rodage?
    Aucun stress n'est trop. Vous devriez pouvoir lancer quoi que ce soit sur un disque sans qu'il ne saute.
49
MikeyB

Compte tenu de votre clarification, il ne semble pas que tout processus de rodage vous soit utile. Les entraînements échouent principalement en raison de facteurs mécaniques, généralement la chaleur et les vibrations; pas à cause d'une sorte de bombe à retardement cachée. Un processus de "rodage" teste l'environnement d'installation autant que n'importe quoi d'autre. Une fois que vous avez déplacé la chose, vous revenez à votre point de départ.

Mais voici quelques conseils qui pourraient vous aider:

Les lecteurs d'ordinateurs portables sont généralement conçus pour résister à plus de secousses et de vibrations que les lecteurs de bureau. Mes amis qui travaillent dans des magasins de récupération de données envoient toujours des données aux clients sur des disques durs pour cette raison. Je n'ai jamais testé ce fait, mais il semble que ce soit de notoriété publique dans certaines industries.

Les lecteurs flash (par exemple les clés USB) sont à peu près les plus résistants aux chocs de tous les supports que vous trouverez. Il est encore moins probable que vous perdiez des données en transit si vous utilisez un support flash.

Si vous expédiez un disque Winchester, effectuez une analyse de surface avant de le mettre en service. Ou mieux encore, juste ne pas mettez-le en service. Au lieu de cela, vous souhaiterez peut-être désigner certains lecteurs comme des lecteurs "d'expédition", qui détectent tous les abus, mais sur lesquels vous ne comptez pas pour l'intégrité des données. (C'est-à-dire: copier les données sur le disque pour l'expédition, copier après l'expédition, très sommes de contrôle des deux côtés, ce genre de chose).

8
tylerl

Je suis en désaccord avec toutes les réponses qui disent essentiellement "Ne vous embêtez pas avec le rodage, ayez de bonnes sauvegardes".

Bien que vous devriez toujours avoir des sauvegardes, j'ai passé 9 heures hier (en plus de mon quart de travail habituel de 10 heures) à restaurer à partir des sauvegardes car le système fonctionnait avec des disques qui n'avaient pas été brûlés.

Il y avait 6 disques dans une configuration RAIDZ2 (ZFS équivalent à RAID-6) et nous avons eu 3 disques qui meurent en 18 heures sur une boîte qui fonctionnait depuis environ 45 jours.

La meilleure solution que j'ai trouvée est d'acheter des disques d'un fabricant particulier (ne pas mélanger et assortir), puis d'exécuter l'outil fourni pour exercer les disques.

Dans notre cas, nous achetons Western Digital et utilisons leurs diagnostics de lecteur basés sur DOS à partir d'une image ISO de démarrage. Nous l'allumons, exécutons l'option pour écrire des ordures aléatoires sur le disque entier, puis exécutons le test court SMART suivi du long SMART test. C'est généralement assez pour éliminer tous les secteurs défectueux, réallocations en lecture/écriture, etc ...

J'essaie toujours de trouver un moyen décent de le "batch" afin que je puisse l'exécuter contre 8 lecteurs à la fois. Pourrait simplement utiliser "dd if =/dev/urandom of =/dev/any" sous Linux ou "badblocks".

EDIT: J'ai trouvé une meilleure façon de le "batch". J'ai finalement réussi à configurer un serveur de démarrage PXE sur notre réseau pour répondre à un besoin particulier, et j'ai remarqué que le CD Ultimate Boot peut être démarré PXE. Nous avons maintenant une poignée de machines indésirables qui peuvent être démarrées PXE pour exécuter des diagnostics de lecteur.

5

Votre processus est incorrect. Vous devez utiliser des tableaux de raid. Là où je travaille, nous avons créé des matrices de raid robustes conçues pour être transportées. Ce n'est pas sorcier. Le montage par choc des disques dans des boîtiers surdimensionnés avec de gros isolateurs de vibrations en caoutchouc améliorera considérablement la fiabilité. (Les disques Seagate constellation-es, à titre d'exemple, sont conçus pour les chocs 300G mais seulement pour les vibrations 2G, ne fonctionnent pas: le boîtier d'expédition doit donc isoler les vibrations du disque. http://www.novibes.com/Products&productID = 62 ou http://www.novibes.com/Products&productId=49 [pièce # 50178])

Cependant, vous voulez vraiment graver des disques durs de test, alors voici.

J'ai travaillé sur des systèmes comme les disques durs et les graver ont trouvé des problèmes mais ...

Pour accélérer les tests de cycle de vie des PCB pour faire ressortir les défauts, rien ne vaut certains cycles chaud/froid. (le fonctionnement des cycles chaud-froid fonctionne encore mieux ... mais c'est plus difficile pour vous, surtout avec les banques de disques durs)

Procurez-vous une chambre environnementale grande pour le nombre de lecteurs que vous acquérez à la fois. (Ce sont assez chers, il serait moins cher d'expédier des matrices de raid) Vous ne pouvez pas lésiner sur les chambres de test, vous aurez besoin d'un contrôle de l'humidité et de rampes programmables.

Programmez en deux rampes de température répétitives, jusqu'à la température de stockage minimale, jusqu'à la température de stockage maximale, rendez les rampes suffisamment raides pour déranger l'ingénieur d'application de votre fabricant de disque dur. 3 cycles froid-chaud en 12 heures devraient voir les disques tomber en panne assez rapidement. Exécutez les lecteurs au moins 12 heures comme ceci. Si vous travaillez après, je serai surpris.

Je n'ai pas pensé à ça: un endroit où j'ai travaillé, un ingénieur de production l'a fait, pour faire expédier plus de produits avec le même équipement de test, il y a eu une énorme augmentation des défauts de test, mais le taux de morts à l'arrivée est tombé à pratiquement zéro.

5
Tim Williscroft

Quelle est l'importance de graver sur un disque dur avant de commencer à l'utiliser?

Ça dépend.
Si vous l'utilisez dans un RAID qui fournit une redondance (1, 5, 6, 10)? Pas très.
Si vous l'utilisez en mode autonome? Un peu, mais vous feriez mieux de simplement exécuter smartd ou quelque chose pour le surveiller à la place, du moins à mon avis.

Cela conduit naturellement à ma réponse à "Comment implémentez-vous un processus de rodage?" - Je ne le fais pas.
. J'ai constaté que le temps supplémentaire nécessaire pour effectuer un burn-in complet (exercer réellement tout le disque) est beaucoup plus cher que de faire face à une défaillance et à un remplacement de disque.
.

3
voretaq7

Spinrite (grc.com) va lire et réécrire toutes les données sur le disque. C'est une bonne chose à faire pour un nouveau disque même si vous n'essayez pas de le faire échouer. L'exécution au niveau 4 prend beaucoup de temps, généralement quelques jours pour les disques de taille actuelle. Je dois également ajouter qu'il n'est pas destructif. En fait, s'il a des données dans de mauvais endroits, il les déplacera et les récupérera. Bien sûr, vous ne l'exécuterez jamais sur un SSD.

2
Charlie

Je suis sûr qu'une analyse comparative et une vérification des erreurs une fois par semaine suffiront pour "graver" des disques durs. Bien que depuis votre message, je n'ai jamais entendu parler d'une telle chose.

Extrait de "6_6_6" sur Stroagereview.com

1. Connect the drive to a running system. Read SMART values.

2. Do a SMART short self test. Do a SMART long self-test.

3. Zero fill / Wipe the drive with the manufacturer's utility. Entire drive.

4. Run HDTach full read/write. Everest / Sandra, etc all have stress tests. Run hard drive part continously for hours.

5. Run Victoria for Windows Read/Write test and make sure no slow sectors.

6. Drop to DOS. Run MHDD, run a LBA test and see check for slow sectors. Run Read/Write/Verify test. Run drive internal ATA secure erase command.

7. Do a full format.

8. Compare SMART values. If no anomalies, all good to go. Install your OS and continue.

Dans l'ensemble, je pense personnellement que c'est une mauvaise idée.

EDIT: Scource: http://forums.storagereview.com/index.php/topic/27398-new-hdd-burn-in-routines/

1
U4iK_HaZe

Tout d'abord, je suis d'accord avec d'autres affiches que votre cas d'utilisation suggère que les lecteurs de bande seront la meilleure option.

Si ce n'est pas possible, si vous devez faire voler des disques à travers le pays, un véritable RAID ne semble pas être une option, car vous devrez transporter beaucoup plus de disques, augmentant le risque de panne. Cependant, qu'en est-il d'un schéma de mise en miroir simple, l'envoi d'un lecteur et la conservation de l'autre sur le site source?

Ensuite, si le disque tombe en panne à l'arrivée, une nouvelle copie peut être faite et envoyée. Si le disque est bon à l'arrivée, le disque de rechange peut ensuite être réutilisé - soit pour l'envoi, soit pour la sauvegarde des données d'origine.

0
user94083

Vous n'avez pas vraiment expliqué pourquoi les disques sont expédiés - est-ce juste un moyen d'envoyer des données, ont-ils des images complètes d'applications/OS prêtes à être démarrées sur un PC, ou autre chose?

Je suis d'accord avec les autres réponses que le RAID ou les sauvegardes sont meilleurs que l'analyse, en raison des risques d'expédier un disque entraînant des problèmes mécaniques.

Une manière plus générale de mettre cela en place serait de "s'appuyer sur des données redondantes pour détecter et corriger les erreurs" - soit expédier 2 disques pour chaque ensemble de données, soit expédier des données redondantes sur un seul disque. Quelque chose comme Parchive vous permet d'ajouter un niveau défini de redondance aux données, permettant la récupération même si une grande partie des données est corrompue. Étant donné que les disques sont assez bon marché de nos jours, il suffit souvent d'acheter un disque plus gros que strictement requis pour scanner le lecteur, expédier un lecteur de remplacement ou expédier 2 lecteurs.

Cela protégerait contre les pannes non catastrophiques du lecteur - mais il est toujours préférable de ne pas réutiliser un lecteur livré, sauf pour l'expédition, comme suggéré précédemment, c'est-à-dire de le voir comme une bande qui doit être extraite vers un `` vrai '' lecteur qui est en permanence installé et non expédié nulle part.

Cela devrait vous permettre d'expédier une grande quantité de données (ou même des images d'application/OS) et de réduire l'impact des erreurs de disque à n'importe quel niveau économique.

0
RichVel