web-dev-qa-db-fra.com

Pourquoi le stockage d'entreprise est-il si cher?

Il s'agit d'une question canonique sur le coût du stockage d'entreprise.
Voir aussi la question suivante:

Concernant les questions générales comme:

  • Pourquoi dois-je payer 50 dollars par mois par gigaoctet supplémentaire de stockage?
  • Notre serveur de fichiers manque toujours d'espace, pourquoi notre administrateur système n'y ajoute-t-il pas simplement un lecteur supplémentaire de 1 To?
  • Pourquoi l'équipement SAN est-il si cher?

Les réponses ici tenteront de fournir une meilleure compréhension du fonctionnement du stockage au niveau de l'entreprise et de ce qui influence le prix. Si vous pouvez développer la question ou donner un aperçu de la réponse, veuillez poster.

109
Mark Henderson
  1. Les capacités de disque dur du serveur sont minuscules par rapport aux capacités de disque dur de bureau. 450 et 600 Go ne sont pas des tailles rares à voir dans les nouveaux serveurs, et vous pouvez acheter de nombreux disques de bureau SATA 4 To pour le prix de un 600 Go SAS (serveur).

  2. Votre disque dur SATA dans votre ordinateur de bureau à la maison est comme une voiture de muscle de Ford, ou GM ou Mercedes ou tout autre constructeur de voitures pour tous les jours (V8 ou V12, 5 ou 6 de grande capacité litres). Parce qu'ils ont besoin d'être conduits par des personnes qui n'ont pas de licence de course ou ne comprennent pas comment fonctionne un moteur de combinaison interne, ils ont de très grandes tolérances. Ils ont des limiteurs de régime, ils sont conçus pour fonctionner avec n'importe quelle huile d'une certaine cote, ils ont des intervalles de maintenance disons à 10000 km l'un de l'autre, mais si vous manquez un intervalle de service de quelques semaines, il ne vous explosera pas au visage. Ils ne prennent pas feu lorsque vous conduisez sur de longues distances.

    Le lecteur SAS dans un serveur s'apparente davantage à un moteur de Formule 1. Ils sont vraiment petits (2,4 litres) mais ont une puissance de sortie immense en raison de leurs petites tolérances. Ils tournent plus haut et n'ont souvent pas de limiteur de régime (ce qui signifie qu'ils subissent de graves dommages s'ils sont mal conduits), et si vous manquez un intervalle de service (qui est de quelques heures heures ) ils explosent.

    Vous comparez essentiellement la craie et le fromage. Les chiffres et une ventilation complète sont discutés dans le livre blanc Intel Disques durs de classe entreprise contre disques durs de burea

  3. Parlons quelques chiffres durs ici. Disons que vous demandez 1 Mo de données supplémentaires (un joli chiffre rond). Combien de données est-ce vraiment ? Eh bien, vos 1 Mo de données iront dans une matrice RAID. Disons qu'ils sont sûrs et en font un RAID1. Vos 1 Mo de données sont mis en miroir, il s'agit donc en fait de 2 Mo de données.

    Supposons que vos données se trouvent dans un SAN. En cas de défaillance d'un nœud SAN, vos données sont synchronisées au niveau de l'octet avec un deuxième nœud SAN. Il est donc dupliqué et vos 2 Mo de données sont désormais de 4 Mo.

    Vous vous attendez à ce que votre fournisseur garde des sauvegardes sur place, afin que vos données puissent être restaurées en cas d'urgence non-catastrophe? Tout fournisseur décent va vous fournir au moins 1 sauvegarde sur site, peut-être plus. Disons qu'ils prennent des instantanés une fois par semaine pendant trois semaines sur place. Cela représente 3 Mo supplémentaires de données, vous êtes donc jusqu'à 7 Mo.

    En cas de catastrophe grave, votre fournisseur a intérêt à en conserver une copie hors site quelque part. Même si elle a un mois, elle devrait exister. Alors maintenant, vous êtes jusqu'à 8 Mo.

    S'il s'agit d'un fournisseur de très haut niveau, ils peuvent même avoir un site de reprise après sinistre synchronisé en direct. Ces disques seront également RAIDés, c'est donc 2 Mo supplémentaires, et vous disposez donc de 10 Mo de données.

    Vous devrez éventuellement transférer ces données. Quelle? Transférer? Oui, le transfert de données coûte de l'argent. Cela coûte de l'argent lorsque vous le téléchargez, y accédez sur Internet, cela coûte même de l'argent pour le sauvegarder (quelqu'un doit retirer ces bandes du bureau, et il se pourrait que votre 1 Mo de données signifie qu'il doit acheter un supplément ensemble de bandes et les transférer quelque part).

  4. Lorsque votre disque dur SATA domestique échoue, vous pouvez appeler le support technique et le convaincre que votre disque est mort. Envoyez ensuite votre disque au fabricant (à votre guise la plupart du temps). Attends une semaine. Récupérez un disque de remplacement et devez le réinstaller (il n'est certainement pas remplaçable à chaud ou déjà dans un traîneau).

    Lorsque ce lecteur SAS tombe en panne, vous appelez le support technique. Ils ne remettent presque jamais en question votre opinion selon laquelle le lecteur doit être remplacé immédiatement et déposent un nouveau lecteur; généralement, le nouveau disque est livré plus tard le même jour, sinon le lendemain est également très courant. Généralement, le fabricant enverra un représentant pour installer le lecteur si vous ne savez pas comment (très pratique si vous prévoyez de prendre des vacances et que vous avez besoin que les choses continuent à fonctionner pendant votre absence).

  5. Les disques durs d'entreprise ont des tolérances strictes, voir # 2 ci-dessus, et ont tendance à durer environ 10 fois plus longtemps que les disques grand public (MTBF). Les lecteurs d'entreprise prennent presque toujours en charge la détection avancée d'erreurs et d'échecs, qui, selon un rapport de Google, fonctionne environ 40% du temps, mais c'est quelque chose que quiconque préfère à un ordinateur qui meurt soudainement.

    Lorsque vous avez un seul disque dans votre ordinateur personnel, ses chances de défaillance statistiques sont simplement celles du disque. Les disques étaient auparavant notés dans MTBF (où les disques SAS bénéficient toujours de notes 50% plus élevées ou plus), maintenant il est plus courant de voir les taux d'erreur. Un lecteur SAS typique est 10 à 1 000 fois moins susceptible d'avoir une erreur irrécupérable (avec 100 fois la plus courante que j'ai trouvée récemment). (taux d'erreur selon la documentation du fabricant fournie par Seagate, Western Digital et Hitachi; aucun parti pris prévu; déclinaison expresse de l'indemnisation).

    Les taux d'erreur sont particulièrement importants non pas lorsque vous rencontrez une erreur irrécupérable sur un lecteur, mais lorsqu'un autre lecteur du même module tombe en panne et que vous ne comptez pas sur tous les lecteurs d'un module pour être lisible afin de récupérer le disque défaillant.

  6. SAS est un dérivé de SCSI, qui est un protocole de stockage. SATA est basé sur ATA, lui-même basé sur le bus ISA (ce bus 8/16 bits dans les ordinateurs de l'ère des dinosaures). Le protocole de stockage SCSI dispose de commandes plus étendues pour optimiser la manière dont les données sont transférées des disques aux contrôleurs et inversement. Cette augmentation de l'efficacité rendrait un disque SAS autrement égal par nature plus rapide, en particulier sous des charges de travail extrêmes, qu'un disque SATA; cela augmente également le coût.

  7. Il y a moins de disques SAS produits, les économies d'échelle dictent qu'ils seront plus chers toutes choses égales par ailleurs.

  8. Les disques SAS ont généralement des vitesses de rotation de 10 000 ou 15 000; tandis que SATA est généralement disponible en 5,4k ou 7,2k. Les disques SAS, en particulier la taille de 2,5 pouces qui devient de plus en plus populaire, ont des temps de recherche plus rapides. Les deux combinés augmentent considérablement les IOps qu'un lecteur peut effectuer, généralement un disque SAS est ~ 3x Lorsque plusieurs utilisateurs exigent des données disparates, la capacité d'E/S du disque/de la baie devient un indicateur de performance critique.

  9. Les disques d'un centre de données sont généralement alimentés en permanence. Des études ont montré que la panne du variateur est influencée par le nombre de cycles de chauffage/refroidissement qu'elle traverse (de la marche à la mise hors tension). Les faire fonctionner tout le temps augmente généralement la durée de vie du lecteur. La conséquence en est que les entraînements consomment de l'électricité. Cette électricité doit être fournie par quelque chose (dans le cas d'un gros DC les disques seuls peuvent prendre plus de puissance qu'un petit voisinage de maisons). Ils doivent également dissiper cette chaleur quelque part, nécessitant des systèmes de refroidissement (qui eux-mêmes prennent plus de puissance pour fonctionner).

  10. Frais d'infrastructure et de personnel. Ces disques sont en unités haut de gamme NAS ou SAN. Ces unités sont chères, même sans les lecteurs coûteux. Ils nécessitent un personnel coûteux pour les déployer et les entretenir. Les bâtiments dans lesquels se trouvent ces unités NAS et SAN sont coûteux à exploiter (voir le point sur le refroidissement ci-dessus, mais il y a beaucoup plus à faire là-bas.) Le logiciel de sauvegarde est généralement pas gratuit (pas plus que les licences pour des choses comme la mise en miroir), et le personnel pour déployer et maintenir les sauvegardes est généralement trop cher. Le coût de location de stockage et de livraison de bandes hors site n'est qu'une des nombreuses choses qui commencent à s'accumuler lorsque vous avez besoin de plus de stockage.

En gardant à l'esprit que la capacité de leurs disques peut bien être 1/10 de la taille d'un disque de bureau, et cinq fois le prix, votre 1 Mo de données est en fait de 10, et toutes les autres différences, il n'y a aucun moyen de dessiner un sens conclusions entre le prix de votre stockage de bureau et le prix du stockage de niveau entreprise.

117
Mark Henderson

Je n'ajoute pas cela à la première réponse CW principalement parce que c'est une différence d'opinion. N'hésitez pas à fusionner/modifier cela si vous le souhaitez.

Souvent, la raison pour laquelle le stockage "au niveau de l'entreprise" est si cher pourrait être que le demandeur ne comprend pas l'exigence, mais il arrive aussi que l'administrateur système ne comprenne pas l'exigence, ne puisse pas communiquer l'exigence à quelqu'un avec le pouvoir d'achat, ou obtient simplement ignoré par ladite autorité.

Les baies de stockage haute performance, hautement disponibles et à faible entretien sont coûteuses. Une partie du travail d'un concepteur de système consiste à savoir où ceux-ci sont appropriés et où une conception différente est appropriée.

Je ne pense pas que les coûts relatifs des différents types de lecteurs de disque soient réellement pertinents pour l'un ou l'autre des exemples de questions.

Pourquoi dois-je payer 50 dollars par mois par gigaoctet supplémentaire de stockage?

Cela s'adresse clairement à un fournisseur de services quelconque. Les deux réponses possibles à mon esprit sont:

  1. Vous avez 5 neuf heures de disponibilité, un support 24/7, à Manhattan/Londres/Hong Kong. Les plateaux rotatifs ne sont qu'une petite partie de la pile pour laquelle vous payez.

  2. Vous payez trop. Négociez, changez de fournisseur ou apportez-le en interne.

Notre serveur de fichiers manque toujours d'espace, pourquoi notre administrateur système n'y ajoute-t-il pas simplement un lecteur supplémentaire de 1 To?

Il s'agit presque certainement d'une mauvaise conception (et probablement pour des raisons politiques). Les données sur ce serveur de fichiers se situent quelque part dans ce spectre:

  • Les données méritent d'être stockées dans une configuration hautes performances, hautement disponible et coûteuse. Les temps d'arrêt causés par le manque d'espace affectent votre haute disponibilité et constituent un échec de conception ou de planification.

  • Les données sont soit sans importance, soit des performances lentes, soit des temps d'arrêt plus longs sont acceptables. Les disques bon marché et les solutions de sauvegarde bon marché sont acceptables. Les temps d'arrêt réguliers dus au manque d'espace disque semblent toujours un compromis étrange, car la majorité de vos coûts dans ce cas sera probablement votre temps d'administrateur système, et à long terme, ils passeront plus de temps à dépanner le disque faible espace.

Notez que j'ai dit qu'il s'agit d'un spectre et que la plupart des exigences se situent quelque part entre les deux.

31
Colin Pickard

Je suis d'accord avec les autres articles sur la qualité de l'offre d'une société d'hébergement. Mais nous avons récemment refait notre contrat d'hébergement et avons magasiné et personne n'était compétitif sur l'espace de stockage, et les prix n'étaient pas inférieurs à notre précédent contrat de 3 ans. SAS lecteurs ont baissé de prix, étagère de disque/baies/SAN/FC/commutateurs ont baissé, tout a baissé de prix. Mais pas de stockage sur disque?

Un collègue avec beaucoup plus d'expérience a souligné la tactique. Le prix du processeur, de la mémoire et de la bande passante était éblouissant! Inscrivez-vous ici! Inscrivez-vous maintenant et ignorez ce problème d'espace disque! Vous n'aurez pas besoin d'autant d'espace disque. Regardez le CPU et la mémoire!

Une fois que vous vous êtes engagé sur leur contrat, ils vous ont vraiment compris et ils constituent leurs revenus sur l'espace disque. Oui, il s'agit de RAID-5 et de hautes performances, etc., mais les sauvegardes coûtent plus cher, la réplication hors site coûte plus cher.

Pour les hébergeurs, c'est un modèle économique. La plupart des entreprises font quelque chose de similaire avec leurs prix - réduisez ce prix ici mais augmentez celui-là là-bas pour faire leurs revenus ailleurs. Ils doivent également payer leur loyer et leur salaire.

Pour les serveurs internes, vous avez différents problèmes. Vous ne pouvez pas simplement entrer dans une salle de serveurs avec la boîte Fedex qui contient votre nouveau disque dur de 3 To. Si vous avez prévu une extension, c'est plus facile, mais les serveurs/racks/baies peuvent déjà être à leur capacité en termes de slots, d'E/S, de cartes contrôleur, d'alimentation.

C'est comme regarder sous un rocher, vous serez surpris de ce que vous pourriez trouver.

6
jqa

Le coût de production d'un article est directement lié au volume d'unités qu'il vendra dans une boucle de rétroaction.

Dans le cas d'un disque dur conventionnel, avec du verre rouillé et des composants électroniques rouillés, il y a potentiellement une énorme variation dans le coût des composants mécaniques et électroniques - cependant 2 bandes claires de prix/qualité ont émergé - Enterprise et Commodity.

Cependant, le volume de ventes réduit d'un disque d'entreprise coûte cher sur ce que vous obtenez pour votre argent - quelque chose qui coûte sept fois plus ne sera pas sept fois mieux.

Les unités d'entreprise (pour une capacité donnée) sont légèrement plus rapides que les unités de base, par ex. comparaison des disques Seagate Barracuda SATA (marchandise) et Cheetah SAS (entreprise):

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Mais dans un contexte d'entreprise, aucun administrateur système sensé ne stockerait jamais de données importantes sur un seul disque - l'utilisation de plusieurs disques offre une plus grande fiabilité et bande passante, et réduit efficacement la latence; quatre des disques Barracuda configurés en RAID10, seront beaucoup plus rapides que le seul disque Cheetah, avec beaucoup moins de risques de perte de données à environ 60% du prix.

Vous obtiendrez certainement une meilleure garantie avec le lecteur Enterprise, et le fournisseur pourra généralement vous en obtenir un le même jour - mais vous pourrez probablement vous procurer un lecteur de marchandise auprès d'un fournisseur local plus rapidement que votre fournisseur ne le peut. expédiez le disque de remplacement. D'un autre côté, le disque d'entreprise est plus susceptible d'être un remplacement exact du lecteur défectueux.

Alors, vous obtenez peut-être beaucoup plus de fiabilité des disques d'entreprise? Alors que les gens qui fabriquent et vendent les disques disent souvent que c'est le cas (Seagate est plutôt timide à ce sujet sur leur site Web - mais même les chiffres obscurs qu'ils publient montrent que c'est moins d'un facteur 2). Des études indépendantes suggèrent qu'il y a pas de différence significative .

Le jeu de commandes SCSI présente certains avantages techniques par rapport au jeu de commandes ATA - en particulier en termes de permettre au système d'exploitation de savoir exactement ce qui est engagé sur le disque - mais là encore, cela ne fait qu'une différence efficace en regardant les performances et la fiabilité d'un système de fichiers implémenté sur un seul disque.

Si votre fournisseur de services exploite un SAN Fibre Channel, le coût par gigaoctet de stockage sera au moins 8 fois plus élevé que l'achat d'un disque standard dans votre quincaillerie la plus proche. Mais il existe autres approches qui peuvent réduire considérablement le coût.

Notez que cela ne sera toujours pas moins cher que l'achat d'un disque standard, car vous payez également pour la redondance, l'alimentation, la climatisation et le support, mais ces coûts devraient être faibles par rapport au coût de la fourniture de stockage.

6
symcbean

Il est également important de noter que le stockage "local" pourrait bien coûter plus cher que vous ne le pensez de toute façon.

Dans le cadre d'un exercice visant à déplacer certaines de nos données "archivées" vers le cloud, j'ai récemment terminé un exercice de tarification comparant le coût de l'espace disque disponible (par exemple formaté plutôt que brut) disponible sur notre plus récent SAN par rapport au coût de stockage dans le service de données cloud Amazon.

En considérant simplement le prix payé pour le SAN lui-même, y compris les disques, en supposant une durée de vie de 5 ans pour le matériel SAN, et pas le les frais généraux de fonctionnement de notre salle de serveurs, notre prix pour 150 Go de stockage local est de 31,88 $ par mois contre 28,41 $ d'Amazon (en supposant un taux de trafic mensuel de 20% de haut en bas).

Maintenant, je ne vais pas me précipiter et déplacer tout notre stockage vers le cloud car il y a d'autres avantages à avoir un stockage local, mais je pense que ce genre d'exercice de tarification est utile: Si vous pensez que le stockage cloud est cher, alors combien êtes-vous vraiment payez pour votre stockage local?

5
Rob Moir

Mon point de vue sur cette question est simple IO ... un fichier qui se trouve sur un disque dur de marchandise unique sans raid et probablement sans échange à chaud, et est normalement accessible par une personne et probablement jamais sauvegardé. Il s'agit d'une méthode d'E/S simple et bon marché ...

Dans notre entreprise, j'ai utilisé l'une des méthodes de raid les plus chères (raid 10) qui nécessite un minimum de 4 disques; nous en utilisons 6 ... cela nous donne des taux IO et tolérance aux pannes.

Cette configuration a sauvé mon a $$ de façon considérable, et ce résultat a signifié des performances plus élevées et moins de temps d'arrêt pour les utilisateurs finaux .. pour simple IO il n'y a qu'une seule personne à décevoir et probablement là est peu de valeur financière liée aux temps d'arrêt.

Nous avons également un serveur iSCSI dédié qui est utilisé pour la virtualisation Xen et qui est également configuré pour le raid 10 ...

Plus il faut IO qui doit être utilisé et sauvegardé, plus il est coûteux à mettre en œuvre ... si les besoins de votre entreprise acceptent la perte de données, des vitesses très lentes et aucune redondance - alors le stockage en classe affaires peut être fait à bas prix !!! Soyez juste prêt à être viré ...

4
user104917