30 janvier 2014

RAID : tirer le meilleur de ses disques durs

Pour ceux qui l’ignorent, le RAID consiste à rassembler plusieurs disques et de les utiliser de manière concurrente pour améliorer les performances ou la résilience des données. Quelque soit le nombre de disques réel, à l’usage ce sera comme si vous n’en aviez qu’un.

On peut utiliser RAID à partir de deux disques et jusqu’à plusieurs centaines. Par ailleurs, il existe beaucoup de configuration RAID différentes, que vous vouliez assurer la redondance de vos données, améliorer les performances ou les deux à la fois, pour un serveur ou un ordinateur personnel, il y a forcement un niveau de RAID qui vous convient.

Software ou hardware

Les deux solutions existent en effet. Soit vous prenez une carte dédiée à laquelle vous allez connecter les disques, et c’est elle qui s’occuppe de toute la gestion du RAID, soit vous déléguez la gestion à votre OS.

Vous avez le choix, très bien, mais quelle décision prendre ? Chacun a évidemment des avantages et des inconvénients. Je ne vais pas vous faire un grand tableau comparatif mais vous énumérer les facteurs les plus déterminants.

Concernant le RAID software, c’est facile à mettre en place puisqu’une grande partie des systèmes d’exploitations l’intègre, il vous suffira de le configurer, ce n’est pas plus complexe que de partitionner. Vous aurez d’assez bonnes performances en RAID 0 et RAID 1. Enfin c’est très peu onéreux puisque ça ne vous coûte rien de plus que les diques !

En revanche, le principal problème sur RAID software est que comme c’est le système qui le gère, sur les niveaux de RAID où il y a un calcul de parité (RAID 5, 6…) c’est le processeur qui doit se charger du calcul et on a donc une baisse des performances du système. Alors cela n’est pas grave si c’est une tour avec 6 disques en RAID 5 et un bon CPU, mais lorsqu’il s’agit d’un serveur avec beaucoup de disques, le ralentissement peut devenir notable.

comparatif des performances de différents niveaux de raid — Performances de différentes configurations RAID avec des SSD. ([étude intégrale](https://www.conseil-config.com/2016/dossier-le-raid-de-ssd-dans-les-pc-des-particuliers-utile-ou-superflu/4/))

Je pense que vous l'aurez compris, les avantages & inconvénients du RAID hardware sont l'exact opposé. C'est cher puisqu'il faut acheter des cartes RAID mais ça ne repose pas sur les ressources du système car les calculs sont fait par la carte dédiée. Ainsi si vous avez beaucoup de disques à gérer ça ne grèvera pas les performances du système.

En résumé, si c’est un ordinateur de bureau, la question ne se pose pas : software. Si c’est un serveur, c’est un peu plus complexe. Si tous vos disques sont en RAID 0 ou RAID 1, ne vous encombrez pas avec du hardware. En revanche, les utilisations les plus courantes concernent les RAID 10, 50 et 60. Plusieurs facteurs entrent alors en ligne de compte :

Quel est le nombre de disque ? Si c’est moins d’une dizaine, laissez gérer l’OS,
Quelle est la charge du serveur ? Si le serveur doit être amené à affronter des pics, autant déléguer la gestion du RAID à un carte,
Les disques vont-t-ils être fortement sollicités ? Si le serveur travaille surtout avec la RAM et que les lectures/écritures sont occasionelles, de même, ne vous embêtez pas avec du harware.

Défaillance des disques

Bien que les disques durs soient des périphériques très fiables, la panne n’est jamais très loin et il est inévitable qu’en vieillissant, vos disques finissent pas montrer des signes de faiblesse.

Ainsi, dans la première année de fonctionnement, un disque a 3% de chance de défaillir et cette proportion augmente nécessairement avec le temps. Avec sept disques sur une machine, vous avez 7% de chance d’en voir un lâcher la première année et au bout de la quatrième année, il est presque certain de rencontrer une panne sur un des périphériques. D’où l’utilité des niveaux de RAID avec redondance.

Sachez aussi que depuis quelques années, il est devenu assez courant d’utiliser des disques SSD dans les RAID. Ces disques apportent des temps de reconstruction bien inférieur ainsi que des taux d’erreur en lecture bien plus faible. Cependant, ils sont aussi leurs faiblesses et on n’est jamais à l’abris d’une défaillance du contrôleur. N’hésitez pas à consulter ce post ServerFault [en] pour en savoir plus.

Il est d’une part conseillé de surveiller l’état du RAID et des disques, et d’autre part, de savoir quoi faire pour le remettre en état (sinon, ça ne sert à rien…). Je vous explique tout cela dans mon article sur le diagnostique et la récupération d’une défaillance RAID.

PS : le RAID ne dispense pas de faire des sauvegardes !

Les RAID standards

Entrons dans le vif du sujet ! Voyons quels sont les différents niveaux de RAID existants et à quoi ils correspondent.

Avant de commencer, il est bien entendu possible de configurer un RAID avec des disques différents, mais il est néanmoins conseillé, si ce n’est d’avoir les même modèles de disques, d’avoir des disques de même capacité et ayant des taux de transferts similaires.

RAID 0

Celui ci est très simple à concevoir. Tous les disques (deux disques au minimum) de votre array (votre grappe de disques) sont combinés, on parle de stripping ou d’agrégation par bandes.

Il y a deux avantages relatifs à ce niveau de RAID : la disponibilité de 100% de l’espace disque et les performances. En effet, les disques constituent souvent un goulot d’étranglement car les transferts sont longs. En RAID 0, toutes vos données sont divisées (stripped) et réparties équitablement sur les disques.

Ainsi, si vous envoyez 1GB à stocker, 500MB vont aller sur le disque A et 500MB sur le disque B, en parallèle, on accélère donc les vitesses de transfert. De même en lecture, les disques accèdent à leur partie de l’information simultanément et l’envoient simultanément à la carte mère. De ce fait, si un des disques vient à défaillir, vous perdez l’ensemble des données !

Vous avez besoin de deux disques minimum pour un raid 0 et l’espace disponible est donc la capacité du plus petits des disques de la grappe multiplié par le nombre de disques.

RAID 1

Ce type de RAID est aussi très aisé à appréhender. Le RAID 1 est aussi appelé mirroring car l’ensemble des données est écrit simultanément sur l’ensemble des disques. Vous n’avez donc aucune amélioration de performances en écriture, une amélioration en lecture car plusieurs disques sont sollicités à la fois. L’avantage réside surtout dans le fait d’une très bonne tolérance aux pannes puisque si vous perdez un disque, il y en a toujours un autre qui contient les mêmes données. Cela a néanmoins un coût puisque vous “perdez” 50% de votre espace disque utilisable.

L’espace utilisable n’est ici que l’espace d’un seul des disques, et s’ils ne sont pas de la même taille, du plus petit d’entre eux.

RAID 5

Le RAID 5 est un compromis entre le RAID 0 et le RAID 1. Ce niveau de RAID fonctionne comme le RAID 0 dans la mesure où les données sont divisées et réparties sur plusieurs disques, mais il y a en plus une parité répartie. Le calcul de parité permet de récupérer l’ensemble des informations en cas de défaillance d’un disque.

Ainsi, si l’on perd un disque, il est possible de recréer l’ensemble des informations à partir des données restantes sur les n-1 disques et les parités réparties.

L’avantage, vous l’aurez compris, est que l’on bénéficie de bonnes performances, sans toutefois compromettre l’ensemble des données en cas de défaillance d’un disque contrairement au RAID 0. Enfin, on profite d’une tolérance à la perte d’un disque, sans toutefois limiter l’espace utilisable à l’espace du plus petit disque comme en RAID 1.

Néanmoins, il faut savoir qu’en cas de perte d’un disque, le temps nécessaire pour reconstituer la grappe (temps de calcul et d’écriture des données manquantes à partir des parités réparties) n’est pas négligeable. Pour un disque de 1TB, cela peut représenter une dizaine d’heures. Cependant, le système reste utilisable pendant le temps de reconstruction, même s’il est ralentit.

En outre, les probabilités montrent que l’on a de plus grandes chances de perdre un second disque dès lors qu’un premier vient de lâcher. De nombreux facteurs entrent en jeux, mais il y en a deux d’évidents :

Si les disques ont le même nombre d’heures de fonctionnement et sont les mêmes, il est probable que les pannes surviennent après un nombre d’heures d’utilisation similaire,
Lorsqu’un disque vient à défaillir, les disques restants sont fortement sollicités pour reconstruire l’array. Si l’un des disques restant montre des faiblesses, il est possible que cette sollicitation lui fasse rendre l’âme.

Enfin, les disques durs actuels ont un taux d’erreur de lecture (URE). Cela signifie qu’il peut y avoir certaines données qui seront illisibles sur le disque. En d’autres termes, quelque soit la cause de cette erreur, les disques échoueront à lire certains bits.

Les constructeurs estiment le taux d’erreurs. Ce dernier est en général de l’ordre d’une erreur tous les 10^14bits donc d’une erreur tous les 12,5TB. Certains disques à usage professionnel ont des taux d’erreur plus bas, de l’ordre de 10^16 bits.

Tentons donc d’appréhender les chances d’avoir une reconstruction sans erreur de votre RAID 5. Nous appliquerons la formule suivante où P est la probabilité de reconstituer l’array, N le nombre de disques et S la taille de ces derniers : P=(1-10^-14)8 x 10⁹ x N x S. Faites une estimation de la probabilité de reconstitution de votre array ci-dessous :

Nombre de disques :

Taille des disques (en GB) :

Pour calculer l’espace utile utilisable, la formule est assez simple. Pour N représentant le nombre de disques et S la taille des disques (ou du plus petit s’ils sont de tailles différentes), l’espace utilisable correspond à (N-1) x S :

Nombre de disques :

Taille des disques (en GB) :

RAID 6

Le RAID 6 est une évolution du RAID 5. Il fonctionne de la même manière, mais permet de supporter la perte de deux disques grace à une double parité.

Le RAID 6 offre donc une plus grande redondance au détriment de l’espace de stockage puisque l’on “perd” l’équivalent de deux disques en espace de stockage. À cela s’ajoute deux défauts majeurs :

Une vitesse d’écriture moindre par rapport au RAID 5 due à des calculs de parité plus complexes,
Un temps de reconstruction de l’array très élevé en cas de défaillance de deux disques.

Le RAID 6 nécessite un minimum de quatre disques et l’espace utile est de (N-2) x S où N est le nombre de disques et S la taille de ceux-ci. Calculez l’espace avec le calculateur ci-dessous :

Nombre de disques :

Taille des disques (en GB) :

Les niveaux de RAID combinés

Les niveaux de RAID combinés sont simplement l’association de deux RAID simples à la fois, sur deux niveaux. La notation est à deux chiffres; le premier indique le niveau de RAID des grappes, et le second correspond au niveau global inter-grappes.

RAID 01

Les grappes sont donc en RAID 0 et celles-ci sont ensuite en mirroring. Cela requiert un minimum de quatre disques. On obtient de bonnes performances et une forte redondance, mais le ratio espace/redondance, et par conséquent prix/redondance est très élevé. Ce niveau de RAID est donc peu utilisé.

Pour caluler l’espace utilisable, la formule correspond à N x S où N est le nombre de disque par grappe et S la capacité des disques.

Sa fiabilité est relativement faible puisque le défaut d’un disque entraine le défaut de toute la grappe. Par conséquent, deux disques défectueux : un dans la grappe A et un dans la grappe B rendent l’ensemble du système inopérant.

Sont principal avantage est qu’il permet de facilement avoir des snapshots physiques : dans un système à trois grappes ou plus, le retrait d’une grappe complète permet d’avoir un instantané du système au moment t.

RAID 10

Ce niveau est l’inverse du précédent. On procède d’abords au mirroring et ensuite au stripping. Il nécessite, tout comme le RAID 01, quatre disques au minimim. L’avantage est que l’on doit avoir un défaut sur tous les éléments d’une grappe pour mettre en défaut le RAID dans son ensemble. Par ailleurs, la reconstruction est assez rapide. On perd cependant au minimum 50% de l’espace de stockage. Puisque le calcul de capacité pour le RAID 10 est le suivant G x S où G est le nombre de grappe et S la capacité d’un disque.

Bien que semblable au RAID 01, le RAID 10 est par conséquent bien plus fiable.

RAID 50

Ce niveau de RAID, tout comme son ainé le RAID 5 est très utilisé car il présente un bon compromis performances/espace/fiabilité. Les grappes sont donc des grappes en RAID 5 et celles-ci sont ensuite strippées en RAID 0.

Ce niveau de RAID permet de jouer sur le taux de redondance et l’espace. En effet, nous avons vu qu’un RAID 5 requiert un minimum de trois disques et permet la perte d’un disque en monopolisant l’équivalent de l’espace d’un disque pour les calculs de redondance.

Cela signifie que sur une grappe, il est possible de mettre plus de trois disques. Avec douze disques par exemple, on peut imaginer constituer quatre grappes de trois disques, ou trois grappes de quatre disques.

Dans le premier cas, l’espace d’un disque par grappe est requis pour la parité, soit quatre fois la capacité d’un disque; dans le second cas, on ne “perd” que l’équivalent de trois disques. Cependant, le premier système permet la perte de jusqu’à quatre disque (un par grappe), tandis que le second ne peut en perdre que trois.

En outre, plus le nombre de disques par grappe est grand, plus la probabilité de perdre deux disques dans la même grappe est élevée. Enfin, comme expliqué pour le RAID 5, plus une grappe est volumineuse en espace disque, plus la probabilité de reconstituer l’array diminue…

Il faut aussi considérer l’aspect performances. Étant donné que chaque grappe consitue un élément du RAID 0, plus on a de grappes, plus grande sera la parallélisation pour les lectures écritures de données. Le système gagnera donc en rapidité… Que de compromis n’est-ce pas ?

Le calcul de l’espace dépend donc pour le RAID 5 du nombre de disques par grappe. La formule est (N-G) x S où N correspond au nombre total de disques, G le nombre de grappes et S la capacité des diques. Estimez l’espace utile de votre RAID 50 :

Nombre de disques :

Nombre de grappes :

Taille des disques (en GB) :

RAID 60

Le RAID 60 est très similaire au RAID 50. Il fonctionne de la même manière à cela près que les grappes sont en RAID 6 au lieux d’être en RAID 5. Il permet donc la perte de plus de disques avec une redondance plus grande, mais de moins bonnes performances et moins d’espace.

Il requiert un minimum de huit disques et la formule pour calculer l’espace utilisable est (N-2 x G) x S :

Nombre de disques :

Nombre de grappes :

Taille des disques (en GB) :

Nous avons donc fait le tour des niveaux de RAID les plus répandus et ce que qu’ils impliquent. Il ne vous reste donc plus qu’à effectuer un choix en adéquation avec votre utilisation. Sachez que c’est même possible de mettre ça en place dans certains PC portables !

Et vous, quelle est votre expérience avec le RAID ? Des problèmes rencontrés, des données sauvées ?

Commentaires

xavier dit –

August 5, 2015

Excellent tuto et en français

Merci !

Buzut dit –

August 5, 2015

Merci de ton commentaire Xavier :)

bosley dit –

January 20, 2016

merci beaucoup!!!!!

Marck dit –

September 21, 2017

Hei, je voudrais mettre en place un raid sur mon portable mais lequel? Pour l'istant j'ai windows sur un ssd msata de 120 GB et le Raid 1 (mirror) avec 2 disques de 500 GB... Mon iddée est de tout réinstaller (après avoir sécurisé toutes mes données existantes), pour ce faire j'imaginais upgrader un disque pour un 750 GB et le ssd msata pour un 250 GB... Voyez vous où j'aimerais en venir, créer un raid 0 avec le disque de 500 gb et le ssd msata de 250 GB (donc total de 750GB) et combinner avec cela un raid 1 grâce au disque de 750... Donc le Raid 01 me conviendrait au mieux mais j'ai pu lire que le Raid 01 requiert un minimum de 4 disques, ai je bien tout compris ou mon bien mon idéee est elle réalisable? Je suis sur un Dell M6600... Merci de votre attention, bien à vous, Marck

Buzut dit –

September 23, 2017

Bonjour Marck,

Je vous bien ou tu veux en venir. Dans l'idée, ça fonctionne. Cela dit, le RAID 01 représente deux RAID 0 en RAID 1. Est-ce que mdadm (si tu es sous Linux) te laissera faire ça… C'est une autre question.

Tu peux également regarder du côté des systèmes de fichiers qui intègrent directement le RAID. Il est possible que tu arrives à un montage qui te convienne.

Une dernière solution serait d'avoir un RAID 0 avec le SSD et le HD de 500GB et de faire du mirroring du RAID 0 sur ton disque de 750GB. Tu ne profiteras pas d'une amélioration du RAID 1 en vitesse de lecture, mais en écriture tu seras plus performant (la vitesse de l'ensemble étant celle de l’élément le plus lent dans un RAID 1). Et tu auras l'assurance d'être backupé !

Tiens nous au courant, c'est un cas assez intéressant.

Marc Lignieres dit –

August 14, 2018

Excellente explication, claire et concise. Merci

Mike dit –

August 17, 2018

Bonjour, J'ai mis un Nas en route en Raid 5 3x4to. Cela fait 1 journée que le disque est en synchronisation. Est-ce normal ?

Buzut dit –

August 19, 2018

Bonjour, selon la puissance du NAS et la vitesse des disque, cela peut prendre un temps conséquent. Avez-vous un indicateur de progression ?

Daniel dit –

September 6, 2018

Bonjour,

Que pensez-vous de la technologie des instantanés ? Je dois passer d'un NAS 4 baies qui a atteint ses limites en capacité (6 To atteints en raid 5) à un nas 2 baies en RAID 1 à l'origine (2 x 12 To) mais qui propose la technologie des instantanés par blocs (Qnap TS-231P2) ce qui me permettrait de récupérer l'espace perdu du Raid 1. Merci pour votre réponse.

Buzut dit –

September 7, 2018

Je ne connaissais pas ce système et ne l'ai donc jamais testé. C'est un système proprio d'après ce que QNAP explique. Rien de mieux qu'un test grandeur nature afin de voir si ça fonctionne comme annoncé. Il est dit "QNAP developed its ext4-based snapshot technology that stores changed data “outside of the volume”". Où donc est stocké ce snapshot ? Je ne suis pas certain de bien saisir !

Arnaud dit –

September 12, 2018

Bonjour est il possible de faire du raid avec 6 disque de 6To? merci

Buzut dit –

September 12, 2018

Oui tu peux faire du RAID sans problème. Pour un RAID simple, je te conseille un RAID 6, lequel est le plus adapté à ta configuration (6*6TB).

Nara dit –

October 19, 2018

Bonjour, un bel exemple de vulgarisation d'un sujet pas limpide a priori. La probabilité de panne simultanée est évidement accrue par l'achat simultané des disques lors de la création d'un NAS ou d'un dispositif RAID. Par conséquent, - l'achat d'un NAS clé en main (le fabricant propose son boitier + n disques) doit comporter ce biais d'emblée, non ? - dans le cas où l'on monte son propre NAS, de combien de temps doit-on en moyenne espace l'achat des disques durs pour se prémunir un peu plus de ce type de risque ? Merci.

Buzut dit –

October 25, 2018

Bonjour et désolé de la réponse tardive ! Le meilleur moyen de se prémunir de ce biais est d'acquérir des disques de marques différentes.

mario rpg dit –

April 19, 2019

Bonjour, J'aimerai faire un 4 x 12 tb et avoir le maximum de storage disponible, donc plutôt raid 5 j'imagine?

Buzut dit –

September 28, 2019

Bonjour, J'arrive un peu après la guère… Pour des disques de cette taille, je partirai tout de même plutôt sur un Raid6. On sacrifie un peu d'espace au prix d'une sécurité des données plus importante.

senal dit –

April 29, 2019

Vraiment merci pour votre générosité!

capitaine dit –

June 6, 2019

bonjour je veux savoir quel Raid choisir pour un system deja existant sans toucher les données du system windows 2012srv

Ulysse dit –

May 22, 2020

Merci beaucoup, description parfaite

maximilien dit –

July 20, 2020

Bonjour je suis en train de me configurer un microserver HPE, je lui mets 4*4To, il est préférable raid 5 ou 10? il est sous win server 2019 et c'est essentiellement pour stocker mes bibliothèques professionnelle, et des serveurs de licences.

Buzut dit –

July 21, 2020

Sur du 4To le raid 5 sera trop risqué lors de la perte d’un disque. Le 10 ou le 6 sont plus adaptés.

maximilien dit –

July 21, 2020

super merci de votre réponse.

maximilien dit –

August 26, 2020

Re bonjour une fois le raid installé, et il intéressant de partitionner les disques pour du partage ou plutôt créer des dossiers partagés? Maximilien

Th3ddy dit –

August 3, 2020

Bonjour à tous,

J'espère trouver réponse à mes questions. Surtout sur la partie Raid. J'ai différent HDD pour différentes utilisations et donc ... La question est quel Raid conviendra le mieux ... !?

Avant de faire le listing, voici ma config matériel :

Intel(R) Core(TM) i3 CPU 550 @ 3.20GHz 16Go de RAM Carte PCIe 10 ports SATA 3 6GBps sur port 2x https://www.amazon.fr/gp/product/B01ENKHLS6/ref=ppx_yo_dt_b_asin_title_o04_s00?ie=UTF8&psc=1

J'ai 2 HDD de 10To chacun que je compte mettre en RAID0 (STRIPPE). Uniquement du stockage pour mes films. Pas besoin de protéction des données. Utiliser pour le serveur PLEX. Y voyez-vous des suggestions ? Des conseils ? ...

J'ai 8 HDD de 6To chacun que je compte utiliser pour mes données peronnelles et donc avec protéction de celles-ci. J'aurai un backup quotidien des données vers un NAS SYNOLOGY DS918+ avec 16 To en RAID SHR avec une tolérance de panne sur 1 disque.

Questions :

Quel RAID utiliser sur FreeNAS ? Raid Standard ou Raid Combinés ? Une tolérance de panne sur 1 ou 2 disques ? Y voyez-vous des suggestions ? Des conseils ? ...

J'ai 1 disque de 2 To dédié aux plugins !

J'ai 1 SSD de 240 Go dédié au système !

Ceci est un NAS domestique qui me servira de stockage en priorité et il sera le cloud des membres de ma famille à l'extérieur pour leurs données personelles.

D'avance, merci pour vos retours ;) !

Th3ddy

KevinDA dit –

December 9, 2020

Bonjour, j'ai 2 disque dur de 8 to. J'aimerai faire un disque miroir de l'un vers l'autre. Quelle RAID utilisé ? Car le RAID 1 est limité a 1 to.

Buzut dit –

December 10, 2020

Je ne crois pas que le RAID 1 soit limité. Il s'agit peut être plutôt d'un problème de système de fichier (bien utiliser GPT comme table de partitions).

S'il s'agit de cela, cet article peut donner les bonnes pistes.

Peichan dit –

February 16, 2021

Je dois faire un disque dur de retrogaming (jusqu'à la PS3) Apparemment, il est recommandé de prendre un 7400t/min Le souci, c'est qu'en raid 1, ca coutre cher. j'ai trouvé mybook duo mais il comprends du 5400t/min Est ce que la lecture en raid 1 double la performance de lecture ? (du coup mieux que du 7400 t/min)?

Buzut dit –

February 16, 2021

Tu auras une amélioration en lecture (si tu bus SATA le supporte), mais pas en écriture.

Peichan dit –

February 17, 2021

D'accord merci. Je ne vais pas tenter le coup alors, ça me coûterait trop cher si ça ne fonctionne pas.

manepape dit –

January 4, 2022

Bonjour, en ajoutant du cache ssd ou nvme sur un raid 6, cela améliorera-t-il la vitesse écriture avec une carte réseau de 10 GB. Ou quel raid me conseillez-vous avec cette config sans sacrifier trop d'espace. L'utilisation est pour de la sauvegarde de photo de famille, vidéo et backup de jeux.

cpu: i5-8500 Carte mere : GIGABYTE B365M-DS3H Ram: 16 GB Carte raid : LSI 9211-8I HDD : 6x3TB peut aller jusqu'à 8x3TB Carte Réseau: X520-DA1 - 82599EN 10Gbit PCI Express x8

Software ou hardware

Défaillance des disques

Les RAID standards

RAID 0

RAID 1

RAID 5

RAID 6

Les niveaux de RAID combinés

RAID 01

RAID 10

RAID 50

RAID 60

Commentaires

Rejoignez la discussion !