Macht Raid(5) bei großen Festplatten überhaupt noch Sinn?

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

ElaCorp

Benutzer
Registriert
12. Mai 2015
Beiträge
1.088
Reaktionspunkte
109
Punkte
83
Hallo,

hab gerade gelesen und vo ChatGPT bestätigt bekommen, dass man kein NAS mit 4x20TB RAID5 machen sollte.
Das soll wohl bei Ausfall eine rPlatte nicht so gut sein, weil es dann nicht wieder aufgebaut werden kann.

Macht es da überhaupt noch Sinn auf Raid zu gehen? ja, wegen Ausfallsicherheit.
Aber wenn ich an einem anderen Ort eine Kopie habe, kann ich doch lieber die Kopie auf eine neue Platte einspielen, anstatt da über Tage zu versuchen dass was repariert oder wiederhergestellt wird.

Wie sehrt ihr das?
 
Ich weiß nicht, was genau Du die KI gefragt hast. Nur wieso sollte bei 4x20TB im RAID 5 das RAID nicht repariert werden können, wenn eine Platte ausfällt?
 
  • Like
Reaktionen: Skyhigh
Kurzfassung: Bei RAID5 (RAIDZ1) mit so großen Platten ist die Chance hoch, dass die Wiederherstellung wegen eines Unrecoverable Read Error (URE) scheitert – vor allem mit Consumer-/NAS-HDDs. Mit RAID6 (RAIDZ2) bist du deutlich sicherer.

4 × 20 TB (Rebuild liest ~60 TB) würde es zu 38,1 % nicht funktionieren. = Alle Daten weg.

4 × 24 TB (Rebuild liest ~72 TB) würde es zu 43,8 % nicht funktionieren. = Alle Daten weg.

Deswegen soll man Raid6 oder so verwenden. Aber das sind dann 2 von 4 platten nicht aktiv nutzbar für Dateien, sonderns als Ausfallrisiko.
 
Da ich nicht weiß, woher die KI diese Zahlen nimmt, kann ich dazu nichts sagen. Nur für diesen Desasterfall gibt es schließlich ein Backup. Also ich hätte da keine Bedenken.
 
  • Like
Reaktionen: Skyhigh
Irgendwie verstehe ich immer noch nicht ganz was du meinst.

Ein nicht wiederherstellbarer Lesefehler/Sektor ist für jedes Raid, bei egal wie viel Speicherplatz ein Problem.
Die Wahrscheinlichkeit, dass diese Sektoren aber auf allen 3 übrigen Platten auch defekt sind, ist eher unwahrscheinlich.

Wie @RichardB bereits sagte: dafür gibt es Backups
 
Ausfallsicherheit ist dann bei Raid5 mit 4 Einschüben und so großen Speichermengen, fast 50/50. Und wird mit steigender Speichermengen noch schlechter. Dadurch hat man keine Ausfallsicherheit. Dann kann man eher auf Raid verzichten um auf einen weiteren Nas an einem anderen Ort lieber die Spiegelung einzuspielen.

Ich bin auch gerade darauf gestoßen. Und verstehe so halb das ganze gerade.
 
Ausfallsicherheit ist dann bei Raid5 mit 4 Einschüben und so großen Speichermengen, fast 50/50.
Nö, die Ausfallsicherheit bei einem RAID 5 beträgt EINE Festplatte, egal ob Du 3, 4 oder mehr Platten hast und egal wie groß die sind.
 
Nö, die Ausfallsicherheit bei einem RAID 5 ... und egal wie groß die sind.
Das scheint so nicht zu stimmen. Was bringt mir Ausfallsicherheit wenn bei 4 x 24TB die Ausfallsicherheit nur mit der Wahrscheinlichkeit von 57% wieder hergestellt werden kann? Also bei ca. 2 NAS, wird eins zu 100% komplett nicht über das Raid wiederhertsellbar sein.?
 
Was bringt mir Ausfallsicherheit wenn bei 4 x 24TB die Ausfallsicherheit nur mit der Wahrscheinlichkeit von 57% wieder hergestellt werden kann?
Worauf genau basiert denn diese Aussage und vor allem die ominöse 57%-Angabe?

Wie @RichardB weiter oben schon korrekt geschrieben hat beträgt die Ausfallsicherheit bei einem RAID 5 genau eine Festplatte. Das steht so in jedem Lehrbuch und wer etwas anderes behauptet möge das bitte mal mit Fakten belegen.

Beim Ausfall einer Platte lässt sich also der Betrieb eines RAID 5 aufrechterhalten. Allerdings sollte umgehend die defekte Platte getauscht und keinerlei Last mehr auf das System gegeben werden bis der Rebuild abgeschlossen ist.

Worauf Du wahrscheinlich anspielst, ist die theoretische Möglichkeit, dass während des Rebuilds ein Unrecoverable Read Error (URE) auftritt und damit das verbliebene "Rumpf RAID 5 Array" unbrauchbar macht. Deine 57%-Angabe suggeriert, dass die Wahrscheinlichkeit eines URE während des Rebuils 43% beträgt ... das wage ich mal stark zu bezweifeln. Wie hoch die Wahrscheinlichkeit für einen URE während eines Rebuilds wirklich ist, kann ich nicht beurteilen. Aber rein aus dem Bauch denke ich mal, dass die Wahrscheinlichkeit dafür wesentlich geringer ist, auch wenn sie natürlich größer Null ist.

Eines sollte aber klar sein: Ein RAID 5 ist kein Backup, sondern schützt nur die Daten bei dem Ausfall einer Platte. und gibt Dir eine Option zum Handeln und die Möglichkeit weiterhin auf die Daten zuzugreifen wenn eine Platte gecrashed ist. Mehr nicht!

Ich musste zum Glück noch nie ein Rebuild eines RAID 5 Array durchführen. Daher habe ich keine Erfahrungswerte, was die Dauer des Rebuilds nach dem Tausch der defekten Platte betrifft (und den Bedarf an Blutdruck-Senkern während der Rebuild läuft). Vielleicht hat ja einer der Mitlesenden Erfahrungen gemacht und teilt diese mit uns.
 
also, ich habe gelesen, dass der "Unrecoverable Read Error" bei weniger TB pro Platte, deutlich geringer ist. Ab 10TB soll der aber exponentiell steigen was alles zu nichte macht. Bei 4x24TB ist er bei ca. 50%.

Bedeutet es, dass bei einem Ausfall lieber mit dem Rest weitergearbeitet werden kann, als das Raid5 wieder herzustellen? Dann lieber neu Platte rein um wieder die Stabilität zu bekommen?

So kann man das natürlich auch sehen.
 
Du wirst einfach nicht konkret! Aussagen wie "...ich habe gelesen..." oder "...soll der aber exponentiell steigen..." und wieder alles ohne Quellenangabe. Das klingt für mich nach Hörensagen aber nicht nach fundierten Erkenntnissen.

An dieser Stelle mache ich den Hoëcker und bin raus - es hat wenig Sinn, über Fakten zu diskutieren, wenn die Grundlagen von Deiner Seite konsequent falsch interpretiert und dargestellt werden. Ich überlasse dir also gerne die letzte Runde im Ring mit Deiner Version der Realität.
 
  • Like
Reaktionen: ElaCorp
Du wirst einfach nicht konkret! Aussagen wie "...ich habe gelesen..." oder "...soll der aber exponentiell steigen..." und wieder alles ohne Quellenangabe. Das klingt für mich nach Hörensagen aber nicht nach fundierten Erkenntnissen.
Quelle: Wikipedia ab "Statistische Fehlerrate bei großen Festplatten"
oder die ct oder hier wird es aus diskutiert.

EDIT: Und ich glaube, man kann sagen, dass ein Raid5 bei 4x20TB eine hohe Risikoentscheidung ist.
 
Zuletzt bearbeitet:
This whole "RAID 5 is not safe with large HDDs" rumour was created by 1 person's blog from 2007 and became viral... and today AI thinks it's fact. It's been debunked by people smarter than me. Here's just one blog debunking the "RAID 5 is not safe with large HDDs" https://heremystuff.wordpress.com/2020/08/25/the-case-of-the-12tb-ure/

The whole argument becomes a mute point because everyone has backups, right? And everyone knows RAID is not a backup. It provides speed and redundancy.
 
Zuletzt bearbeitet:
@ElaCorp : Du hast das Risiko immer bei einem Rebuild und in der Tendenz setzt ja niemand Platten kleine 2TB/3TB ein. Es geht immer mehr zu großen Platten. Wenn ICH den Artikel bei WikiPedia richtig verstanden, ich mag mich aber auch irren, geben die Hersteller URE so an, dass da mal ein Bit "kippen" kann. Somit steigt, logischer Weise, bei größeren Platten die Wahrscheinlichkeit, weil immer mit Datenmengen gerechnet wird. Und natürlich kann dann auch im Rebuild mal ein Bit kippen. Das bedeutet für mich aber nicht gleich, dass das ganze Rebuild nicht mehr funktioniert, sondern, dass die Möglichkeit steigt, dass beim Rebuild Bits "kippen". Aber es wird auch von zunehmenden Verschleiß und Alter im Artikel gesprochen und ganz ehrlich: Man muss die Platten ja meist tauschen, wenn sie erhöhtem Verschleiß unterlegen waren oder ein gewissen Alter haben. Logischer Weise steigt natürlich auch hier die erhöhte Fehlerrate.

Ich persönlich, aber wenn ich "nur noch" 2 RAID 1 habe, würde hier der KI und den gemachten Angaben (in %) nicht unbedingt vertrauen oder genauer recherchieren. Ich habe deine Angaben gestern in 12 Artikeln gesucht, aber keine %-Angabe gefunden. Und beim Rebuild (wie oben schon gesagt) sollte man sich halt Zeit lassen und möglich wenig oder keine Last auf dem System haben. Hier wäre dann auch die schnellere Rebuild Variante bei den Einstellungen im DSM zu hinterfragen.

Aber vielleicht sollten hier noch einmal Fakten hinterlegt werden, die auch belegen, wann/wie oft ein Rebuild scheitert oder hier nur "Bits kippen".
 
Und beim Rebuild (wie oben schon gesagt) sollte man sich halt Zeit lassen und möglich wenig oder keine Last auf dem System haben. Hier wäre dann auch die schnellere Rebuild Variante bei den Einstellungen im DSM zu hinterfragen.
Warum sollte man den Rebuild langsamer als nötig laufen lassen? Wenn man das RAID nicht zusätzlich belasten soll, ergibt es doch gar keinen Sinn den Rebuild mit angezogener Handbremse laufen zu lassen.
 
Zuletzt bearbeitet:
Hast du auch wieder recht. Hier habe ich mich schlecht ausgedrückt - sorry.
 
Hallo,

hab gerade gelesen und vo ChatGPT bestätigt bekommen, dass man kein NAS mit 4x20TB RAID5 machen sollte.
Das soll wohl bei Ausfall eine rPlatte nicht so gut sein, weil es dann nicht wieder aufgebaut werden kann.

Macht es da überhaupt noch Sinn auf Raid zu gehen? ja, wegen Ausfallsicherheit.
Aber wenn ich an einem anderen Ort eine Kopie habe, kann ich doch lieber die Kopie auf eine neue Platte einspielen, anstatt da über Tage zu versuchen dass was repariert oder wiederhergestellt wird.
Was sind denn die Alternativen? Wenn die Daten nicht auf eine HDD passen oder die Geschwindigkeit einer HDD nicht reicht?
Sicherlich gibt es mit den heutigen Implementierungen zu Raid 5 in den Systemen ein Risiko. Schon wegen der benötigten Zeit für eine Wiederherstellung des Raids, wenn eine HDD getauscht wurde oder eine weitere hinzugefügt wird.
Die Kapazität der HDDs wird größer und die Techniken wie mehrere HDDs in Pools / Volumes zusammengeschaltet werden, hat sich seit 40 Jahren kaum verändert. (Raid 5 gibt es seit ca. 1986, Raid 6 seit ca. 2001)
 
Daher habe ich keine Erfahrungswerte, was die Dauer des Rebuilds nach dem Tausch der defekten Platte betrifft (und den Bedarf an Blutdruck-Senkern während der Rebuild läuft).
Also dahingehend kann ich Entwarnung geben. Ich habe in meiner 1019+ bereits alle Platten im laufenden Betrieb durchgetauscht. 4 davon in einem Zug und die fünfte ca. 6 Monate später, weil ID 7 hochgegangen ist. Wie lange ein Rebuild gedauert hat, weiß ich nicht mehr genau. Ich habe am Abend eine getauscht und das System war immer irgendwann am nächsten Tag fertig (damals waren ca. 22TB an Daten vorhanden). Wirklich nervös war ich nur beim ersten Tausch, weil es schon eine Herausforderung ist, einfach eine Platte im laufenden Betrieb zu ziehen. Und das Piepen der DS, bis die neue drin und die Reparatur angestoßen ist, ist echt nervig. ;)
Probleme habe ich dabei nicht gehabt. Ich habe auch die Backup-Jobs die (damals) von der 218+ auf die 1019+ gelaufen sind und die von der 1019+ auf die 418play nicht ausgesetzt.
Was im Hintergrund sicher beruhigend war, waren die vorhandenen Backups. Ein Systemcrash bei einem der insgesamt 5 Rebuilds wäre kein Desaster, sondern nur sehr lästig gewesen. :cool:
 
Wirklich nervös war ich nur beim ersten Tausch, weil es schon eine Herausforderung ist, einfach eine Platte im laufenden Betrieb zu ziehen. Und das Piepen der DS, bis die neue drin und die Reparatur angestoßen ist, ist echt nervig. ;)
The beeping is stressful. But you can mute it in DSM (it will still beep next time there's a problem).
1756791733949.png
 
  • Like
Reaktionen: Skyhigh und RichardB
  • Like
Reaktionen: Annika Hansen

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat