Hot-Spare übernimmt wann?

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
Wir haben bei einer Aussenstelle eine neue DS420+ mit 4x WD80EFAX-68KNBN0

Läuft etwa 1 Monat, jedoch ist die HD1 wohl in der 'Badewannenkurve' und meldet heute über 200 def Sectoren.

Bei der Installation haben wir jedoch eine der Platten als hot-spare konfiguriert.
Weiss jemand ab wann, also ab welchem Grad von Schaden die hot-spare übernimmt?
Was passiert mit der defekten? Wird die aus dem pool rausgeschmissen oder was?

Wenn ich dann eine neue Platte vor Ort habe, kann ich diese wieder zu hot-spare machen?
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.008
Punkte für Reaktionen
2.700
Punkte
423
Ich hab hier schon irgendwo gelesen, dass die Hotspare erst sehr spät automatisch übernimmt, also erst nach dem Komplett-Ausfall oder dem Entfernen einer Platte und nicht schon bei ersten Lesefehlern. Über Fernwartung und mdadm lässt sich das natürlich forcieren. Eigene Erfahrungen habe ich allerdings nicht.
Nach dem Austausch der defekten Platte kann man die dann wieder zur Hotspare machen.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
OK, dann warte ich halt vorerst. Momentan habe ich da sehr viel raw read errors und die bad sec steigen. Waren gestern 18, heute 25 und 200 pending. Es sind nicht sehr viel Daten drauf, ca 600gb. Ca 1000h erst.
Backups gibt es mindestens 2 so weit.
Platte habe ich bestellt, aber die DS ist wie so vieles bei mir auf der anderen Seite der Welt, kann nicht einmal Bestellung beim grossen Fluss machen dorthin, also muss ich nur beten dass alles gut wird.


Also über mdadm was remote bei unsicherer Internet Verbindung versuche ich nichts. Aber kann man im Fall wenn nötig via den Storage Manager machen? Also die HD welche jetzt als spare läuft in das srorage pool 1 schieben? Und die kranke HD1 wegnehmen aus dem Pool?
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.008
Punkte für Reaktionen
2.700
Punkte
423
Aber kann man im Fall wenn nötig via den Storage Manager machen?
Ja. Ich denke die Aktion "Deaktivieren" unter HDD/SDD im Speicher-Manager ist dafür da. Die Hotspare müsste dann übernehmen.

Falls es dich interessiert, ich habe kürzlich mit einer Ubuntu-VM mit Raid5 und Hotspare etwas rumgespielt. sda ist dort das System, sdb-e 4 kleine logische 1GB-Platten
Code:
# Raid5 erstellen
mdadm --create /dev/md0 --level=5 --raid-devices=3 /dev/sdb /dev/sdc /dev/sdd
# ... formatieren
mkfs.ext4 /dev/md0
# ... und mounten
mkdir /volume1
mount /dev/md0 /volume1
# Hot Spare hinzufügen
mdadm /dev/md0 --add /dev/sde
# Fail simulieren, Hot Spare übernimmt
mdadm --fail /dev/md0 /dev/sdd
#... entfernen
mdadm --remove /dev/md0 /dev/sdd
#... und wieder hinzufügen, sdd ist jetzt die Hot Spare
mdadm --add /dev/md0 /dev/sdd
# erneut umschalten, sdd übernimmt wieder, Hot Spare entfernen
mdadm --fail /dev/md0 /dev/sde
mdadm --remove /dev/md0 /dev/sde
mdadm --zero-superblock /dev/sde
so wird das im Prinzip auch auf der DS laufen, nur halt nicht mit rohen Festplatten, sondern mit Partitionen.
 
  • Like
Reaktionen: ottosykora

blurrrr

Benutzer
Sehr erfahren
Mitglied seit
23. Jan 2012
Beiträge
6.204
Punkte für Reaktionen
1.103
Punkte
248
Mahlzeit! Die Hotspare übernimmt erst, wenn die andere rausgeflogen ist.
 
  • Like
Reaktionen: ottosykora

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
und auf Grund von was fliegt die raus? Oder wie geht das vor sich? Was etwas macht die zum rausfliegen?

Platte ist bestellt, es wird noch dauern bis es dort ankommt.
Dann, wenn es noch mit der defekten läuft, einfach abstellen, defekte ziehen, neue einstecken. Wird danach die Reserve eingebunden und die neue kann ich dann zur neuen Reserve machen oder kann ich die neu eingesteckte mit üblicher repair zu das machen was die defekte war?
1+2 sind Volume1 (SHR), 3 ist der spare, 4 Volume2 (shr ohne Schutz)
 

blurrrr

Benutzer
Sehr erfahren
Mitglied seit
23. Jan 2012
Beiträge
6.204
Punkte für Reaktionen
1.103
Punkte
248
Ausmachen kannste machen, aber wenn das Ding Hotswap-fähig ist, einfach im laufenden Betrieb ziehen, Hotspare springt an, Rebuild läuft und die neue kannste dann als neue Hotspare definieren.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
Aha, dann einfach den Rebuild auf die existierende spare laufen lassen.
Mal sehen wie das wieder klappt, sind ja die humanitären dort am Werk

Danke, werde mich vielleicht melden wenn die Platte da ist
 
  • Like
Reaktionen: blurrrr

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
noch kleine Frage:
raw read schwankt zwischen 0 und vielleicht 250000. Also jedesmal wenn ich schaue, ist da wieder was anderes drin.
Deutet das auf was? Kopf defekt?

Sektoren sind weiter 200 pending und 25 offline
 

Kurt-oe1kyw

Benutzer
Sehr erfahren
Mitglied seit
10. Mai 2015
Beiträge
9.139
Punkte für Reaktionen
1.777
Punkte
314
auf Grund von was fliegt die raus? Oder wie geht das vor sich?
Ich hatte bisher nur eine einzige Platte welche DOA war.
Das wichtigste, ignoriert unbedingt die Anzeige im DSM bezüglich grüner Schrift und "Gut" / "Normal" usw. die HDD wird so lange sie sich irgendwie dreht als "Normal" / "Gut" angezeigt, erst wenn die wirklich "tot" ist, springt die Anzeige um!

Ablauf damals:
Neue, Originalverpackte HDD vom Händler vor Ort (also kein Postversand!) ausgepackt und verbaut. Schon die Geräuschkulisse war völlig abnormal!
Zustand im DSM "Gut" "in Ordnung" "Normal" (auf die HDD bezogen).
Nach ca. 20 Stunden war der SMART Test fertig:

wd_red_seek_error_20h.jpg

Die SMART Werte konnte ich fast im Minutentakt sehen wie die angestiegen sind und zwar extrem.
ABER Zustand immer noch "alles grün" alles gut.
Nach 42 Stunden war dann endgültig Schluss --> fatal error, DSM hat die Platte entfernt.

wd_red_10tb_seek_error.jpg

JETZT kam auch der erste Hinweis in rot "Problem mit HDD"....

Händler vor Ort hat mit dem obigen Ausdruck die HDD natürlich sofort gegen eine Neue ausgetauscht, also kein Einschicken zu WD oder so.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
Bei mir hat die Platte ca1400h. Das ist halt nach der bekannten Badewannen Kurve normal wenn hier was ausfällt. Es waren 8 Stück, verbaut in zwei 420+.

Die Sektoren haben sich alle in einem Tag angehäuft. So wie ich es sehe bei einem einzigen Ereignis. 225 sind es jetzt. Das ist bis jetzt stabil.
Allerdings Raw read (1) schwankt dauernd zwischen 0 und sehr grossen Zahlen, jedes mal wenn ich schaue, steht was anderes drin. Wundert mich einfach was dies rein technisch bedeutet?

( Ersatzplatte ist unterwegs, das wird aber noch mehrere Wochen dauern bis es ankommt. Ist weit am Land, ca 7000km von hier.)

Übrigens die 192, 193 sind bei den grösseren Platten immer gleich und zeigen offenbar keine wirklichen Werte. Ich wurde belehrt, dass dies ein FW Fehler in den grösseren HD ist.

Und ja, ich hatte schon defekte Platten, einmal eine DS voll konfiguriert, getestet alles, dann in ein weites Land gereist damit, alles gut verpackt. Dort beim ersten Start beeep, HD2 tot.
 

Mavalok2

Benutzer
Mitglied seit
05. Jun 2018
Beiträge
687
Punkte für Reaktionen
143
Punkte
69
Ist weit am Land, ca 7000km von hier.
Das Backup an einem anderen Standort zu haben ist genau das Richtige, aber sind 7'000 km nicht etwas übertrieben? :)
7'000 km Entfernung machen gewissen Teile der Administration doch etwas schwierig. Aber mit einer VPN Verbindung kann man heutzutage zum Glück schon sehr viel machen. Ich würde eine Webcam vor Ort platzieren. Dann müsste ein Festplattenaustausch per Anleitung eigentlich auch möglich sein. Wobei ... müsste ich dies mit meinem Chef machen, dann wäre es wohl einfacher das NAS gleich zum Fenster raus zu schmeißen. :)
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
Klar haben wir da VPN so lange überhaupt Verbindung besteht, Bandbreite ist nicht gross. Es war schon immer eine DS dort, nur wurde jetzt in März eine neue installiert. Vor dem Versand habe ich alles konfiguriert, bei allen Platten einen voll SMART gemacht, alles war bestens. Aber eben, die bekannte statistische Badewannen Kurve der Zuverlässigkeit Lehre hat bewiesen, dass sie immer noch ihre Gültigkeit hat und dies hier mit aller Macht verteidigt.

Interessant ist, an einem anderen Standort hatten wir eine DS918+ seit ca Okt20. Auch mit den gleichen Platten. Auch da meldete sich eine der Platten nach ca 6 Wochen ab. Genau die gleichen Platten Modelle. Auch hier wurde die DS komplett ersetzt, jetzt kann ich nur noch auch hier auf Notification warten und hoffen dass alles den Sommer überlebt.

Beim nächsten Projekt werde ich meine Vorgesetzten wohl zwingen müssen statt der normalen WD Plus, doch lieber zumindest die Pro Version zu nehmen.



Frage: kann es sein, dass die Plus Platten gar nicht in einem 4-bay betrieben werden sollen? Und nur die Pro Platten mit Vibration Sensoren dafü geeignet wären?
Bei uns sind das von 12 Platten (im 4-bay Gehäuse) 2 Stück die innerhalb von Wochen defekt sind.
 
Zuletzt bearbeitet:

Mavalok2

Benutzer
Mitglied seit
05. Jun 2018
Beiträge
687
Punkte für Reaktionen
143
Punkte
69
Die Pro Platten werden bei NAS mit 8-bay und mehr empfohlen und haben 5 Jahre Garantie.

Ich für meinen Teil halte nicht so viel von Hot-Spare. Ich ziehe RAID6 vor. Hot-Spare Platten könnten einen Standschaden bekommen. Hatte ich aus schon bei Reserve-Festplatten im Schrank. Einige Systeme lassen deshalb die Hot-Spare leer mit drehen. Dies tun meines Wissens zumindest die kleineren NAS nicht.
Dazu kommt man bei RAID6 nicht so schnell in der Stress, sollte mal eine Festplatte ausgefallen sein. In der Firma kann ich nicht immer alles fallen lassen nur weil sich gerade wieder mal einen Festplatte verabschiedet hat. Aber ohne Ausfallsicherheit ist es immer ein ungutes Gefühl.
Ausserdem soll laut Statistik häufe eine weitere Festplatte beim Rebuild ausfallen. Kann ich so jedoch nicht bestätigen. Mir ist noch nie beim oder unmittelbar nach einem Rebuild / Resync eines RAIDs eine weitere Festplatte ausgefallen.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.186
Punkte für Reaktionen
874
Punkte
268
Ja hot spare dreht da normal mit. Ist nicht zugeteilt. Wir haben 2 Volume, eines SHR(raid1) und eines ist SHR ohne Schutz. Die ohne Schutz ist für Kopien von Archiven, die jedoch noch extern auf USB Drives liegen. Die 4 ist dann spare. Alle Platten drehen, es gibt kein Hybernation oder so was.
Das ist weil ich weiss ein Ersatz vor Ort zu haben ist eine Angelegenheit von 1-2 Monaten. Die DS420+ macht das, eine Platte ist spare und soll wenn etwas nicht geht einspringen. Wir haben gegenwärtig nur wenig Daten drauf.

Ich habe eben gesehen dass die Pro bei 8-bay eingesetzt werden sollten. Denke jedoch es könnte auch bereits bei 4-bay nützlich sein diese Vibration Schutz.
 

EuroPC

Benutzer
Mitglied seit
05. Jan 2020
Beiträge
131
Punkte für Reaktionen
15
Punkte
18
Ich habe eben gesehen dass die Pro bei 8-bay eingesetzt werden sollten. Denke jedoch es könnte auch bereits bei 4-bay nützlich sein diese Vibration Schutz.
Denke ich auch. Und wenn ich die Kosten des Stresses dagegenreden, ist die pro sicher eine Überlegung wert.
 

Mavalok2

Benutzer
Mitglied seit
05. Jun 2018
Beiträge
687
Punkte für Reaktionen
143
Punkte
69
Beim großen plätscher Flüsschen 35.- Euro Preisunterschied zwischen RED und RED Pro bei einer 8 TB Ausführung. Eine Garantie, dass die Pro länger hält ist allerdings nicht inkludiert. Aber im Zweifelsfall würde ich in diesem Fall auch die Pro nehmen.
 
  • Like
Reaktionen: EuroPC

Sakurada

Benutzer
Mitglied seit
28. Mrz 2017
Beiträge
16
Punkte für Reaktionen
1
Punkte
3
Ich nutze bei mir im 1815+ immer die WD MyBook 8TB Platten. Den ersten Ausfall hatte ich gerade nach knapp 5 Jahren mit >37.000 Stunden.
Die Platten gibt es immer wieder mal für 129€, zurzeit laufen davon 14 Stück in meinem NAS ohne Probleme. Performanceunterschiede zur Red gibt es da nicht wirklich und für rund 100€ weniger durchaus eine gute Alternative.

Gruß
Sakurada

1620073267851.png
1620073294625.png
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat