Alte HDD stirbt während Raiderweiterung... Raiderweiterung läuft trotzdem weiter > Normal?

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
Hallo zusammen,

heute Nacht hat Murphys-Law sich mal wieder in all seiner Erbarmungslosigkeit präsentiert

Nach abgeschlossenen 83.x% der Erweiterung meines Raid5 hat eine der alten HDDs angefangen zu sterben.
(Sektorenfehler, E/A Fehler)

Bildschirmfoto 2020-09-19 um 10.34.36.png

Die Erweiterung lief zwar noch weiter aber nur noch extrem langsam - ca. 0,1%/h

Bildschirmfoto 2020-09-19 um 10.43.09.png

Ein Backup ist vorhanden also habe ich die Kiste mal bis jetzt weiterlaufen lassen - Mehr als endgültig "sterben" kann das Volume ja nicht.
Heute morgen war das Bild unverändert. Die Erweiterung lief immer noch "langsam", die DS hat weiterhin mit Sektorenfehler um sich geworfen.
Zugriff auf das DSM war extrem zäh und die Netzlaufwerke hatten Timeouts ohne Ende.

Gut! Thema war zu diesem Zeitpunkt für mich gegessen. Wäre jetzt direkt in den nächsten Cyberport gefahren, hätte ne Ersatzplatte geholt und anschließend das Volume aus dem Backup neu aufgebaut...

Jetzt gab es folgende Änderung weswegen ich diesen Thread überhaupt erstelle:

Das defekte Laufwerk wird zwar weiterhin bei den HDDs gelistet. Jedoch ist die Platte aus dem Volume verschwunden.
Die Erweiterung läuft nun wieder mit halbwegs normaler Geschwindigkeit (ca. 150-200MB/sek - vorher um die 300MB/sek). DSM und die Netzlaufwerke reagieren gewohnt flüssig.

Bildschirmfoto 2020-09-19 um 12.16.18.png

Nun meine Fragen:
Was macht die DS jetzt gerade?
Wurde das defekte Laufwerk 7 systemseitig endgültig als "Tod" deklariert und die Erweiterung wird mittels der Paritätsdaten (Laufwerk 1-6) regulär zu Ende gerechnet?
Was wird am Ende rauskommen? Eine erfolgreiche Erweiterung des Speicherpools welches dann direkt degenerated ist wegen dem fehlenden Laufwerk 7?

Hatte jemand schon mal solche Probleme bzw. Erfahrungswerte mit diesem Problem?

Danke schonmal für euer Feedback zu dem Thema.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.263
Punkte für Reaktionen
895
Punkte
268
das ist doch wie wenn du einfach eine Platter verlierst und durch andere ersetzest.
Dazu ist doch Raid da. Es waren vorher 7 und sind es auch wieder.
Falls die defekte noch unter HDD erscheint, dann kann man dort vielleicht noch die SMART Werte schauen, dann wird auch klar warum die raus ist.
 

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
Das geht auch während der Erweiterung des Raidverbundes?
Technisch gesehen sind ja 83% der Daten auf 8 Platten und 17% auf 7 Platten verteilt.

Bin immer davon ausgegangen, dass wenn während der Erweiterung was "passiert" direkt GAME OVER ist.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.981
Punkte für Reaktionen
619
Punkte
484
Game Ober ist nur, wenn während eines Rebuilds (weil schon eine Platte ausgestiegen war) eine weitere Platte sirbt.
Bei der Erweiterung geht ja erstmal nichts verloren, wenn eine Platte stirbt.
Wenn der DSM das dann mitbekommt, wird zur Erweiterung offenbar parallel das Rebuild durchgeführt. Eigentlich eine gute Sache, dass das offenbar funktioniert.
Berichte bitte auch, was am Ende genau rausgekommen ist!
 

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
Ja werde dann morgen auf jeden Fall berichten was bei rausgekommen ist.
Rechnerisch müsste die Erweiterung in ca. 16h durch sein.
Werd jetzt erstmal die neue 12er holen um dann ggf. den Rebuild morgen direkt starten zu können.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.981
Punkte für Reaktionen
619
Punkte
484
Du meinst die Erweiterung. Der Rebuild scheint ja jetzt zu laufen.
 

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
Na laut DSM läuft ja die "Erweiterung" momentan normal weiter.
Bildschirmfoto 2020-09-19 um 13.42.46.png
Meine Vermutung wäre jetzt, dass das DSM die fehlende Platte für die ausstehenden 17% "simuliert" und so regulär den Pool auf 8 Platten erweitert.
Nach dem Abschluss ist ein "kritisches" Volume mit ±71TB das Ergebnis, bei dem eine Platte degenerated ist .

Anschließend wird morgen der Rebuild gestartet sobald LW7 durch die neue HDD ersetzt wird.

Außer wir sprechen grad aneinander vorbei :)
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.981
Punkte für Reaktionen
619
Punkte
484
Schauen wir mal, was morgen dort steht. Mit einer defekten Platte kann jetzt eigentlich keine Erweiterung mehr stattfinden.
 

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
Das Fazit kann ich nun doch schneller liefern als erwartet:

Die Erweiterung lief normal bis 100% durch. Abschließend ist der Alarm in der DS losgegangen und der Zustand des Volumes ist auf Fehlerhaft gewechselt.

DSM liefert folgende Meldungen:

Bildschirmfoto 2020-09-19 um 21.50.18.png

Bildschirmfoto 2020-09-19 um 21.51.18.png

Also interessant finde ich, das im Speicherpool die Kapazität auf 76TB erweitert wurde - Jedoch weiterhin die alte Menge verfügbar ist:

Bildschirmfoto 2020-09-19 um 21.59.13.png

Leider hats nicht mehr geklappt mit dem besorgen einer Ersatzplatte - Musste nun leider doch eine bestellen und mit dem Rebuild auf Dienstag warten.

Werde dann auf jeden Fall weiter berichten
 
  • Like
Reaktionen: ottosykora

tschortsch

Benutzer
Mitglied seit
16. Dez 2008
Beiträge
1.644
Punkte für Reaktionen
34
Punkte
74
In der Regel erweitert sich nur der Speicherpool, das Volumen musst du selbst erweitern. Du könntest ja auch zb eine zweites Volumen erstelle in dem freien Speicher des Speicherpools. Das weiß die DS na nicht ausser sie kann Gedankenlesen.
Die Volumenerweiterung würde ich aber erst dann anstoßen wenn wenn du die Ersatzplatte eingebaut hast und das RAID repariert ist. Den bisher ist am Volumen selbst noch nichts verändert geworden.
 

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.563
Punkte für Reaktionen
1.430
Punkte
288
Wenn man sich die Angaben im Speichermanager ansieht, so ist der komplette Speicherplatz dem Volumen zugeordnet, das Volumen aber noch nicht angepasst. Das dürfte wegen der ausgefallenen Platte unterblieben sein.
 

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
So ein kurzes Update:

Heute ist endlich die neue Ironwolf geliefert worden.
Reparatur des Pools hat begonnen und läuft gerade mit ±100MB/sek.
Bildschirmfoto 2020-09-23 um 18.26.36.png

Wenn das System die Geschwindigkeit hält dürfte der Rebuild in ca.28h durch sein.
 
  • Like
Reaktionen: ottosykora

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.263
Punkte für Reaktionen
895
Punkte
268
@Tatsuki
gute Berichterstattung
man lernt immer wieder was neues

vor allem weil es sehr selten vorkommt, dass man so was erlebt
 

Tatsuki

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
55
Punkte für Reaktionen
2
Punkte
8
So heute Nacht ist der Rebuild nun erfolgreich abgeschlossen worden.
Speicherpool ist jetzt im ordnungsgemäßen Zustand und das Volume wurde automatisch um die 12TB erweitert.

@ottosykora
Eigentlich hätte ich auf den "Stress" ja gerne verzichten können aber auf der anderen Seite sieht man so auch mal, dass der (Kosten)-Aufwand mit Raid für Ausfallsicherheit und Backup für den Worst Case nicht umsonst ist.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.263
Punkte für Reaktionen
895
Punkte
268
und wie man sieht gibt es noch viele undokumentierte Problemsituationen die nur schwer nachzubilden sind.
Ich finde es sehr gut, dass du die Geduld aufgebracht hast hier wirklich life zu klären wie sich so was verhält.
Dafür einen grossen Dank!
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat