DS415PLAY - Fehlerhaftes Raid5 läßt sich mit Austauschdisk nicht reparieren

Status
Für weitere Antworten geschlossen.

NoNameUser

Benutzer
Mitglied seit
06. Jan 2020
Beiträge
4
Punkte für Reaktionen
0
Punkte
0
Hallo liebe Community,

ich habe hier ein großes Problem. Folgende Sitation:

Am Wochende machte sich meine DS415Play (1 Volume, vier identische Disks WD Red 3TB) durch lautes Piepen auf sich aufmerksam, die Status Anteige blinkte gelb.

Beim Login in die DSM Web Gui wurde ein Fehler "An i/o error occured on drive 3" angezeigt.

Der Speicherpool zeigte "Fehlerhaft" an und unter SSD/HDD wurde für die Disk 3 "schwer fehlerhaft" angezeigt.

Siehe hierzu auch beigefügte Screenshots.

So weit so gut, so weit so schlecht. Jetzt komme ich zu den eigentlichen Problemen:

1. Trotz wöchentlicher SMART-Tests (einfach) und monatlicher SMART-Tests (erweitert) auf allen Disks, trotz funktionierender Emailbenachrichtigung bei Fehlern hierzu, erschien die erste Meldung zu einem DIskproblem erst mit dem Login an der GSM GUI am vergangenen Smastag. Ein Blick in die detaillierten SMART-Logs zeigte jedoch, dass eben genau dieser i/o Fehler und Meldungen wie "Drive 3 failing" erstmals am 03.08.2019 detektiert, und seither hundertfach und allwöchentlich detektiert wurde! Großes Staunen, großes Entsetzen und deshalb die Frage: WESHALB BEKOMME ICH ERST AM 04.01.2020 AUFGRUND EINER AKUSTISCHEN WARNUNG DIESEN FEHLER ANGEZEIGT. Zwischenzeitlich wurden sogar noch DSM Updates eingespielt, ohne das der oder die Fehler in irgendeiner Form gemeldet wurden, sie sind einzig in den detaillierten Logs der SMART-Test aufgelistet, jedoch nicht in der Systemübersicht oder an anderer Stelle, wo ich es bei solch schweren Fehlern erwarten würde.

2. Ich habe mir heute eine identische Austauschdisk gekauft, selber Hersteller, selber Typ, selbe Größe, aber egal was ich versuche, das Raid 5 lässt sich nicht reparieren.

Hot-Swap (Disk tauschen) und "Reparieren" führte zu einem "Reparieren fehlgeschlagen" mit nachfolgendem Volume-Crash und es wurden nur noch zwei der vier DIsk erkannt. Der erneute EInbau der defekten DIsk stellte glücklicherweise den ursprünglichen Zustand wieder her: "Speicherpool fehlerhaft", es werden vier Disks erkannt, eine davon "Fehlerhaft". Ich habe dann die neu gekaufte DIsk bei ausgeschaltetem SYstem eingebaut und die DS415PLAY anschließend hochgefahren, mit dem Problem, dass nun der Speicherpool wieder als "abgestürzt" angezeigt wurde, allerdings war die Reparieren-Option nicht mehr verfügbar.

Lange Rede, kurzer SInn: Was kann ich in dieser Situation jetzt noch machen, um das Volume b zw. dem Speicherpool mit der neuen Austauschdisk wieder in einen ordnungsgemäßen "Normal"-Zustand zu bekommen?

Merkwürdig erscheint mir auch der aktuelle Zustand von Disk 4 "initialisiert", denn der war früher - soweit ich mich erinnern kann - ebenfalls "Normal".

Ach ja, noch ist das Raid5 funktional (d.h. ich kann Dateien auf dem fehlerhaften Volume lesen/schreiben) und auch ein Backup ist vorhanden.



Vielen Dank für eure Unterstützung!
 

Anhänge

  • Zwischenablage00.jpg
    Zwischenablage00.jpg
    73,5 KB · Aufrufe: 41
  • Zwischenablage01.jpg
    Zwischenablage01.jpg
    70,2 KB · Aufrufe: 41
  • Zwischenablage02.jpg
    Zwischenablage02.jpg
    69,5 KB · Aufrufe: 42
  • Zwischenablage03.jpg
    Zwischenablage03.jpg
    80,5 KB · Aufrufe: 41
  • Zwischenablage04.jpg
    Zwischenablage04.jpg
    66,9 KB · Aufrufe: 41
  • Zwischenablage05.jpg
    Zwischenablage05.jpg
    73,7 KB · Aufrufe: 41
  • Zwischenablage06.jpg
    Zwischenablage06.jpg
    114,8 KB · Aufrufe: 41
  • Zwischenablage07.jpg
    Zwischenablage07.jpg
    116,3 KB · Aufrufe: 41
  • Zwischenablage08.jpg
    Zwischenablage08.jpg
    73,7 KB · Aufrufe: 41
  • Zwischenablage09.jpg
    Zwischenablage09.jpg
    73,7 KB · Aufrufe: 40
Zuletzt bearbeitet:

NoNameUser

Benutzer
Mitglied seit
06. Jan 2020
Beiträge
4
Punkte für Reaktionen
0
Punkte
0
Bevor Spekulationen zum aktuellen Systemzustand aufkommen: Ich habe die Disk 3 ausgetauscht. Die Disk 1+2+4 habe ich nicht angefasst.
 
Zuletzt bearbeitet:

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.563
Punkte für Reaktionen
1.430
Punkte
288
Disk 4 wird im RAID nicht verwendet. Wenn das früher anders war, so ist die aus dem RAID geflogen, und du hast jetzt keine Redundanz mehr. Was fatal ist, denn jetzt ist auch noch eine der verbleibenden Platten defekt. Um die unbenutzte Platte wieder ins RAID zu integrieren, muss das erst repariert werden, was wiederum nicht geht, weil du die fehlerhafte Platte wegen fehlender Redundanz nicht mehr tauschen kannst.
 

NoNameUser

Benutzer
Mitglied seit
06. Jan 2020
Beiträge
4
Punkte für Reaktionen
0
Punkte
0
Der Raid-Fehler war irreparabel, die noch vorhandenen Daten nicht mehr vollständig. Das sollte jedem eine Warnung sein, denn für ein Last-minute Backup wäre es in dieser Situation definitiv zu spät gewesen. Ich habe zwei neue Disks kaufen müssen, habe das NAS komplett neu aufsetzten und die Daten über ein vorhandenes Backup recovern müssen. Seit heute ist das "neue" NAS nun wieder online. Fazit: Ein Raid ersetzt niemals ein Backup!
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat