Alle 4 Laufwerke kritisch - i/o-Fehler - warum, was nun?

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

Status
Für weitere Antworten geschlossen.

Crady

Benutzer
Registriert
02. Aug. 2014
Beiträge
133
Reaktionspunkte
2
Punkte
18
Hallo zusammen,

ich habe eine DS916+ mit 4 WD-Red 6TB Platten (und einer DX517 mit 5x 6TB Ironwolf).

Vorgestern hatten wir am späten Abend einen Stromausfall. Alles war aus, dann kam der Strom ganz kurz (1-2 Sekunden) wieder - und dann war er wieder für ein paar Minuten aus.
Die DS916+ ist danach wieder hochgefahren - aber es gab natürlich ein paar Meldungen im Protokoll.
Bei Volumen 1 (4 Laufwerke des DS916+) UND Volumen 2 (5 Laufwerke DX517) wurde automatisch die Datenträgerintegrität geprüft.

Die beiden Backups meiner wichtigen Daten (C2-Cloud und weitere DS außer Haus) wurden in der Nacht NICHT automatisch ausgeführt.

Gestern Vormittag habe ich mich dann von Außen in die DSM eingeloggt und habe die beiden Backups manuell gestartet - wurden auch problemlos durchgeführt.
Abends habe ich noch 3 Docker Container gestartet, die ich vergessen habe, auf automatischen Start zu setzten.

Die Datenintegrität von Volumen 1 (4 interne Platten) war lt. Speichermanager fast fertig - noch ca. 20 Minuten verbleibend.

Ich hatte mir vorsorglich per Express eine kompatible USV bestellt, die Abends noch geliefert wurde. Ich habe die DS916+ also heruntergefahren und die USV angeschlossen. Dazu musste ich sie aus dem Regal ziehen, was nach vorne kippen, um an den USB-Anschluss zu kommen. Die USV wurde problemlos erkannt und ich habe es so eingestellt, dass die DS916+ bei Stromausfall nach 30 Sekunden runterfahren soll.

Heute Morgen hatte ich plötzlich ca. 30 E-Mails von meiner DS mit i/o Fehlern aller 4 Laufwerke.
Alle 4 Laufwerke sind auf "Kritisch" gesetzt und auf Schreibgeschützt.
Im lokalen Netzwerk konnte ich mich einloggen - der S.M.A.R.T. Schnelltest für alle 4 Laufwerke war ok.
Habe dann beim googlen herausgefunden, dass ein "i/o Fehler" auch ein "schlechter Kontakt" sein könnte.
Ich wollte die DS dann runterfahren, alle Laufwerke ziehen und noch mal neu einstecken - vielleicht haben die sich durch das Kippen der DS zum Anschließen der USV ja gelockert...
Da habe ich aber die Meldung bekommen, dass die DS nicht heruntergefahren werden kann / sollte, da aufgrund der Laufvirusprobleme ein Datenverlust drohe.

Also habe ich das Herunterfahren abgebrochen.

Ich habe dann im laufenden Betrieb die Platten jeweils einzeln herausgezogen, bis die LED der Platte ausgegangen ist - und dann wieder reingesteckt.

Nun wollte ich von außerhalb wieder auf die DS zugreifen - geht aber nicht. VPN kann ich auch nicht herstellen.

Was nun?
Haben die Festplatten tatsächlich ein Problem?
Oder hat das Netzteil ggf. ein Problem und bekommt die Platten nicht 100% versorgt?
Oder ist ggf. die ganze DS916+ defekt?

Danke!
 
SMART Werte Details alle HDDs posten, keinen SMART Test machen!
 
Ok... leider komme ich aber momentan nicht auf die DS - ich hoffe, dass ich, wenn ich heute Abend zu Hause bin aus dem internen LAN noch drauf komme.
Mein Synology Account zeigt die DS zwar online - aber ich kann mich nicht verbinden.

Ich finde es nur komisch, dass alle 4 Festplatten gleichzeitig Probleme machen.
 
Abwarten, deine Aktionen waren halt auch nicht sehr "glücklich" ausgeführt.
 
Ok.
Was hätte ich anders machen sollen?
 
Hier wird doch Hot-Swapping unterstützt.... Wieso sollte ich die Platte nicht herausziehen?

Auch in der offiziellen Anleitung zum Tausch gegen eine größere Festplatte bzw. ersetzten einer defekten Festplatte beschreibt Synology, dass man die DS nicht herunterfahren muss.
 
Laufen die Platten als RAID bzw, SHR?
 
Hier wird doch Hot-Swapping unterstützt.... Wieso sollte ich die Platte nicht herausziehen?
Nur weil die Hard- und Software das unterstützt, heißt das nicht, dass deine Aktion ("Ich habe dann im laufenden Betrieb die Platten jeweils einzeln herausgezogen, bis die LED der Platte ausgegangen ist - und dann wieder reingesteckt.") ohne Folgen bleibt.

Ja, die laufen im SHR.
Nach deiner Aktion müsstest du eigentlich laufen durch liefen ersetzen.
 
  • Haha
Reaktionen: mb01 und Jagnix
Ja, die laufen im SHR.
Dann bin ich bei @synfor Sobald ich eine Platte aus einem SHR ziehe, ist es degradiert (und wird sich auch lautstark bemerkbar machen). Stecke ich eine Platte ein und stoße die Reparatur an, ist alles wieder paletti (nachdem die Reparatur durch ist). So wie Du es beschrieben hast, wurde keine Reparatur angestoßen, noch hatte die Zeit durchzulaufen. Ich weiß ehrlich gesagt nicht, was passiert, wenn ich eine Platte aus den Raid ziehe und sie dann wieder einstecke. Ich hoffe für Dich dass das SHR erkennt, dass es nichts tun muss, weil eh alles beim Alten geblieben ist.
Du wirst es ja bald sehen. Poste mal die SMART-Werte (wie von @ctrlaltdelete vorgeschlagen, vielleicht findet sich da etwas).
 
Wie gesagt - komme extern nicht auf die DS.
Muss warten, ob ich heute Abend im internen LAN auf die DS komme.
 
Ich habe dann im laufenden Betrieb die Platten jeweils einzeln herausgezogen, bis die LED der Platte ausgegangen ist - und dann wieder reingesteckt.
Ähhhh, ja.
Und danach auch jeweils die RAID-Reparatur wieder angestoßen?

Ohne. wird die Platte nicht wieder ins RAID auf genommen und ab der zweiten Platte war es das dann, da zuviele Platten im RAID fehlen.




Damit hast'e doch dein RAID wundervoll zerlegt.
Wenn aus, dann ließen sich alle Platten abziehen, aber wenn aktiv, dann wird im dem RAID vermerkt, dass jene Platten "futsch" sind und "normal" bekommst du sie dann nicht mehr ins RAID rein.

Bei nur einer Platte raus, kann man dann das Reparieren anstoßen, wobei die Daten auf der Platte quasi überschrieben werden, mit
 
Sagte ich ja bereits. Nur ob das Ziehen und Stecken ein und derselben Platte ein RAID chrasht - mal sehen.
 
Genau das meinte ich, während der Reparatur des Raid eine Platte ziehen ist eine super Idee.
 
  • Haha
Reaktionen: RichardB
Leute wir können uns jetzt alle zerkugeln (ich nehme mich selbst als erster an der Nase). Wenn das RAID gecrasht ist, hilft sowieso nur zurückspielen des Backups.
Was bleibt, ist die Frage, wieso 4 Laufwerke gleichzeitig einen I/O-Fehler melden. Das wäre doch interessant zu klären.
 
Ich denke die IO-Fehler kommen vom ziehen der Platten.
 
Denke ich nicht. Lt. TE kamen die Meldungen, nachdem die USV eingebunden wurde (ich geh mal davon aus, dass die DS runtergefahren, umgesteckt und wieder hochgefahren wurde). Da war was von einem Kippen die Rede, nur davon lösen sich imho keine Festplatten, vor allem nicht alle 4. Der Grund für die Fehlermeldung bliebt für mich vorerst rätselhaft.
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat