Alle 4 Laufwerke kritisch - i/o-Fehler - warum, was nun?

himitsu

Benutzer
Sehr erfahren
Mitglied seit
22. Okt 2018
Beiträge
2.904
Punkte für Reaktionen
336
Punkte
123
Klar, mit einer minimalsten Wahrscheinlichkeit könnten alle 4 Platten gleichzeitig ihre Kontakte kurz verloren haben.
Dann steckt die Backplane (wo die 4 Platten dran hängen) auch nochmal in einer Steckleiste beim Mainboard.
Aber "normal" sollten alle Federn dieser Kontakte genug aushalten, so dass es schon eine viel größere Erschütterung/Stoß benötigt, so dass mindestens eine Fausgroße zentimetertiefe Delle am Gehäuse nun zu sehen wäre.

Dennoch ... natürlich kann es passiert sein, oder eben dann beim Ziehen, oder sonstwann ... naja, gennerell ist es keine gute Idee Festplatten so großen Bewegungen/Erschütterungen auszusetzen, wenn sie aktiv sind.

Es kann auch schon vorher ein Fehler da gewesen sein, der zufällig erst nach dem Neustart auffiel,

uswusf...
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
So... die DS war zwar an - aber alle LEDs der Laufwerke waren aus.
Ich musste sie komplett ausschalten - dann konnte ich sie starten.
Alle 4 Laufwerke sind weiterhin "kritisch" und schreibgeschützt.

Hier die Smart Werte: LW1 - LW4

LW1.pngLW2.pngLW3.pngLW4.png
 

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.470
Punkte für Reaktionen
804
Punkte
174
Ich bin kein WD-Experte. Mir ist bei den SMART-Werten jetzt aber nichts Kritisches aufgefallen. Für eine WD sieht das für mich gesund aus.
Was Dein Problem betrifft, gehen mir aber langsam die Ideen aus. Das SHR scheint noch zu laufen. Backup hast Du ja - wenn es nicht aktuell ist, würde ich das jetzt nachholen, wenn es geht.
Und mich dann darauf vorbereiten, das Ding neu aufzusetzen. Es sei denn, jemand hat eine bessere Idee. Sorry:unsure:
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Ich kenne mich mit den SMART-Werten auch nicht aus....
Die DS läuft - aber Volumen 1 ist schreibgeschützt / abgestürzt. Ich kann keinerlei Apps öffnen.
Backup habe ich von den unwiederbringlichen Daten.

Die anderen Daten kopiere ich jetzt gerade vom Volumen1 auf Volumen2 (Die DX517) per File-Station. Das wird aber ein paar Tage dauern - es wird nicht wirklich schnell kopiert...

Schöner wäre jedoch eine Möglichkeit, die Platten wieder freizuschalten.... Dann kann ich sehen, ob der Fehler noch mal auftritt.
 

Jagnix

Benutzer
Sehr erfahren
Mitglied seit
10. Okt 2018
Beiträge
1.143
Punkte für Reaktionen
282
Punkte
109
ich geh mal davon aus, dass die DS runtergefahren,

Naja wer es für eine gute Idee hält mal zwecks Fehlerbehebung alle Platten seines Raid 5 einzeln zu ziehen und wieder steckt, dem traue ich auch zu das er nicht drauf achtet ob das NAS richtig unten ist. Also alle LEDs aus und Platten in Ruheposition.
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Ich habe gestern Abend einige Daten auf die DX517 und andere USB-Platten kopiert. - bzw. das Kopieren angestoßen.
Heute Nacht habe ich wieder Mails von Synology bekommen, dass DS nicht mehr mit meinem Synology Account verbunden sei, dass die DS nicht ordnungsgemäß heruntergefahren wurde....
Dann, dass die USV verbunden sei, Laufwerk 3 sei kritisch und Speicherpool 1 sei abgestürzt.

Heute Nacht hatten wir KEINEN Stromausfall!

Ich gehe jetzt von einem Hardware-Defekt der DS selber aus...
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Ich hatte gestern auch den Synology-Support kontaktiert.
Leider konnten die mir auch nicht weiterhelfen... Die haben gesagt:

4 Laufwerke kaputt, austauschen und neu aufsetzten...
Auch würde DSM selber fehlerhaft sein und abstürzen, da die Laufwerke ja kaputt seien.

Kann mir noch jemand was zu den SMART Werten sagen?

Kaufe ich für 600€ jetzt neue Festplatten für die alte DS916+, oder eine neue DS920+ mit den alten Festplatten..?
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.095
Punkte für Reaktionen
3.638
Punkte
414
Die SMART Werte sind alle ok, dein SHR ist tot. Daten sichern, Volume löschen, Speicherpool löschen und neu aufsetzen.
Ich würde vorher noch die Pakete auf das andere Volume verschieben, gibt ein Script hier im Forum dafür und nach dem Neuaufsetzen wieder zurück, erspart dir eine Menge Einstellungen, oder wenn möglich die Pakete mit Hyper Backup sichern, oder einfach beides :cool:
 
  • Like
Reaktionen: MattDS und Crady

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Du meinst also erstmal mit der DS916+ und den alten 4 Platten neu aufsetzten - und sehen was passiert?
Das Script habe ich gefunden - mal sehen, ob ich heute Abend per SSH auf de DS komme.

Ich habe ja versucht, per File-Manager noch einige unwichtigere Daten zu sichern - die wichtigen liegen ja auf der C2.
Aber das war ja sehr langsam... und wie schon beschrieben, hat sich die DS heute Nacht wieder abgeschaltet und ich weiß nicht, wie weit nun gesichert wurde.
 

himitsu

Benutzer
Sehr erfahren
Mitglied seit
22. Okt 2018
Beiträge
2.904
Punkte für Reaktionen
336
Punkte
123
Die Attribute mit Error, Retry, Reallocated, Pending oder Uncorrectable im Namen sind schlecht, wenn da was drin steht ... noch schlimmer, wenn es weiterhin immer mehr wird.
Und hier hast du ja überall 0, also alles OK.

Power-Off_Retract_Count aka Unexpected Power Loss Count, ist quasi die Anzahl der Stromausfälle,
also wie oft die Platte vorm Abschalten des Stroms nicht korrekt runtergefahren wurde.

https://en.wikipedia.org/wiki/S.M.A.R.T.


Du könntest die Platten an den PC hängen oder in der DS einem Test unterziehen.
Wenn möglich auch mit den Tools des Herstellers. (Downloads sollten sich auf dessen Webseite finden lassen)

Wenn die Platte nicht in Verwendung ist (am einfachsten am PC), wären auch Schreibtests auf der gesamten Oberfläche möglich, ähnlich wie bei einem RAM-Test.
 
Zuletzt bearbeitet:

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.095
Punkte für Reaktionen
3.638
Punkte
414
Was meinst du mit abgeschaltet? Was steht im Protokoll?
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.984
Punkte für Reaktionen
624
Punkte
484
Die Platten sind aller Voraussicht nach in Ordnung. Durch dein Vorgehen hast du allerdings das RAID unwiederherstellbar zerstört. Also: alles Löschen und neu aufsetzen.
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Was meinst du mit abgeschaltet? Was steht im Protokoll?
Leider steht nichts im Protokoll-Center nichts Aufschlussreiches... Oder gibt es noch ein anderes Protokoll?
Bis späten Abend eben, dass Volumen 1 Fehler hat.
Und dann Morgens wieder, dass die DS "nicht ordnungsgemäß runtergefahren" wurde.

Oder kann die USV eine Macke haben und mal eben so den Strom ausschalten? Die Probleme traten ja nach dem Nutzen der USV auf...

Und ja, ich habe die DS normal heruntergefahren, bis keine LEDs mehr blinkten!
Dann habe ich die USB-Festplatte abgesteckt, damit ich die USV per USB verbinden kann. Das Netzteil von der DS916+ und der DX517 habe ich dann in die USV gesteckt - die USV dann in die Steckdose.
Die USV ist eine Eaton Elippse PRO 650 DIN.
In der DSM habe ich eingestellt, dass die DS 30 Sek nach Stromausfall runterfahren soll. Bei ihr habe ich die beiden oberen Schuko Ausgänge genutzt.


EDIT:
Gerade habe ich schon wieder eine Mail bekommen, dass die DS nicht mehr mit meinem Synology-Account verbunden ist...
komisch!
 
Zuletzt bearbeitet:

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Ok... als ich nach Hause kam, war die DS komplett aus. Sie ließ sich auch nicht mehr einschalten.

Dann habe ich sie nach vorne gezogen und da ist sie plötzlich angegangen! Da muss wohl ein Wackelkontakt im Netzteil oder in der Buchse sein... Ich habe versucht, den Stecker noch mal fest einzustecken - der war aber fest...
Da möchte ich fast ausschließen, dass er sich beim hervorziehen der DS gelöst hatte...

Aber wer weiß.... Jetzt läuft erstmal ein Speichertest.

Sind Probleme mit dem Stecker des Netzteils oder der Buchse bekannt?
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.095
Punkte für Reaktionen
3.638
Punkte
414
Mit der Buchse nein, Netzteil kann "sterben".
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Sterben im Sinne von ganz kaputt - oder auch unzuverlässig und / oder Wackelkontakt / nicht mehr genug Leistung?
 
Zuletzt bearbeitet von einem Moderator:

himitsu

Benutzer
Sehr erfahren
Mitglied seit
22. Okt 2018
Beiträge
2.904
Punkte für Reaktionen
336
Punkte
123
via SSH findest du in /var/log ganz viele Logs
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.095
Punkte für Reaktionen
3.638
Punkte
414
Im Sinne von tot.
Wenn es eine Schwankung wäre, würde die DS ja wieder automatisch starten, sofern du die Einstellung nicht geändert hast.
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
132
Punkte für Reaktionen
2
Punkte
18
Ja, das hat sie ja ein paar mal gemacht - selber gestartet.
Dieses Mal aber nicht - so erst habe ich bemerkt, dass als ich den Stecker angefasst habe, die DS plötzlich wieder an ging.

So... Das Script habe ich jetzt ausgeführt und starte die DS gerade neu.
Ich bin mal gespannt, ob das Verschieben der Apps geklappt hat - hatte jede Menge Fehlermeldungen, das Volumen1 ja schreibgeschützt ist.
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.095
Punkte für Reaktionen
3.638
Punkte
414
Und wie ist das Ergebnis?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat