"Unmögliches" RAID ;-)

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

momo03

Benutzer
Registriert
26. Mai 2020
Beiträge
39
Reaktionspunkte
3
Punkte
8
Gestern schon das zweite mal mit einer DS413j ein "unmögliches" RAID bekommen.

SHR1 mit vier Festplatten - eine davon wird als "nicht installiert" und eine andere als "abgestürzt" angezeigt - trotzdem sind alle Daten zugreifbar (Backup läuft gerade).
1712396453035.png
 
Hast du ein Backup? Wenn nicht eins machen.
Wenn du eines hast, bitte mal die SMART-Werte der Platten hier posten (Anleitung siehe meine Signatur)
 
Die Daten sind nicht kritisch, daher kein Backup. Ist nur immer sehr zeitaufwendig, die wieder zu sammeln.

Das Phänomen trat während eines "Upgrades" der Platten auf. Nachdem sukzessive zwei der drei 3TB-Ironwolf (Nrn. 4 und 3) fehlerfrei durch 6TB WD-Red ersetzt und migriert wurden und das System auch stabil lief, ersetzte ich die Nummer 2. Wenige Minuten nach dem starten der Integration dieser HDD (Systempartition war bereits angelegt und kopiert) fing es hektisch an zu piepsen und das ganze System war nicht mehr erreichbar. Kein DSM, keine Shares.

Ich hab' den Schritt rückgängig gemacht und die Seagate wieder eingesetzt. Danach war DSM erreichbar und der Status wie oben gezeigt.

Mehr oder weniger so, nach der ganzen Aufregung bin ich mir nicht mehr 100% sicher...

Ich möchte im Moment nichts weiter damit machen als so viele Daten wie möglich zu sichern, danach kann ich gern mit allen Platten SMART-Schnelltests machen.
 
Keinen SMART Test machen, nur die Werte posten.
 
Und bitte einen Screenshot vom Speichermanager mit den Speicherpools und Volumen. Da bitte alles aufklappen.
 
  • Like
Reaktionen: momo03
Ich vermute mal deine HDD3 ist defekt.

HDDs sterben meist relativ am Anfang ( was bei dir so scheint ) , oder dann nach vielen Jahren.
 
Liegt wohl eher an der 6TB WD-RED die als Nr. 2 kurz drin war, worauf das ja alles abgestürzt ist. Diese WD lässt auch meinen Windows-Recher praktisch stillstehen, wenn ich sie an einen Hotplug-SATA anklemme.

Dass dadurch die Platte #3 abstürzt und die Platte #1 komplett aus dem RAID geworfen wurden, ist interessanter.

Kurios finde ich allerdings, dass ich überhaupt noch auf die Daten zugreifen kann. Obwohl das mit 2 von 4 Platten überhaupt nicht möglich sein dürfte.

Die WD-RED sind aus einem anderen NAS, wo sie fehlerfrei liefen und das ich auch 10TB-Platten vergrößert hatte. Die sind 4-6 Jahre alt, haben aber nur zwischen 30 und 70tausend Stunden gelaufen, ein Witz angesichts der MTBF.
 
also 70K Stunden ist nun auch nicht wenig.

Klar die Hersteller geben da hohe Zahlen an , aber so viel würde ich da auch ni draufgeben ,


Schon kurios bei dir
 
Ist schon merkwürdig. Die Größe des Pools deutet auf eine 3+3+6+6-Bestückung hin. Aber Disk 1 fehlt nun und Disk 3 ist abgestürzt. Ich frag mich grad, wieso da überhaupt noch was geht.
Das Raid besteht ja aus einem Raid5 aus 4*3TB und einen Raid1 aus 2*3TB (Reste der beiden 6er), vereinigt per LVM.
Kannst du bitte mal die Ausgabe von "cat /proc/mdstat" über die Konsole posten?
 
  • Like
Reaktionen: momo03
ganz genau das meine ich ja mit "unmögliches RAID" - das dürfte gar nicht funktionieren ;-)

Ich bin natürlich froh, dass ich noch Daten runterzeihen kann. Spart mir viel Zeit.

Wenn ich mit Datenrettung fertig bin - auf die eine oder andere Weise - dann ziehe ich auch gern das Log und die SMART-Daten.
 
Jetzt gab es wohl langsam den Geist auf, große Dateien wurde nur noch zu einem kleinen (aber schwankend großen) Bruchteil übertragen, sowohl per FTP als auch Drag'n'Drop auf ein anderes NAS, aber auch beim Download-Versuch. Ich hatte es dann runtergefahren.

Zu Hause dann Neustart: nix, nur blinkende Power- und Aktivitäts-LED.
Dann hab ich die abgestürzte 6TB rausgezogen, dann startete das DSM, aber erwartungsgemäß ohne Daten.
Dann die 6TB wieder rein und die "nicht initialisierte" 3TB rausgezogen; DSM startete und Daten waren zugreifbar. Eine 3GB große Date auf USB kopiert, kam auf über 20MB/s (sehr gut für die 413j) und wurde 100% kopiert.

Dann hab' ich mich getraut und alle vier Platten in eine RS2416+ gesetzt - und die hat das RAID erkannt.

Sehr mystisch. Könnte es sein, dass eine kaputte Platte mehr Strom zieht als spezifiziert und es dadurch zu Spannungsabfall kommt, was alles durcheinander bringt?

So sehen die vier Platten in der RS2416+ aus:

1712590091993.png

...und während ich das schreibe, hat sich der Zustand verschlechtert:
1712590190444.png

Ist das alles seltsam, oder was?

Egal, so läuft die Datenrettung erheblich schneller ;-)
 
Also ist/war die ehemalige HDD1 nun die HDD5, ist wieder weggeflogen, und die ehemalige HDD3 nun die HDD7?
Hattest du schon deren Smart-Werte gepostet?
 
Ja, danach sieht es wohl aus.
SMART-Werte wollte ich ziehen, wenn ich die Daten gesichert habe. Im DS413j unter DSM6 wäre das ja easy, unter DSM7 muss ich das wohl mit einer Aufgabe machen, wenn ich das richtig gelesen habe.

Hier die von der "rausgeflogenen" 3TB-Ironwolf:
1712591249390.png

PS: wenn ich mir das so anschaue mit den WD60, dann scheinen die "WD60EFRX" das Problem zu sein. Drei Stück hab ich davon alle jetzt defekt. Drei etwa zeitgleich gekaufte WD60EFAX sind hingegen in Ordnung. Vielleicht sollte ich mich beim Festplattenkauf deutlich detaillierter informieren...
 
Schau einfach mal hier. Die Smart-Werte auslesen kannst du ja jederzeit - ist ja kein Smart-Test, den man in diesem Zustand besser nicht machen sollte.
 
Ja, diese Anleitung hatte ich heute schon überflogen. Sei mir nicht böse, aber damit warte ich doch, bis alles läuft. Windows kann ich ja, aber wenn ich irgendwas mit Linux-Shell machen muss, komm ich mir immer vor wie der erste Mensch... ;-)

Edit: Screenshot der SMART-Werte geht ja auch unter DSM7.

Hier die fragwürdige WD60EFRX:
1712592365682.png
 
Diese HDD ist tot:
ID 1, 5, 197
 
... und ID 196 sowie ID 200. Schließe mich an, die Platte sieht schlecht aus.

SMART-Werte zeigt Synology m.W. erst ab DSM 7.2.1 nicht mehr an - verrückterweise kann ich nur immer wieder dazu sagen.
 
Zu den Werten der Seagate aus #14 müsst ihr was sagen. Ist mir zu blöd, das immer umzurechnen.
Da dürften einfach 2 der 4 Platten tot sein.
 
Die "ausgeworfene" 3TB-Platte ist in Ordnung, ich habe sie mittlerweile als einzel-Platten-SHR formatiert und komplett voll gemacht. Das Problem ist eindeutig die 6TB-WD-Red.

Es bleibt mysteriös, warum das 4-Platten-RAID mit einer entfernten und einer abgestürzten Platte überhaupt noch lesbar ist.
Ich beschwer' mich ja nicht, im Gegenteil, aber es ist halt echt "strange" ;-)
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat