Volume abgestürzt - merkwürdige Phänomene

Status
Für weitere Antworten geschlossen.

Bloona

Benutzer
Mitglied seit
17. Nov 2009
Beiträge
55
Punkte für Reaktionen
0
Punkte
6
Guten Tag,

ich habe seit einem Reboot heute Morgen den Verlust meines SHR Volume auf meiner DS1813+ zu beklagen. Die DiskStation wurde neu gestartet, weil die MariaDB und davon abhängige Dienst nicht mehr zur Verfügung standen.

11-12-_2015_09-06-03.jpg

11-12-_2015_09-06-15.jpg

Merkwürdig dabei ist, dass alle Festplatten mit dem Status "Normal" angezeigt werden, aber die 4TB Seagate-Platten (ST4000DM000) sehr hohe Fehlerraten aufweisen. Diese sind aber quasi neu, im Gegensatz zu den älteren WD30EZRX Platten. Diese sind aber unauffällig.

11-12-_2015_10-04-48.png

11-12-_2015_09-54-06.png

Die Platten werden täglich nachts mit einem einfachen S.M.A.R.T. Test geprüft, wöchentlich mit einem intensiven - Ergebnis bisher ohne Fehler.
Merkwürdig ist auch, dass mein Hot Spare nicht mehr konfiguriert ist, ebenfalls eine ST4000DM000 von Seagate.

Meine Fragen:
1) Wie bekomme ich mein Volume zurück? Ein Support-Ticket bei Synology wurde bereits geöffnet.
2) Warum sind auf einmal alle Seagate-Platten auffälig, obwohl neu?
3) Ich habe Anfang der Woche das Update 2 für DSM 5.2-5644 installiert. Gibt es damit ggf. Kompatibilitätsprobleme mit den Seagate-Platten? Laut Synology sind diese kompatibel.

Jetzt bin ich auf Hilfe angewiesen und für jeden Tipp dankbar.

Viele Grüße. B.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
628
Punkte
484
Hast du denn jetzt gar keinen Zugriff mehr auf die Daten?
Für mich sieht es so aus, als sei die eine Seagate ausgestiegen, bzw. wurde aus dem RAID geworfen.

Wenn du noch an die Daten kommst, dann sollte als nächstes ein Tausch der vermeinzlich defekten Platte anstehen.

Evtl. kann es schon genügen, die Platte extern neu zu formatieren und dann der DS zum rebuild neu anzubieten. Aber da sollte man schon sicherstellen, dass die Platte auch wirklich noch in Ordnung ist.

Die SMART Werte von Seagate und WD kannst du nicht vergleichen, die werden (insb. bei raw_read_error) komplett anders ausgewertet und angegeben. Insofern hat die hohe Zahl da nicht den Wert bzw. die Bedeutung, den du siehst. M.E. ein großer Nachteil bei Seagate.

Unglücklich finde ich auch, dass du für dein SHR eine recht "wilde" Plattenmischung hast. Ich würde da eher auf ein und denselben Plattentyp bauen, wenn ich ein RAID aufsetzte.

Täglicher SMART Test ... Wozu soll das gut sein?
Die SMART-Werte werden laufend ermittelt und ausgewertet. Ein SMART-Test stresst eine Platte hingegen nur unnötig.

Last but not least: ein Backup hast du hoffentlich, bei dem Fuhrpark an Geräten ... ?
 

Frogman

Benutzer
Mitglied seit
01. Sep 2012
Beiträge
17.485
Punkte für Reaktionen
8
Punkte
414
Die Seagate-Platten verhalten sich anders, dort werden die RAW-Werte anders interpretiert. Lediglich ID183 (BadBlock) und die HighFly-Warnungen bei der Seagate sind auffällig.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.445
Punkte für Reaktionen
1.828
Punkte
804
Ich stimme Puppetmaster in allen Punkten zu, will nur kurz ergänzen, dass Datenträger 2 (Seagate) Fehler geworfen hat (ID 183, 188 und 189), während Datenträger 1 (WD) keine SMART-Auffälligkeiten aufweist.
 

Bloona

Benutzer
Mitglied seit
17. Nov 2009
Beiträge
55
Punkte für Reaktionen
0
Punkte
6
Hi,

vielen Dank für die schnellen Antworten. Ich will kurz auf die Fragen eingehen:
- Datensicherung? Ja, habe ich.
- Mischung der Platten? Ist durch Erweiterung entstanden, ich steige gerade von 3 TB WD Platten auf 4 TB Seagate um.
- S.M.A.R.T. täglich? Gut, mache ich wieder nur wöchentlich, wieder was gelernt.

Nachfolgend die Screenshots zu meiner RAID-Konfig.
11-12-_2015_10-44-05.png
11-12-_2015_10-44-23.png
11-12-_2015_10-44-40.png
11-12-_2015_10-44-58.png
11-12-_2015_10-45-20.png

Was haltet Ihr von dem Versuch, das (die) RAID(S) mit mdadm zu reparieren? Wie wäre die korrekte Syntax der Befehle?

Rich (BBCode):
mdadm --stop /dev/md2
mdadm --assemble --force -v /dev/md2 /dev/sda5 /dev/sdb5 /dev/sdf5 /dev/sdd5 /dev/sde5

Da auf dem System nicht nur Daten sondern auch MariaDB, Mailserver, Wiki, etc. liegen würde ich gerne erst reparieren und dann die Platten nacheinander tauschen. Der Grund für den Crash liegt aber immer noch im Verborgenen, oder?

Viele Grüße. B.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
628
Punkte
484
- S.M.A.R.T. täglich? Gut, mache ich wieder nur wöchentlich, wieder was gelernt.

Nee, habe ich nicht gesagt. SMART-Test dann machen, wenn es notwendig ist. Also wenn man den Verdacht hat, dass eine Platte aussteigen will. Auch dann macht der SMART-Test nur Sinn, wenn man sich die Rohwerte vorher und nachher ansieht.





Was haltet Ihr von dem Versuch, das (die) RAID(S) mit mdadm zu reparieren?

Wenig, es sei denn, du weißt genau, was du tust und hast das auch schon erfolgreich an einer DS durchgeführt.

Wie wäre die korrekte Syntax der Befehle?

K.A., s.o.
 

Frogman

Benutzer
Mitglied seit
01. Sep 2012
Beiträge
17.485
Punkte für Reaktionen
8
Punkte
414
- S.M.A.R.T. täglich? Gut, mache ich wieder nur wöchentlich, wieder was gelernt.
Ein expliziter (erweiterter) SMART-Test erzeugt nicht wenig Stress - den solltest Du nur dann machen, wenn Probleme aufkommen. Ansonsten ist der eher kontraproduktiv, der Plattencontroller registriert begleitend auflaufende Fehler. Wichtiger ist es, dort ab und an hineinzuschauen oder die Daten auszulesen (hier im Forum gab's dazu mal ein Skript) und bei Auffälligkeiten aktiv zu werden.
 

Bloona

Benutzer
Mitglied seit
17. Nov 2009
Beiträge
55
Punkte für Reaktionen
0
Punkte
6
Gut, die S.M.A.R.T.-Geschichte habe ich ja nun verstanden. ;)
Wie aber bekomme ich mein Volume zurück, ohne die DS komplett neu zu installieren? Immerhin sind alle Platten vorhanden und aus sich der DS auch "normal".

11-12-_2015_11-07-54.png

"Lediglich" das Volume ist abgestürzt.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.445
Punkte für Reaktionen
1.828
Punkte
804
Puppetmaster hats ja schon in Beitrag 2 geschrieben: Die 'rausgeflogene Platte entweder ersetzen oder an einem Rechner mit Seatools o.ä. formatieren und schauen, ob die SMART-Werte danach ok sind. Dann die Platte wieder in die DS einbauen und das Volume reparieren. Danach die SMART-Werte insbesondere dieser Platte beobachten.

Edit: Laut der Datenträgerliste, die Du gerade in Beitrag 8 gepostet hast, ist die dritte Platte aus dem Volume geflogen. Leider ist die erste Spalte zu schmal, so dass nicht zu sehen ist, um welchen Datenträger es sich handelt. Falls es nicht Datenträger 2 ist, solltest Du Dir davon nochmal die (numerischen) SMART-Werte ansehen oder hier posten.
 

Bloona

Benutzer
Mitglied seit
17. Nov 2009
Beiträge
55
Punkte für Reaktionen
0
Punkte
6
Hmm. Wo ist denn da eine Platte rausgeflogen? Habe ich Tomaten auf den Augen? Der Datenträger in der 3. Zeile ist das Hot Spare Device, gehört also nicht zum RAID-Verbund.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.445
Punkte für Reaktionen
1.828
Punkte
804
Ok, ist daraus für mich nicht erkennbar gewesen. Es fällt auf, dass der Status "Nicht initialisiert" ist.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
628
Punkte
484
Der Datenträger in der 3. Zeile ist das Hot Spare Device, gehört also nicht zum RAID-Verbund.

Ja, danke für die Info! :)

Möglicherweise rechnet der DSM das Hot Spare zum SHR, das weiß ich nun nicht aus Erfahrung. Möglich wäre es. Und wenn nun das Hot Spare kaputt ist, dann gibt's ggf. diese Meldung.

Wenn du sicher gehen willst, solltest du vielleicht auch ein Ticket bei Synology öffnen, die haben die Logik ja gebaut.
 

Bloona

Benutzer
Mitglied seit
17. Nov 2009
Beiträge
55
Punkte für Reaktionen
0
Punkte
6
Stimmt, er Status "Nicht initialisiert" ist etwas missverständlich. Aber selbst, wenn das Hot Spare konfiguriert ist steht das Device auf diesem Status. ;)
Anyway, ich hatte ja schon ein Ticket bei Synology aufgemacht, nun muss ich wohl warten ...
 

Bloona

Benutzer
Mitglied seit
17. Nov 2009
Beiträge
55
Punkte für Reaktionen
0
Punkte
6
Nach ein wenig Recherche stellt sich das Problem für mich so dar, dass das logische Volume nicht gemounted werden konnte. Ein
Rich (BBCode):
mount /dev/vg1000/lv /mnt -o ro
hat mir wenigstens das Volume read only zurückgebracht.
Der nette Herr vom Synology Support hat sich immerhin schon mal gemeldet, hat aber erst Montag Zeit. :(
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat 

 
 
  AdBlocker gefunden!

Du bist nicht hier, um Support für Adblocker zu erhalten. Dein Adblocker funktioniert bereits ;-)

Klar machen Adblocker einen guten Job, aber sie blockieren auch nützliche Funktionen.

Das Forum wird mit hohem technischen, zeitlichen und finanziellen Aufwand kostenfrei zur Verfügung gestellt. Wir zeigen keine offensive Werbung und bemühen uns um eine dezente Integration.

Bitte unterstütze dieses Forum, in dem du deinen Adblocker für diese Seite deaktivierst.

Du kannst uns auch über unseren Kaffeautomat einen Kaffe ausgeben oder ein PUR Abo abschließen und das Forum so werbefrei nutzen.

Vielen Dank für Deine Unterstützung!