"Laufwerk abgesteckt" - dritter defekter Datenträger in einem Monat

Status
Für weitere Antworten geschlossen.

Nickname

Benutzer
Mitglied seit
09. Apr 2011
Beiträge
26
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

ich habe seit gut einem Jahr eine DS1019+.
Verbaut habe ich von Anfang an 3x8 TB Festplatte und 2x512GB SSD.
Die drei Festplatten habe ich als SHR-RAID für Daten und die zwei SSDs als RAID1 eingerichtet für VMs (pihole, Unifi Controller & ioBroker).

Vor knapp einem Monat hat sich einer der 8TB-Festplatten beim SMART-Test als kritisch herausgestellt, ich habe das Laufwerk daraufhin direkt ausgetauscht und WD hat mir die Platte anstandslos getauscht.
Zwei Wochen später fiel plötzlich um 1 Uhr nachts eine der SSDs aus, sie wurde einfach nicht mehr gesehen im Speichermanager und im Protokoll steht "Laufwerk abgesteckt". Auch an einem Linux oder Windows-Rechner per USB-Adapter wird die SSD nicht mehr erkannt.
Gut, zwei Ausfälle in zwei Wochen, kann ich ja noch glauben.
Jetzt aber, weitere zwei Wochen später fiel die nächste 8TB-Platte aus. Exakt wie bei der SSD um 2 Uhr nachts "Laufwerk abgesteckt" laut Protokoll.

Nun aber das "witzige": Ziehe ich den Datenträger raus aus der Diskstation (also physisch) und stecke ich ihn wieder rein, wird er umgehend erkannt als funktionsfähig, allerdings im Status "Nicht initialisiert". Also entweder ist das jetzt wirklich ein extremer Zufall oder die Diskstation schrottet von sich aus die Festplatten.

Dann habe ich mal per SSH mit Hilfe von fdisk die Platten angeschaut und mir ist dabei das hier aufgefallen:

Rich (BBCode):
GPT PMBR size mismatch (239649 != 245759) will be corrected by w(rite).
Disk /dev/synoboot: 120 MiB, 125829120 bytes, 245760 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 3923D67B-7194-4EDD-9DC4-A718B498911A

Device         Start    End Sectors Size Type
/dev/synoboot1  2048  67583   65536  32M EFI System
/dev/synoboot2 67584 239615  172032  84M Linux filesystem


Sollte mir das Anlass zur Sorge geben?


Und was denkt ihr, habe ich einfach nur Pech mit den drei Datenträgerausfällen innerhalb von vier Wochen oder liegt es doch an der DS?

Im Anhang hier noch die Ausgabe von dmesg falls das jemanden interessiert, leider nur als pastebin da die Anzahl der Zeichen hier zu stark dafür begrenzt sind:

https://pastebin.com/fntjhi5V

Heute morgen habe ich die Platte wie gesagt nochmal eingesteckt, sie wurde im DSM Webinterface wieder erkannt und bei dmesg kam dann das dabei raus:

https://pastebin.com/xRCEwGzF
 

Jagnix

Benutzer
Sehr erfahren
Mitglied seit
10. Okt 2018
Beiträge
1.124
Punkte für Reaktionen
274
Punkte
109
Dann lade dir die entsprechenden Diagnosetools vom Hersteller der Festplatten herunter führe damit mal einen ausführlichen Test am PC durch.
 

Nickname

Benutzer
Mitglied seit
09. Apr 2011
Beiträge
26
Punkte für Reaktionen
0
Punkte
1
Ich wüsste nicht, was das bringen soll. Bei erstem defekten Datenträger waren es ja die SMART-Werte, die kommen sowieso von der Festplatte. Der zweite defekte Datenträger war eine SSD, die gar nicht mehr erkannt wurde, an keinem Rechner. Der dritte Datenträger ist jetzt wiederum eine Festplatte, die erkannt wird aber im laufenden Betrieb einfach als "abgesteckt" markiert wird, was nicht passiert ist.

Ich habe eben weitere Seltsamheiten herausgefunden: Wenn die Platte in Slot 1 steckt, wird sie von parted zwei mal gefunden. Einmal als "Disk /dev/sda: 8002GB" und dann nochmal als "Disk /dev/hda: 8002GB". Stecke ich sie in Slot 5, dann ist alles korrekt und sie wird nur als ""Disk /dev/sde: 8002GB"" erkannt.

Dass sie als IDE-Festplatte zugeordnet wird (hda) ist mir unbegreiflich. Als Gegentest: Mit anderen Platten macht sie das auch. ist das normal, dass Platten oder SSDs die im ersten Slot stecken, zwei mal als Device aufgelistet werden? Oder ist das ein Fehler?


Edit: Jetzt mit einer SSD die ich testweise in Slot 1 drin habe blieb plötzlich das ganze System kurz hängen um dann im Protokoll für Slot 1 anzuzeigen "Versuch, Laufwerk neu zu verbinden". Ich habe schon fast die Befürchtung, dass die Diskstation einen Hardwarefehler hat oder eben einen Bug!?
 
Zuletzt bearbeitet:

SoniX

Benutzer
Mitglied seit
14. Okt 2010
Beiträge
730
Punkte für Reaktionen
19
Punkte
38
Was kam raus bisher?

Ich fände es auch nicht verkehrt die Platte extern mit den Herstellertools zu ckecken.
Wenn sie Defekte aufweist, unter anderem weil GPT defekt ist, könnte sie deswegen ausgeworfen worden sein.
Auf jeden Fall ist sie auszutauschen wenn sie defekt ist; unabhängig von der Diskstation.

Es klingt als ob du Platten aus einer Serie eingesetzt hast. Wenn es da eine schlechtere Charge gab, fallen die gerne mal nacheinander aus.
Vielleicht einfach nur Glück dass die erste noch Smartfehler melden konnte. Vielleicht ist die zweite genauso defekt, kam aber nichtmehr dazu Smartfehler zu melden.

Auch wenn ich bei dieser Häufung absolut verstehen kann bei der Diskstation auch den Fehler zu vermuten, was ja unbestitten sein kann, würde ich doch erstmal die Platte tauschen und beobachten.
Wenn nichtsmehr passiert, gut. Wenn auch die letzte alte Platte ausfällt, schlechte Charge. Wenn eine der neuen ausfällt, Diskstation tauschen.
 

untemawd

Benutzer
Mitglied seit
08. Feb 2019
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
Ich habe aktuell ein ähnliches Phänomen (DS211+; Raid1):

DS meldete "Drive Slot disabled" und logischerweise "Storage Pool ... degraded".
Alte Platte entfernt und wieder eingesteckt: => Platte ist "nicht initialisiert"

Dennoch ein Versuch die alte Platte doch nochmal einzubinden (bis zum Ergebnis "Storage Pool successfully repaired") - der Versuch klappt für ca. 2 - 3 Tage. Danach gleiches Fehlerbild.

Einbau einer nagelneuen Platte und Durchlauf der Einbindung bis zum Consistency check: "Storage Pool successfully repaired"

Nach 5 Tagen erneut: "Drive slot [2... has been disabled"

Stehe nun vor der Frage eine neue (gebrauchte) DS anzuschaffen oder Datensicherung komplett umstellen (z.B. USB-Harddrive oder Cloud-Sicherung)
 

SoniX

Benutzer
Mitglied seit
14. Okt 2010
Beiträge
730
Punkte für Reaktionen
19
Punkte
38
Bitte nie ein Raid als Backup nutzen! Ein Raid ist "nur" eine Ausfallsicherung, kein Backup.

Also ja, wenn Datensicherung gewünscht (sollte immer so sein), dann bitte unbedingt umstellen.
Eine USB-HDD ist in vielen Fällen die einfachste und günstigste Lösung hierzu.
Am besten hat sich hier bewährt: 3 Datenkopien; 2 verschiedene Medien; 1 Sicherung extern.

Zum Thema: Wenn das mir passieren würde, würde ich beide Platten in den PC schrauben und mit Herstellertools einen kompletten Check machen. Dauert seine Zeit, aber nur das bringt Sicherheit. Vor dem ersten Einbau einer neuen Platte sollte man dies auch machen. Wenn beide Platten okay sind, dann liegt der Fehler wahrscheinlich an der Diskstation.
 

Synchrotron

Benutzer
Sehr erfahren
Mitglied seit
13. Jul 2019
Beiträge
4.640
Punkte für Reaktionen
1.615
Punkte
214
Es gibt für schmales Geld USB-3-Adapter für Festplatten. Die ersparen es einem, die Platten in einen PC einzubauen. Adapter aufstecken, Prüfung durchlaufen lassen, abstecken.

Für die Nutzung würde ich sie nicht verwenden, zu wackelig.
 

SoniX

Benutzer
Mitglied seit
14. Okt 2010
Beiträge
730
Punkte für Reaktionen
19
Punkte
38
Gibt es, stimmt. Ich habe auch soetwas.

Ich weiß nicht ob es an meinem Gerät liegt oder ob das allgemein so ist, aber mit meinem kann ich keine großen Platten ab IIRC 2TB extern anschliessen.
Die werden dann nur als kleine Platten erkannt und demzufolge kann man auch nicht alles testen und die Herstellertools melden durchgehend Fehler.
Auslesen von Smartwerten und Seriennummer klappt hierüber auch nicht.

Aber wenn es da Adapter gibt die das Verhalten nicht zeigen, dann ja, dann ist das eine gute Sache.

Da gabs doch so ein Feature, wie hieß das noch? *nachlese* Genau... UASP!
Ich glaube das Feature müssten die Adapter können damit man vollen Zugriff darauf hat.
 

Synchrotron

Benutzer
Sehr erfahren
Mitglied seit
13. Jul 2019
Beiträge
4.640
Punkte für Reaktionen
1.615
Punkte
214
Keine Ahnung, sowohl meine 10TB WDred wie die 12TB IronWolf wurden problemlos erkannt.
 

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.389
Punkte für Reaktionen
732
Punkte
174
Wieso schlechte Laune? Wenn es DAS ist, ist das ja die Lösung. Und bei den Problemen des TE ist das ja nicht so weit hergeholt.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.170
Punkte für Reaktionen
864
Punkte
268
na ja, ist nicht für alle so einfach in den Eingeweiden einer DS zu graben, viele werden da etwas verschrocken.

Aber diese DS läuft jetzt seit der Reparatur dauernd, da es eine dieser slim ist, braucht es bald neuen Ventilator, aber ansonsten ist seit dem alles perfekt.

Ich will es nur hier mitteilen, weil wie man sieht, nicht immer sind die Platten schuld an allem.
 

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.389
Punkte für Reaktionen
732
Punkte
174
Die Hauptplatine mit dem Lötkolben anzugehen, gehört auch nicht zu meinen Kernkompetenzen. Nur für alle, die noch Garantie haben, ist das schon relevant.
Und jeder andere kennt sicher jemanden, oder ist dieser jemand. :)
 

untemawd

Benutzer
Mitglied seit
08. Feb 2019
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
noch ein Zwischenstand zu meinem Problem in Post #05:

Zwei meiner bisher vermeintlich defekten Platten haben sich über einen neu gekauften USB3-Adapter problemlos an Mac und PC anschließen lassen und melden dort im Festplattendienstprogramm bzw. Gerätemanager "keine Probleme".
Ich konnte allerdings nicht auf den Festplatten-Inhalt zugreifen (Vermutung: inkompatible synology-Formatierung oder aber ein "Reset/Überschreiben" der Festplatten-Initialisierung jeweils in der Crash-Situation.
Ich habe aber auch keine weitergehenden Festplattentools von Seagate ausprobiert.
Eine der Platten habe ich nach einer Neuformatierung nun testhalber als Ziel der TimeMachine-Sicherung am Mac verwendet und habe seit mehreren Tagen damit keinerlei Probleme.

Darüberhinaus habe ich nun ebenfalls meine Synology DS211j zerlegt und nach schlechten Lötstellen abgesucht - alles sieht ok aus (habe allerdings nicht exakt die Lötstellen auf der Platine aus Post #10 identifizieren können).
Beim Zusammenbauen habe ich die Platine, auf der beide Platten einrasten, bewusst fester eingesteckt und angeschraubt (dabei die DS gleich noch vom Staub gereinigt sowie die CR2032-Batterie getauscht).
Seither läuft die Synology nach Consistency Check mit der vermeintlich 3. defekten Platte wieder problemlos.

Ob sich mein derzeitiger Verdacht bestätigt, dass das Problem ("Drive in abnormal status") nicht von defekten Festplatten sondern an einer wackeligen Platinen-Steckverbindung verursacht wurde, wird der Langzeittest zeigen.
Werde in 2 bis 3 Monaten mal einen Update geben.
 

Geoluchs

Benutzer
Mitglied seit
15. Mrz 2015
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
Hab so ein ähnliches oder gleiches Problem. Meine Synology DS415+, bestückt mit Seagate 4 x 8TB pro meldet nun zum zweiten Mal "Laufwerk abgesteckt".

a)
zum ersten Mal, als ich das NAS etwas auf der Ablage verschoben habe um an den USB Anschluss zu kommen. Dabei hat sich Platte 1 (verabschiedet) musste sie "reparieren". Sie war dann für 40 s abgesteckt, jedenfall ist sie anschließend wieder als "Laufwerk eingesteckt" protokolliert. Ich tippe hier auf einen mechanischen Reiz, der evtl eine kalte Lötstelle offenbart.

b)
heute Nacht dann das gleiche Spiel, um

2:37 Laufwerk abgesteckt
3:11 Laufwerk eingesteckt

Die Seagate ist 1 Jahr alt sie hat 5.371 Stunden Kreise gedreht.
Smartwerte alle fehlerfrei.
Raid5 (SHR)

Soll ich die Synology 415+ in Rente schicken?
Was meint Ihr?

:):)
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.170
Punkte für Reaktionen
864
Punkte
268
ich würde versuchen die Platten mehrmals aus- einstecken, wenn das nicht hilft DS öffnen und schauen ob was zu sehen ist im Bereich der Steckplätze
 

Geoluchs

Benutzer
Mitglied seit
15. Mrz 2015
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
Ja, das hatte ich auch vor, ich warte die Reparatur ab und mach das Ding auf und kontrolliere die Steckplätze/Kontakte, Danke für die Meinung und Hilfe.
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.170
Punkte für Reaktionen
864
Punkte
268
in meinem Fall siehe #10, kamen die Fehler nach und nach so nach 6 Monaten Betrieb. Zum Schluss 10x pro Tag oder auch mehr. Die DS wurde dann von meinem Arbeitgeber entsorgt. Das war aber schon vor fast 3 Jahren. Nach der Reparatur läuft es jetzt seit dem Fehlerfrei.
 
  • Like
Reaktionen: Geoluchs

Geoluchs

Benutzer
Mitglied seit
15. Mrz 2015
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
hi, Ottoskora, auf deinem Foto des verlinkten Beitrages sieht man die Kontakte die keine Löt"tropfen" haben, also nur quasi in den Kontakt eingesteckt sind, das ist dann der Fehler gewesen?
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.170
Punkte für Reaktionen
864
Punkte
268
das ist da auch irgendwo im Text erklärt.
Es sind sogenannte kalte Lötstellen. Wegen der höheren Löttemperatur ist die Lötzeit bei Bleifrei Löten verkürzt. Die nicht gelöteten Kontakte waren nicht richtig verlötet weil es alles Masse Kontakte sind. Die brauchen viel mehr Wärme weil im Inneren der Platte eine grosse Massefläche den Lötvorgang abkühlt. Die Stecker werden mit einem 'selectiv tht' Verfahren gelötet. Wenn die Lötzeit bei den Massepins nicht länger eingestellt wird als bei den Signalpins, ergibt sich der gezeigt Fehler.

Ich habe die Pins dann verlötet und seit dem läuft die DS.

Kalte Lötstellen können aber auch ganz anders aussehen, verlötet, aber mit Lupe oder Mikroskop ersichtlich dass es nur 'geklebt' ist.
 
  • Like
Reaktionen: Geoluchs
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat