SMART-Werte auslesen und interpretieren

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

@AndiHeitzer
Die Seite kenne ich. Die erste Platte die ich gepostet habe, hatte ich mit dem Befehl direkt umrechnen lassen. Da ist bis auf die ID188 und 199 ist ja auch alles gut. Die 2. Platte hatte ich extern ohne Umrechnung ausgelesen. Da ist auch alles gut, außer halt die 188 und 199
 
Hallo, ich habe mir soeben das Syno Smart Info package installiert und die Werte darüber ausgelesen. Klappt bestens. Aber eine Frage habe ich bezüglich der Werte meiner beiden M.2 Lexar SSD NM790 2TB zu Nummer 13. Wie kommt denn ein Unsafe Shutdown zustande? Ich habe das Script für das hoch- und runterfahren der NVMe`s über den Aufgabenplaner laufen. Muss ich mir sorgen machen?

Code:
Synology_SMART_info v1.3.14 - by 007revad
HAUPTQAUTIER DS423+ DSM 7.2.2-72806-4
Using smartctl 7.5

Drive 4  ST4000NE001-2MA101  WS24TGH7  /dev/sata1
SMART overall-health self-assessment test result: PASSED
SMART Error Counter Log:         No Errors Logged
  1 Raw_Read_Error_Rate          0
  5 Reallocated_Sector_Ct        0
  7 Seek_Error_Rate              0
  9 Power_On_Hours               6940
 10 Spin_Retry_Count             0
187 Reported_Uncorrect           0
188 Command_Timeout              96
194 Temperature_Celsius          39
195 Hardware_ECC_Recovered       0
197 Current_Pending_Sector       0
198 Offline_Uncorrectable        0
199 UDMA_CRC_Error_Count         2

Drive 1  MG10ACA20TE  34N0A3GSF4MJ  /dev/sata2
SMART overall-health self-assessment test result: PASSED
SMART Error Counter Log:         No Errors Logged
  1 Raw_Read_Error_Rate          0
  5 Reallocated_Sector_Ct        0
  7 Seek_Error_Rate              0
  9 Power_On_Hours               10034
 10 Spin_Retry_Count             0
194 Temperature_Celsius          37
197 Current_Pending_Sector       0
198 Offline_Uncorrectable        0
199 UDMA_CRC_Error_Count         0

Drive 2  MG10ACA20TE  34N0A3H1F4MJ  /dev/sata3
SMART overall-health self-assessment test result: PASSED
SMART Error Counter Log:         No Errors Logged
  1 Raw_Read_Error_Rate          0
  5 Reallocated_Sector_Ct        0
  7 Seek_Error_Rate              0
  9 Power_On_Hours               10019
 10 Spin_Retry_Count             0
194 Temperature_Celsius          37
197 Current_Pending_Sector       0
198 Offline_Uncorrectable        0
199 UDMA_CRC_Error_Count         0

M.2 Drive 1  Lexar SSD NM790 2TB  PK62204100657P220J  /dev/nvme0n1
SMART Error Counter Log:         No Errors Logged
  1 Critical_Warning             0
  2 Temperature                  40 C
  5 Percentage Used              2%
 12 Power On Hours               5166
 13 Unsafe Shutdowns             3
 14 Media Errors                 0

M.2 Drive 2  Lexar SSD NM790 2TB  PK62204105743P220J  /dev/nvme1n1
SMART Error Counter Log:         No Errors Logged
  1 Critical_Warning             0
  2 Temperature                  37 C
  5 Percentage Used              2%
 12 Power On Hours               5166
 13 Unsafe Shutdowns             3
 14 Media Errors                 0

Finished
 
Über die unsafe shutdowns würde ich mir keinen Kopf machen, mal hart heruntergefahren?
Aber hierüber: 199 UDMA_CRC_Error_Count 2
Mindestens mal beobachten
 
  • Like
Reaktionen: Benie
Ich wüsste nicht das meine DS irgendwann mal hart runtergefahren ist. Höchstens Neustart nach Updates etc.
Ja die 199 UDMA_CRC_ERROR_COUNT 2 beobachte ich. Die Platte nutze ich ausschließlich als Volume3 für die SS mit 4 Kameras
 
  • Like
Reaktionen: ctrlaltdelete
Some of my NVMe drives also show 3 unsafe shutdowns from when I removed them while the NAS was running because the NAS was busy and I didn't want to shut it down. I needed the NVMe drives for a test in another NAS.
 
  • Like
Reaktionen: Nackel und maxblank
Hallo, danke für die sehr gute Anleitung. Ich habe allerdings Probleme beim Skript in der "Aufgabeneinstellungen": Der Name der HDD ist falsch (sata1 bzw. sata2) passt bei mir wohl nicht. Ich bekomme immer "Smartctl open device: /dev/sata2 [SAT] failed: No such device". Wie bekomme ich denn raus, wie bei mir die HDD heißen?
 
Bei älteren NASen heißen die Platten noch /dev/sda, /dev/sdb usw. anstatt /dev/sata1, /dev/sata2 usw. Steht aber auch in #1.
 
1, 3 und 4 würde ich tauschen. 80.000 Stunden ist doch echt ok.
 
  • Like
Reaktionen: DaveR
But which HDD to replace first.
  • I've had 2 HDDs that I wanted to replace. While the RAID was rebuilding after replacing the 1st HDD the 2nd HDD died (so I had to restore from backups).
  • Another time a drive HDD got lots of bad sectors so I replaced it and as soon as the RAID was finished rebuilding a 2nd HDD reported lots of bad sectors.
 
In this case, update the backup, create a new pool and restore.
 
Ich würde alle ersetzen und den Pool mit den neuen Platten neu aufsetzen und keinesfalls den bestehenden Pool durch den Tausch der Platten 3× reparieren.
 
  • Like
Reaktionen: ctrlaltdelete
Wie wahrscheinlich ist es, dass es nochmals 5 Jahre so läuft? Habt ihr Festplatten die 15 oder 20 Jahre liefen?
Es sind 4 x Western Digital Red SATA III 3TB (WD30EFRX)

Das NAS macht eine komplette Spiegelung auf eine angeschlossene USB Festplatte.
 
Die jetzigen HDDs 1, 3 und 4 werden sterben, geschätzt in den nächsten 6-12 Monaten.
 
Meistens ist es bei Dir die ID 1 und die ID 200, welche bereits die entsprechenden Fehler aufzeigen.
Das sind beides Fehlerindikationen die eben darauf hinweisen das die HDDs bald sterben, wenn da Fehler auftauchen.
 
Erfahrungswerte im Bezug auf die kritischen IDs.
 
  • Like
Reaktionen: *kw*
Ich möchte darauf hinweisen, dass @DaveR meinen Vorschlag, sein Script Syno_smart_info zu erweitern, aufgenommen hat und es jetzt folgende nützliche Funktion bietet:

Wenn man die Option -i angibt wird ein RC > 0 nur dann generiert wenn sich ein SMART Wert geändert hat, sowohl positiv als auch negativ. D.h. nur dann bekommt man eine eMailBenachrichtigung vom Aufgabenplaner.

Das Feature ist noch in der Testphase und es würde von Dave sicherlich gern gesehen, wenn sich noch weitere Leute ausser mir finden würden, die das Feature testen ;) Weitere Details finden sich hier im github.

Great work @DaveR and thank you very much you spent your spare time to add this new feature. (y)
 
Code:
Der Aufgabenplaner hat eine geplante Aufgabe abgeschlossen.

Aufgabe: SMART Email revad
Start: Tue, 07 Oct 2025 13:42:01 +0200
Ende: Tue, 07 Oct 2025 13:42:07 +0200
Aktueller Status: 0 (Normal)
Standardausgabe/Fehler:

Synology_SMART_info v1.4.24 - by 007revad
DS920plus DS920+ DSM 7.2.2-72806-4
Using smartctl 7.5
Using options: --email --increased

No drives have increased important SMART attributes


Von DS920plus
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat