HDD SATA SMART auswerten - Festplatten langsam durchtauschen oder nicht?

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

SATA HDD

Dreffi

Benutzer
Registriert
10. Aug. 2024
Beiträge
4
Reaktionspunkte
1
Punkte
3
Hallo,

ich betreibe eine DS 920+ mit vier HDDs im Synology Hybrid Raid.
Zwei der Festplatten (je 2 TB) sind noch aus meinem Vorgänger NAS und daher schon recht alt. Zwei weitere Festplatten (je 4 TB) habe ich nach und nach zur Erweiterung ergänzt.

Nun habe ich als Reserve Platte eine neue 4 TB Platte hier. Grundgedanke war damit auf einen potentiellen Ausfall einer Platte vorbereitet zu sein. Die spontane Verfügbarkeit von HDDs ist derzeit ja nicht mehr ganz so gut. Ich überlege allerdings die beiden alten 2 TB Platten so langsam vorsorglich auszutauschen, damit mir nicht die zweite beim Wiederherstellen des Raid stirbt. Die ausgebauten Platten könnte ich ggfs. für mein Backup weiterverwenden.

Kann jemand meine per Script ausgelesenen SMART Werte beurteilen, ob hier schon etwas auffällig ist? Ich habe leider keine Ahnung davon.

Code:
Drive /dev/sata1:
START OF INFORMATION SECTION
Model Family:     Seagate IronWolf
Device Model:     ST4000VN006-3CW104
Serial Number:    ZW60AMQF
LU WWN Device Id: 5 000c50 0e5d1e15e
Firmware Version: SC60
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Apr  9 16:13:27 2026 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
SMART overall-health self-assessment test result: PASSED

 ID  | Attribute                         | (1) | (2) | (3) | (4)
 1   | Raw_Read_Error_Rate               | 073 | 064 | 006 | 19609740 <!
 3   | Spin_Up_Time                      | 096 | 095 | 000 | 0 <!
 4   | Start_Stop_Count                  | 100 | 100 | 020 | 38   
 5   | Reallocated_Sector_Ct             | 100 | 100 | 010 | 0 <!
 7   | Seek_Error_Rate                   | 085 | 060 | 045 | 321255273 <!
 9   | Power_On_Hours                    | 070 | 070 | 000 | 26489   
 10  | Spin_Retry_Count                  | 100 | 100 | 097 | 0 <!
 12  | Power_Cycle_Count                 | 100 | 100 | 020 | 38   
 183 | Runtime_Bad_Block                 | 100 | 100 | 000 | 0   
 184 | End-to-End_Error                  | 100 | 100 | 099 | 0   
 187 | Reported_Uncorrect                | 100 | 100 | 000 | 0   
 188 | Command_Timeout                   | 100 | 100 | 000 | 0   
 189 | High_Fly_Writes                   | 100 | 100 | 000 | 0   
 190 | Airflow_Temperature_Cel           | 069 | 062 | 040 | 31   
 191 | G-Sense_Error_Rate                | 100 | 100 | 000 | 0   
 192 | Power-Off_Retract_Count           | 100 | 100 | 000 | 2   
 193 | Load_Cycle_Count                  | 100 | 100 | 000 | 38   
 194 | Temperature_Celsius               | 031 | 040 | 000 | 31   
 195 | Hardware_ECC_Recovered            | 073 | 064 | 000 | 19609740   
 197 | Current_Pending_Sector            | 100 | 100 | 000 | 0   
 198 | Offline_Uncorrectable             | 100 | 100 | 000 | 0   
 199 | UDMA_CRC_Error_Count              | 200 | 200 | 000 | 0   
 240 | Head_Flying_Hours                 | 100 | 253 | 000 | 26489h+35m+39.958s   
 241 | Total_LBAs_Written                | 100 | 253 | 000 | 19374371791   
 242 | Total_LBAs_Read                   | 100 | 253 | 000 | 259991579970   

Drive /dev/sata2:
START OF INFORMATION SECTION
Model Family:     Seagate IronWolf
Device Model:     ST4000VN006-3CW104
Serial Number:    ZW602ARK
LU WWN Device Id: 5 000c50 0e501ec72
Firmware Version: SC60
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Apr  9 16:13:28 2026 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
SMART overall-health self-assessment test result: PASSED

 ID  | Attribute                         | (1) | (2) | (3) | (4)
 1   | Raw_Read_Error_Rate               | 073 | 064 | 006 | 19209028 <!
 3   | Spin_Up_Time                      | 095 | 095 | 000 | 0 <!
 4   | Start_Stop_Count                  | 100 | 100 | 020 | 46   
 5   | Reallocated_Sector_Ct             | 100 | 100 | 010 | 0 <!
 7   | Seek_Error_Rate                   | 087 | 060 | 045 | 516979480 <!
 9   | Power_On_Hours                    | 066 | 066 | 000 | 30554   
 10  | Spin_Retry_Count                  | 100 | 100 | 097 | 0 <!
 12  | Power_Cycle_Count                 | 100 | 100 | 020 | 46   
 183 | Runtime_Bad_Block                 | 100 | 100 | 000 | 0   
 184 | End-to-End_Error                  | 100 | 100 | 099 | 0   
 187 | Reported_Uncorrect                | 100 | 100 | 000 | 0   
 188 | Command_Timeout                   | 100 | 100 | 000 | 0   
 189 | High_Fly_Writes                   | 100 | 100 | 000 | 0   
 190 | Airflow_Temperature_Cel           | 068 | 061 | 040 | 32   
 191 | G-Sense_Error_Rate                | 100 | 100 | 000 | 0   
 192 | Power-Off_Retract_Count           | 100 | 100 | 000 | 2   
 193 | Load_Cycle_Count                  | 100 | 100 | 000 | 46   
 194 | Temperature_Celsius               | 032 | 040 | 000 | 32   
 195 | Hardware_ECC_Recovered            | 073 | 064 | 000 | 19209028   
 197 | Current_Pending_Sector            | 100 | 100 | 000 | 0   
 198 | Offline_Uncorrectable             | 100 | 100 | 000 | 0   
 199 | UDMA_CRC_Error_Count              | 200 | 200 | 000 | 0   
 240 | Head_Flying_Hours                 | 100 | 253 | 000 | 30554h+38m+35.185s   
 241 | Total_LBAs_Written                | 100 | 253 | 000 | 32769712004   
 242 | Total_LBAs_Read                   | 100 | 253 | 000 | 287916179582   

Drive /dev/sata3:
START OF INFORMATION SECTION
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD20EFRX-68EUZN0
Serial Number:    WD-WCC4M0RX7NJR
LU WWN Device Id: 5 0014ee 26266d02c
Firmware Version: 82.00A82
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Apr  9 16:13:28 2026 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
SMART overall-health self-assessment test result: PASSED

 ID  | Attribute                         | (1) | (2) | (3) | (4)
 1   | Raw_Read_Error_Rate               | 200 | 200 | 051 | 0 <!
 3   | Spin_Up_Time                      | 173 | 171 | 021 | 4341 <!
 4   | Start_Stop_Count                  | 061 | 061 | 000 | 39139   
 5   | Reallocated_Sector_Ct             | 200 | 200 | 140 | 0 <!
 7   | Seek_Error_Rate                   | 200 | 200 | 000 | 0   
 9   | Power_On_Hours                    | 005 | 005 | 000 | 70050   
 10  | Spin_Retry_Count                  | 100 | 100 | 000 | 0   
 11  | Calibration_Retry_Count           | 100 | 100 | 000 | 0   
 12  | Power_Cycle_Count                 | 099 | 099 | 000 | 1683   
 192 | Power-Off_Retract_Count           | 198 | 198 | 000 | 1601   
 193 | Load_Cycle_Count                  | 188 | 188 | 000 | 38155   
 194 | Temperature_Celsius               | 118 | 098 | 000 | 29   
 196 | Reallocated_Event_Count           | 200 | 200 | 000 | 0   
 197 | Current_Pending_Sector            | 200 | 200 | 000 | 0   
 198 | Offline_Uncorrectable             | 100 | 253 | 000 | 0   
 199 | UDMA_CRC_Error_Count              | 200 | 200 | 000 | 0   
 200 | Multi_Zone_Error_Rate             | 200 | 200 | 000 | 0   

Drive /dev/sata4:
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD20EFRX-68EUZN0
Serial Number:    WD-WCC4M7TH86FN
LU WWN Device Id: 5 0014ee 26266d5c0
Firmware Version: 82.00A82
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Apr  9 16:13:28 2026 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
SMART overall-health self-assessment test result: PASSED

 ID  | Attribute                         | (1) | (2) | (3) | (4)
 1   | Raw_Read_Error_Rate               | 200 | 200 | 051 | 0 <!
 3   | Spin_Up_Time                      | 171 | 169 | 021 | 4416 <!
 4   | Start_Stop_Count                  | 067 | 067 | 000 | 33432   
 5   | Reallocated_Sector_Ct             | 200 | 200 | 140 | 0 <!
 7   | Seek_Error_Rate                   | 200 | 200 | 000 | 0   
 9   | Power_On_Hours                    | 005 | 005 | 000 | 70047   
 10  | Spin_Retry_Count                  | 100 | 100 | 000 | 0   
 11  | Calibration_Retry_Count           | 100 | 100 | 000 | 0   
 12  | Power_Cycle_Count                 | 099 | 099 | 000 | 1682   
 192 | Power-Off_Retract_Count           | 198 | 198 | 000 | 1599   
 193 | Load_Cycle_Count                  | 190 | 190 | 000 | 32452   
 194 | Temperature_Celsius               | 118 | 098 | 000 | 29   
 196 | Reallocated_Event_Count           | 200 | 200 | 000 | 0   
 197 | Current_Pending_Sector            | 200 | 200 | 000 | 0   
 198 | Offline_Uncorrectable             | 100 | 253 | 000 | 0   
 199 | UDMA_CRC_Error_Count              | 200 | 200 | 000 | 0   
 200 | Multi_Zone_Error_Rate             | 200 | 200 | 000 | 0   
 
  (1) Value, (2) Worst, (3) Threshold, (4) Raw, <! Pre-fail value
 
sehe keine Probleme mit den Platten

allerdings, bei so einem Raid ist es immer gut zu tauschen bevor alles anfängt zu bröckeln. Grund ist, nach einem Tausch, wird der Raid repariert. Ist dann eve noch eine zweite Platte da mit möglichen Problemen, kann das zu einem Ausfall einer weiteren Platte führen, was bei SHR (~raid5) fatal sein könnte.

Ich habe kürzlich alle Platten , die hatten ca 83kh , nach und nach ersetzt, auch wenn die Platten sonst OK waren.
 
  • Like
Reaktionen: Dreffi
Danke für die Einschätzung. Die beiden 2 TB Platten sind immerhin gleich alt und haben je schon 8 Jahre Betrieb auf dem Buckel. Meine Angst hier ist, wenn ich eine defekte austausche, stirbt dabei die zweite.

Die Arbeitslast ist normal eher gering. Größtenteils läuft das NAS als Speicher. Container und VMs nutzen einen zweiten Speicherpool aus SSDs. Ein Ausfall des Systems zur Wiederherstellung aus einem Backup wäre trotzdem äußerst unangenehm.

Ist mein Ansatz eine der 2 TB HDDs vorsorglich auszutauschen also nicht ganz abwegig? Diese könnte für Backups noch sinnvoll eingesetzt werden. Backups der einzelnen Daten laufen 1x täglich. Das wichtigste wird alle 6 Stunden gesichert.
 
die beiden 2T sind doch noch sehr jung

ich würde eher bei den mit 70kh anfangen zu wechseln.
Ich denke nicht dass hier bei einem Wechsel was nicht geht, 70kh noch nicht sooo viel

Die Platten haben keine Probleme, zu hause habe ich da etwas mit 110kh und alles läuft
 
  • Like
Reaktionen: Dreffi
Die 2 TB Platten sind die mit den 70kh.
Die 4 TB Platten haben 26kh bzw. 30kh.

Aber egal, wenn das noch nicht sonderlich viel ist, lass ich die neue 4 TB Platte als Reserve zum Austauschen liegen.
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat