1513+ mit DX513: Crash bei hohem Datendurchsatz

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

Status
Für weitere Antworten geschlossen.

DonLibre

Benutzer
Registriert
04. Dez. 2012
Beiträge
22
Reaktionspunkte
0
Punkte
1
Hallo liebe Forumsmitglieder.

ich wende mich an Euch, da ich mit einem Thema irgendwie nicht so richtig weiter komme. Ich stelle mal ein paar Infos zur Verfügung. Wenn mehr benötigt wird, bitte bescheid geben.

Danke vorab für eure Unterstützung.

Problem:

Sobald der Datendurchsatz sehr hoch ist, fliegt mir das RAID 5 in der DX513 um die Ohren. Bsp: Time-Machine aktiv von gleichzeitig 3 Rechnern und parallel dazu in der Download-Station Daten mit ca. 20.000 kB/s herunter laden. Kurze Zeit später bekomme ich die Meldung, dass das RAID gecrashed ist. Meistens sind 3 Platten (nicht immer die selben) abgeschmiert.

Im Log beginnt das ganze z.B. mit den Einträgen

  • Write error occurred at DX513-1 disk [X], sector [XXXXXXXX].
  • Write error occurred at DX513-1 disk [X], sector [XXXXXXXX]

Das data scrubbing mache ich ca. 1 x pro Monat.

Das RAID in der DS1513+ läuft stabil durch. Wenn ich z.B. eine Test-Datei mit 100GB von meinem Mac auf die DS schiebe, schwankt zwar die Performance, aber alles bleibt gut. Beim DX hingegen kann ich darauf Wetten, dass es mir abschmiert.

Jetzt ist es mir mal wieder abgeschmiert, nachdem ich die Time-Machine Ordner (ca. 600 GB) von Volume 1 auf Volume 2) verschieben wollte. Das ganze dauerte ca. 5 Minuten, bis das RAID defekt war.


Config:

DS1513+, und über SATA die DX513 angeschlossen
DSM: 5.2.644 update 5

DS1513+: BOND mit 3 x 1GB/s (MTU=6.000). Damit komme ich auf bis zu 140MB/s (iStat)
DX-513: 4 x WD20EFRX-68EUZN0, mit Hot Spare WD20EFRX-68EUZN0

Die Platten im DX513 sind ca. 1 Jahr alt und haben ca. 3.500 Stunden auf dem Buckel.

Zusatz-Info:

Die Temp. der Platten ist bei ca. 26-30°C, je nach Auslastung.

#cat /proc/mdstat

Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md3 : active raid5 sdgd3[3] sdgc3[2] sdgb3[1] sdga3[0]
5846077632 blocks super 1.2 level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
[>....................] resync = 2.7% (53122824/1948692544) finish=2100.5min speed=15040K/sec (Kommentar: Wird gerade mal wieder hergestellt)

md2 : active raid5 sda3[5] sde3[7] sdd3[3] sdc3[6] sdb3[1]
11702177024 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]
bitmap: 0/349 pages [0KB], 4096KB chunk

md1 : active raid1 sda2[0] sdb2[1] sdc2[2] sdd2[3] sde2[4]
2097088 blocks [5/5] [UUUUU]

md0 : active raid1 sda1[0] sdb1[1] sdc1[2] sdd1[3] sde1[4]
2490176 blocks [5/5] [UUUUU]

Bildschirmfoto 2016-02-29 um 12.23.56.png
 
Was sagen die SMART Werte der einzelnen Festplatten in der DX?
 
Danke für die schnelle Rückmeldung:

Ich habe gerade nur die Werte von 2 Platten parat, die ich mir gestern mal gespeichert habe.

Rich (BBCode):
1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   178   171   021    Pre-fail  Always       -       4075
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       274
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       3547
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       194
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       7
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       360
194 Temperature_Celsius     0x0022   120   112   000    Old_age   Always       -       27
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

--

  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   177   172   021    Pre-fail  Always       -       4133
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       176
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       2178
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       116
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       10
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       252
194 Temperature_Celsius     0x0022   121   109   000    Old_age   Always       -       26
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Ich glaube mich erinnern zu können, dass die anderen Platten "ähnliche" Werte hatten. Mit selber sagen die Werte eher weniger - sorry.
 
Die Werte sehen gut aus. Vergleiche sie bitte bei Gelegenheit einmal mit den Werten der übrigen Platten. Ansonsten würde ich an Deiner Stelle ein Ticket bei Synology aufmachen.
 
Mach von den einzelnen SMART Werte der Festplatten im DSM einen Screenshot damit man auch die Beschritung mit sieht.

Auch würde ich zu testzwecken mal deine MTU auf Standart umstellen, vielleich kommt die DS deshalb aus dem Schritt.
 
Hi.

Danke für Eure Unterstützung. Ich habe nun einen Weg gefunden, um das RAID auf der DX513 stabil zu bekommen:

Vorher:

/proc/sys/dev/raid/speed_limit_max 200000
/proc/sys/dev/raid/speed_limit_min 30000

Nachher:

/proc/sys/dev/raid/speed_limit_max 100000
/proc/sys/dev/raid/speed_limit_min 10000

Dann habe ich einen Test gemacht und von 4 Rechnern jeweils ein 100GB file auf die DS kopiert (ETH: 1.0 GB/s MTU=6000). Das Raid war dann stabil. Danach habe ich einen Wert (speed_limit_max) wieder auf 200000 gesetzt und das RAID ist wieder gecrashed. Bei 100000 ist alles ok und das RAID stabil. Gefühlt gibt es keine Performance Einbusen.
 
Also bei mir auf der DS 415+ habe ich zwar auch diese beiden Dateien, aber bei mir heissen die nur
speed_limit_max und
speed_limit_min

und haben keinen Inhalt also 0 Byte.
 
mache mal bitte folgendes:

Rich (BBCode):
cat /proc/sys/dev/raid/*

Ergebnis sollte irgendwas vergleichbares sein:

Rich (BBCode):
100000
10000

Mit dem nachfolgenden Befehl kannst Du die Werte verändern:

Rich (BBCode):
echo 100000 >/proc/sys/dev/raid/speed_limit_max
echo 10000 >/proc/sys/dev/raid/speed_limit_min

Das ist der Pfad: "/proc/sys/dev/raid/"

Ich habe nach einiger Recherche für mich den unteren Wert auf 30000 und den oberen Wert auf 20000 gesetzt. Das war früher ohne die DX auch ok. Mit der DX ist dies wohl nicht mehr möglich.

Wenn ich ein RAID herstelle, dann werden die Werte auf den höchsten Wert gesetzt, damit die Erweiterung schneller geht. Nachteil: Performance-Einbussen und der Speicher wird mehr belegt. Meine DS hat 3GB und ist somit ausrechend ausgestattet.
 
Hallo,

habe das mal gemacht:

/proc/sys/dev/raid$ cat /proc/sys/dev/raid/*
200000
10000

Und ich habe 200000 und 10000 und mein Raid läuft wie Sau.
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat