Extem verlangsamter Datenzugriff auf CS407e

Status
Für weitere Antworten geschlossen.

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
Guten Tag,

ich habe ein wenig in diesem Forum gelesen, allerdings habe ich leider nicht das passende Thema zu meiner Problematik gefunden. Ich denke, dass meine Problemstellung in diesem Forum am besten aufgehoben ist, auch wenn es die Definition aus https://www.synology-forum.de/showthread.html?10420-Was-gehört-in-diese-Kategorie nicht ganz trifft.

Folgendes Problem:
Seit einiger Zeit ist mein NAS schwer mit sich selbst beschäftigt. Bei einem Zugriff via SMB dauert allein das Anzeigen einer Ordnerstruktur eine halbe Ewigkeit. Nun dachte ich mir - bevor ich gar nicht mehr auf das System zugreifen kann sichere ich meine Daten. Das ganze hat via SMB erst einmal wie erwartet überhaupt nicht geklappt. - Als nächster Anlauf.

Ich habe mich via SSH auf dem Gerät eingeloggt und erst einmal alle möglichen Prozesse gestoppt via killall.
Damit sieht meine Prozessübersicht wie folgt aus:
Rich (BBCode):
Mem: 121264K used, 5532K free, 0K shrd, 29348K buff, 60796K cached
CPU:  0.1% usr  0.3% sys  0.1% nic 45.9% idle 53.2% io  0.0% irq  0.0% sirq
Load average: 3.66 3.60 3.48 2/48 3707
  PID  PPID USER     STAT   VSZ %MEM %CPU COMMAND
 3707  3667 admin    R     4012  3.1  0.3 top
 1502     1 root     S     8420  6.6  0.2 /usr/syno/bin/scemd
 2886     1 root     S N   8048  6.3  0.2 /bin/ntfs-3g -o uid=1024,gid=100 /dev/sdk5 /volumeUSB1/usbshare1-5
 3292     1 root     S    15276 12.0  0.0 /usr/syno/sbin/nmbd -D
 2758     1 root     S    15180 11.9  0.0 /usr/syno/sbin/hotplugd
 1442     1 root     S <  11760  9.2  0.0 /usr/syno/bin/findhostd
 3599     1 root     S N   9324  7.3  0.0 /usr/syno/bin/synomkthumbd
 3612     1 root     S N   9324  7.3  0.0 /usr/syno/sbin/synomkflvd
 3630  3624 admin    S     6748  5.3  0.0 sshd: admin@pts/1
 3624  3471 root     S     6748  5.3  0.0 sshd: admin [priv]
 3660  3471 root     S     6748  5.3  0.0 sshd: admin [priv]
 3666  3660 admin    S     6748  5.3  0.0 sshd: admin@pts/0
 3667  3666 admin    S     4032  3.1  0.0 -sh
 3631  3630 admin    S     4028  3.1  0.0 -sh
 2780     1 root     S     4008  3.1  0.0 /usr/sbin/crond
 2773     1 root     S     4004  3.1  0.0 /usr/sbin/inetd
 3471     1 root     S     3804  3.0  0.0 /usr/syno/sbin/sshd
 3172     1 root     S     3788  2.9  0.0 /usr/syno/sbin/cupsd -C /usr/local/cups/cupsd.conf
 3700  3631 admin    D     2600  2.0  0.0 cp -r 2008 /volumeUSB1/usbshare1-5
    1     0 root     S     2584  2.0  0.0 init
 1273     1 root     S     2584  2.0  0.0 /sbin/klogd
 3572     1 root     S     2580  2.0  0.0 avahi-daemon: running [Dachboden2.local]
 2472     1 root     S     2580  2.0  0.0 /sbin/getty 115200 console
 1271     1 root     S     2576  2.0  0.0 /sbin/syslogd -S
 1380     5 root     DW<      0  0.0  0.0 [md2_raid5]
 1841     5 root     SW<      0  0.0  0.0 [usb-storage]
  166     5 root     DW<      0  0.0  0.0 [md0_raid1]
    2     1 root     SWN      0  0.0  0.0 [ksoftirqd/0]
   40     1 root     SW       0  0.0  0.0 [kswapd0]
  263     1 root     DW       0  0.0  0.0 [kjournald]
   39     5 root     SW       0  0.0  0.0 [pdflush]
 1466     1 root     DW       0  0.0  0.0 [kjournald]
   11     5 root     SW<      0  0.0  0.0 [kblockd/0]
    4     1 root     SW<      0  0.0  0.0 [khelper]
 1150     5 root     SW<      0  0.0  0.0 [khubd]
   38     5 root     SW       0  0.0  0.0 [pdflush]
    3     1 root     SW<      0  0.0  0.0 [events/0]
    5     1 root     SW<      0  0.0  0.0 [kthread]
   41     5 root     SW<      0  0.0  0.0 [aio/0]
  108     5 root     SW<      0  0.0  0.0 [ata/0]
  111     5 root     SW<      0  0.0  0.0 [scsi_eh_0]
  112     5 root     SW<      0  0.0  0.0 [scsi_eh_1]
  113     5 root     SW<      0  0.0  0.0 [scsi_eh_2]
  114     5 root     SW<      0  0.0  0.0 [scsi_eh_3]
  144     1 root     SW       0  0.0  0.0 [mtdblockd]
  164     5 root     SW<      0  0.0  0.0 [ksnapd]
  168     5 root     SW<      0  0.0  0.0 [md1_raid1]
 1839     5 root     SW<      0  0.0  0.0 [scsi_eh_4]

Anschließend habe ich eine USB-Festplatte angeschlossen und versucht ausgewählte Daten mit Hilfe des Befehls
Rich (BBCode):
 cp -r 2008 /volumeUSB1/usbshare1-5
(Ich habe mich beim Absenden des Befehls in dem Ordner befunden, in dem sich der Ordner 2008 befindet.)
Über ein zweites Terminal beobachte ich wie viele Dateien bereits auf die USB-Platte kopiert worden sind. Nach etwa 2 Stunden wurden ganze 13 Bilder kopiert. Es scheint sich also nicht besonders viel zu tun.

Gibt es für mich noch eine weitere Möglichkeit meine Daten zu retten, oder weiß jemand, warum das Gerät so träge reagiert?

Vielleicht noch kurz zu dem Gerät:
Es ist eine CubeStation 407e mit 4x 1 TB Platten im RAID 5. Die 4. Platte wurde vor etwa einem Jahr nachträglich hinzugefügt.

Gruß
MoJou
 

Andy+

Benutzer
Sehr erfahren
Mitglied seit
25. Jan 2016
Beiträge
5.018
Punkte für Reaktionen
318
Punkte
189
Etwas mehr Informationen sind schon erforderlich. Kannst Du einen Screenshot senden von CPU-Auslastung, Speicherauslastung, Festplattenbelegung usw. Vielleicht sind Deine HD´s voll, zu analysieren wäre, ob die Hardware einen Schaden hat, immerhin ist die CS ein paar Jährchen alt, usw. Eine Analyse ist da schon erforderlich. Sende vielleicht mit dieser Prio:

1. Festplattenbelegung,
2. CPU-Auslastung,
3. Speicherauslastung,
4. ggf. weiteres
 

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.456
Punkte für Reaktionen
1.393
Punkte
288
1. Viel interessanter als die Plattenbelegung dürften deren S.M.A.R.T.-Werte sein.
2. und 3. lassen sich doch aus der geposteten Prozessliste entnehmen und da fällt I/O mit >50% CPU-Auslastung auf.
 

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
Vielleicht ist das in der Datenflut etwas untergegangen.
Rich (BBCode):
Mem: 121264K used, 5532K free, 0K shrd, 29348K buff, 60796K cached
CPU:  0.1% usr  0.3% sys  0.1% nic 45.9% idle 53.2% io  0.0% irq  0.0% sirq
Load average: 3.66 3.60 3.48 2/48 3707
IO ist bei 0%, idle bei 53,3%

Das scheint allerdings eine etwas ungünstige Momentaufnahme zu sein.


aktuell sieht es eher so aus

Rich (BBCode):
Mem: 120296K used, 6500K free, 0K shrd, 37076K buff, 50840K cached
CPU:  0.5% usr  1.7% sys  0.0% nic  0.0% idle 97.7% io  0.0% irq  0.0% sirq
Load average: 3.39 3.53 3.52 2/50 3740


df gibt mir folgendes:
Rich (BBCode):
df
Filesystem           1K-blocks      Used Available Use% Mounted on
/dev/md0               2450808    527888   1898024  22% /
/tmp                     63396       344     63052   1% /tmp
/dev/md2             2875024152 1990873224 883870276  69% /volume1
/dev/sdk5            976728060 719964136 256763924  74% /volumeUSB1/usbshare1-5

Beim letzten SMART-Test in der Weboberfläche war alles in Ordnung. (Keinerlei Meldungen)

edit:
Dazu vielleicht kurz:
Ich habe nun auch so gut wie alle Dienste runtergefahren. Kein SMB, kein Web-Interface; Eigentlich nurnoch SSH
 

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.456
Punkte für Reaktionen
1.393
Punkte
288
Rich (BBCode):
Mem: 121264K used, 5532K free, 0K shrd, 29348K buff, 60796K cached
CPU:  0.1% usr  0.3% sys  0.1% nic 45.9% idle 53.2% io  0.0% irq  0.0% sirq
Load average: 3.66 3.60 3.48 2/48 3707
IO ist bei 0%, idle bei 53,3%
Nein, schau noch einmal genau hin.

Das scheint allerdings eine etwas ungünstige Momentaufnahme zu sein.
Von wegen, folgendes sieht noch übler aus:

aktuell sieht es eher so aus

Rich (BBCode):
Mem: 120296K used, 6500K free, 0K shrd, 37076K buff, 50840K cached
CPU:  0.5% usr  1.7% sys  0.0% nic  0.0% idle 97.7% io  0.0% irq  0.0% sirq
Load average: 3.39 3.53 3.52 2/50 3740
fast 100% I/O

Beim letzten SMART-Test in der Weboberfläche war alles in Ordnung. (Keinerlei Meldungen)
Danach war gar nicht gefragt.
 

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
Ach, du hast vollkommen recht! Ich hab geistesabwesend gedacht links Beschriftung, rechts Wert...

Ich habe versucht die SMART-Werte via
Rich (BBCode):
 smartctl -all /dev/hda1
auszulesen, jedoch bekomme ich da nur folgendes
Rich (BBCode):
smartctl version 5.38 [armle-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Smartctl: Device Read Identity Failed (not an ATA/ATAPI device)

A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.

Bin mir da bei der Verwendung des Befehls nicht so ganz sicher wie man sieht...

Weist eine hohe I/O Auslastung auf eine defekte HDD hin?

edit:
Das ist noch was ich bei der 2. HDD im Web-IF auslesen konnte. Das Webif hat mir nach dem Test den Hinweis gegeben diese Platte möglichst auszutauschen - kann ich diese einfach austauschen? - Wird die Parität dann neu berechnet?

SMART.png
 
Zuletzt bearbeitet:

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.456
Punkte für Reaktionen
1.393
Punkte
288
Die Werte (ID 197, 198 u. 200) sehen übel aus. Die Platte ist am Sterben.

Weiterhin sind ID4 und 193 extrem hoch. Du solltest mal deine Energiespareinstellungen überdenken. Bei der Platte wurde im Durchschnitt 3 mal pro Stunde die Spindel gestoppt und wieder angefahren.

Das ist noch was ich bei der 2. HDD im Web-IF auslesen konnte. Das Webif hat mir nach dem Test den Hinweis gegeben diese Platte möglichst auszutauschen - kann ich diese einfach austauschen? - Wird die Parität dann neu berechnet?
Wenn die in einem RAID1, 5 oder 6 bzw. SHR mit Redundanz steckt, dann ja. Aber angesichts des Alters der Platten ist ein Tausch aller Platten und Restore aus dem Backup zu empfehlen. Der Stress bei der Reperatur des RAIDs killt möglicherweise weitere Platten.

Scheck bitte auch die anderen Platten.
 
Zuletzt bearbeitet:

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
Ich hatte bei der alten DSM immer das Problem, dass die Platten anlaufen, sobald Netzwerkaktivität vorliegt, und zwar egal ob es die CS betrifft oder nicht. Daher sind die Platten nur in den Standby gefahren, wenn kein Netzwerkkabel angeschlossen war...

Könnte ich testweise auch zunächst auch die defekte Platte nur rausnehmen um zu sehen ob die Daten dann noch erreichbar sind?

Die anderen SMART-Werte poste ich später... Das teil ist zZ wie gesagt sehr träge...
 

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.456
Punkte für Reaktionen
1.393
Punkte
288
Wenn die CS nicht betroffen wäre, hätte sie nicht die Platten hochgefahren.

Wenn die Platte in einem Volumen o. Speicherpool mit RAID 1, 5, 6 oder SHR o. SHR-2 steck, dann kannst du sie entnehmen.
 

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
So ich habe nun mal die Daten der verbleibenden Platten gezogen:

SMARTHDD1.PNG
SMARTHDD3.PNG
SMARTHDD4.PNG
Denke das ist noch vertretbar, sehe ich das richtig?

Die Platten sind alle in einem Volumen (RAID 5).

Nachtrag:
Vielleicht nochmal zur hohen Anzahl der Betriebsstunden.

Ich habe eingestellt, dass sich die Platten nach 10 Minuten Inaktivität ausschalten sollen.
Stunden.jpg

Hat leider nur eigentlich nie funktioniert. Nur wenn ich das Netzwerkkabel getrennt habe. (Ich habe keinerlei Portfreigaben im Netzwerk o.Ä. Es reicht scheinbar, dass der Router seine Broadcasts schickt.)
 
Zuletzt bearbeitet:

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
8.456
Punkte für Reaktionen
1.393
Punkte
288
Die restlichen Platten sind den S.M.A.R.T.-Werten nach noch in Ordnung. 2 davon sind aber ähnlich lange gelaufen wie die defekte Platte und denen würde ich, wie schon mal erwähnt, den Stress eines RAID-Rebuilds nicht mehr zumuten.


Für die Betriebsstunden ist es unerheblich, ob der Plattenstapel rotiert oder stillsteht. Irgend ein Zugriff eines Gerätes in deinem Netz führt dazu, dass die DS die Platten wieder aufweckt. Das kann, muss aber nicht der Router sein. In der aktuellen Situation halte ich es für besser, die Platten durchlaufen zu lassen und die DS gegenenfalls in den Zeiten der Nichtnutzung auszuschalten.
 

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
Das hätte ich auch sicher vorgezogen.

Leider ist es bei der CS407 so, dass diese sich geplant ausschalten - aber nicht einschalten lässt. (Ist auch nicht WOL-Fähig)
Ich werde wohl auf eine DS418play setzen, sobald ich meine Daten irgendwie gerettet hab...


Der Datentransfer dauert leider extrem lange - Beim kopieren via SSH auf eine angeschlossene USB-Platten komme ich auf etwa 100 MB / Stunde...
Ich versuche jetzt grade mal die CS zu starten mit 3 Platten (HDD2 abgeklemmt) allerdings komme ich da nach etwa 20 min noch immer nicht auf das Gerät. Auf Pings antwortet die CS schon, SSH und Webinterface gehen noch nicht..
 

MoJou

Benutzer
Mitglied seit
22. Feb 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
0
Vielleicht noch ein kurzer Hinweis was ich nun noch getan habe für die Nachwelt:

Da ich die Vermutung hatte, dass die HDD2 das NAS enorm ausbremst, allerdings trotzdessen noch aktiv war habe ich diese kurzerhand abgeklemmt (SATA- Kabel und die Spannungsversorgung).

Daraufhin startete das NAS ersteinmal garnicht mehr. -> Platte wieder rein

Daraufhin wurde das Volume1 als Fehlerhaft markiert (Vgl. Abbildung)

Anhang anzeigen 46666

Nun ist die Disk nicht mehr im Volume integriert und ich kann meine Daten zunächst einmal via SSH auf meine USB - Platte sichern.

Da hierbei trotz deaktiviertem Media-Server, Photo-Station usw. Prozesse aktiv sind, die die CS immernoch ausbremsen habe ich mir die Prozesse mit dem Befehl
Rich (BBCode):
 top
angesehen und die entsprechenden Prozesse via
Rich (BBCode):
 killall synoflvconv
killall postgres
killall synoindexd
killall synomkflvd
killall synomkthumbd
killall convert
killall ffmpeg
beendet. Das mag etwas rabiat sein - ich weiß auch nicht zu 100% welcher Prozess zu welchem Vorgang gehört, bin aber zunächst nur an einer Datensicherung interessiert, weshalb ich auf so ziemlich alle Dienste verzichten kann. (Falls da etwas lebenswichtiges bei sein sollte kann mich ggf gerne jemand darauf aufmerksam machen.)

Anschließend habe ich meine Daten via
Rich (BBCode):
 cp -r <Quellpfad> <Zielpfad>
kopiert. Der Zielpfad ist in meinem Fall eine Externe Festplatte mit dem Pfad /volumeUSB1/usbshare1-5/

Nun werden die Daten mit einer vernünftigen Geschwindigkeit kopiert. Sobald die Daten kopiert sind werde ich das NAS wechseln.


Gruß und vielen Dank für die nützlichen Kommentare!
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat