DS1812+ nicht mehr erreichbar, Shutdown hängt... [need urgent help]

Status
Für weitere Antworten geschlossen.

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
Hallo liebe Community,

ich habe eine Synology Diskstation DS1812+ (1GB RAM) mit einem Raid6 aus 6 x WD Red 3TB sowie einer HotSwap Platte. Es läuft das aktuelle DSM6 (Versionnummer kenne ich nicht, es wurde mir heute morgen allerdings Update 1 zu diesem Build angezeigt). Das NAS ist an einer USV angeschlossen, einen Stromausfall gab es meinens Wissens nach nicht, das NAS hat auch nichts gemeldet.

Angeschlossen sind 3 USB Platten für versch. Backups (Weekly, Daily, TimeBackup). Backups laufen gerade nicht, ich habe die USB Platten vom NAS getrennt (sie waren auch nicht im Betrieb). EIn Virenscan läuft als Systemscan täglich.

Ab heute morgen wurde der Zugriff langsamer, Weboberfläche reagierte langsam (zeigte keine Fehler, Status grün), Dateitransfer über Windows SMB aufs NAS wurde auch immer langsamer. Ein SSH Login war noch möglich. Die RAM Auslastung stiegt auf über 80% und wurde orange angezeigt (DSM 6 braucht wohl mehr Speicher).

Ab heute Mittag ist der Zugriff aufs NAS gar nicht mehr möglich, weder Web noch SSH (Connection Timeout). Alle Lampen der HDDs blinken wild. Die Status LED ist grün, LAN1 ebenfalls grün. Die Power LED leuchtete dauerhaft blau. Keine Piepstöne.

Ich habe mich daraufhin heute gegen 12 Uhr entschieden mal den Powerknopf am Gehäuse lange zu drücken, damit das NAS evtl. selbständig runterfährt. Das tut es vielleicht, ich weiß es nicht. Ein Zugriff per SSH aufs NAS wird jetzt jedenfalls sofort mit einem Network Connection Error abgebrochen. Alle Lampen der HDDs blinken nach wie vor wild, Status LED ist grün, LAN1 ebenfalls grün, Power LED blinkt nun blau (wie erwartet).


Frage: Was tue ich denn nun? Warten? Stromzufuhr kappen? Gibt es andere Tipps wie ich schauen kann was los ist?

Ich danke euch für eure Hilfe und Mühe und freue mich über jegliche Tipps und Hinweise wie mein NAS aus dieser Situation unbeschadet rauskommt.

Viele Grüße,
Tim
 
Zuletzt bearbeitet:

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.946
Punkte für Reaktionen
1.217
Punkte
754
Schade, dass Du keinen ssh-Zugang mehr hast, sonst hättest Du noch einiges prüfen können (z.B. die Logfiles und die SMART-Werte). Hast Du auf den USB-Platten ein Backup aller Daten?
 

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
SSH wäre mir natürlich auch sehr recht gewesen. Nun hängt das Teil da aber einfach nur so rum.

Backups habe ich von allen sehr wichtigen Daten (mehrfach, an versch. Orten). Tagesaktuell.
Dennoch würde ich auch die weniger wichtigen Daten nur ungerne verlieren, da steckt ne Menge Arbeit drin.

Hast du eine Vermutung?
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.946
Punkte für Reaktionen
1.217
Punkte
754
Ich hätte mir auf jeden Fall einmal die Platten angesehen - sprich die numerischen SMART-Werte -, um zu schauen, ob vielleicht eine Platte defekte Sektoren ausmappt. Sowas kann die DS langsam machen.
 

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
Die Smart Werte wären schon interessant. Beim Login auf die Weboberfläche heute morgen hat zumindest DSM nichts gemeldet (Status grün). Ein Rebuild oä war auch nicht zu sehen).

Aber da komme ich nun ja nicht mehr ran? Oder gibt es dennoch einen Weg? Ich ärgere mich ja auch das ich überhaupt keinen Zugang mehr habe. Aber auch der SSH Zugang hat zuletzt immer einen Timeout geworfen. Ich dachte es wäre eine gute Idee das NAS per Power Button durchstarten zu lassen. War es wohl aber nicht.

Interessant ist auch noch, dass ich das NAS noch pingen kann. SSH geht nach wie vor nicht (Putty meldet Network Error: Connection refused).
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.946
Punkte für Reaktionen
1.217
Punkte
754
Ich würde etwas abwarten, vielleicht fährt sich die DS ja noch herunter. Wenns bis morgen nicht der Fall ist, musst Du wohl den Stecker ziehen.
 

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
Hier noch eine Rückmeldung wie es ausgegangen ist: In der Nacht hat sich die DS dann schlussendlich noch runtergefahren und ist neugestartet (interessant, denn ich habe ja den Power Knopf an der DS gedrückt was meiner Meinung nach shutdown bedeutet und nicht restart).
Seit dem Neustart läuft sie etwas schneller als vorher (man merkt dies deutlich) und macht keine Zicken. Datenverlust habe ich keinen.

Leider ist der Grund für das Verhalten noch nicht klar. Wo kann und sollte ich nun nachschauen um dem Vorgang auf die Spur zu kommen?

PS: Kann ich irgendwie den Betreff des ersten Posts ändern? Oder dieses Thema später als erledigt markieren?
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.946
Punkte für Reaktionen
1.217
Punkte
754
Ich würde das Drücken auf den Powerknopf auch mit shutdown assozieren, aber vielleicht war der Neustart schon vorher durch etwas anderes angetriggert worden. Schön, dass die DS wieder gut läuft!

Schau Dir einmal /var/log/messages oder die Einträge im Protokollcenter an.

Betreff kannst jetzt nicht mehr ändern, Markierung als erledigt gibts in diesem Forum nicht.
 

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
Hallo nochmal,

vielen Dank für deine Hilfe und Mühe. Freue mich sehr darüber!

Ich habe mal die Smart Werte, das Protokollcenter sowie /var/log/messages | grep 'Jun 21' ausgeführt. Die Ergebnisse hänge ich an.

Was mir auffällt:

1. Eine der insgesamt 8 HDDs hat bei Raw_Read_Error_Rate den Rohdatenwert 14. Ansonsten allerdings keine Fehler. Alle anderen HDDs sind unauffälig. Sollte ich die Platte tauschen?
2. Im Protokollcenter ist nichts zu erkennen.
3. var/log/messages spuckt ne Menge aus. Mir fällt auf:
a: Jun 21 00:00:09 NAS-NAME kernel: [1226902.642722] SLAB: Unable to allocate memory on node 0 (gfp=0xd0)
b: Jun 21 13:37:47 NAS-NAME kernel: [1275832.219823] Out of memory: Kill process 12206 (smbd) score 212 or sacrifice child
c: Jun 21 13:37:47 NAS-NAME kernel: [1275832.227501] Killed process 12206 (smbd) total-vm:1208416kB, anon-rss:5800kB, file-rss:0kB
d1: Jun 21 13:40:57 NAS-NAME kernel: [1276115.419521] EXT4-fs error (device sds1): ext4_find_entry:1469: inode #14423204: comm rsync: reading directory lblock 0
.... bis
d2: Jun 21 13:46:13 NAS-NAME kernel: [1276445.929349] EXT4-fs error (device sds1): ext4_find_entry:1469: inode #17: comm timebkp: reading directory lblock 0
e: Jun 21 17:21:06 NAS-NAME root: Check device busy: error, refer: /var/log/DeviceBusyList
... und dann nachfolgend

Mir fehlt etwas die Erfahrung das Log sicher interpretieren zu können. Wird jemand schlau daraus was passiert sein könnte?
 

Anhänge

  • Screenshot_Protokoll.jpg
    Screenshot_Protokoll.jpg
    66,4 KB · Aufrufe: 47
  • Smart_04.jpg
    Smart_04.jpg
    106,6 KB · Aufrufe: 47
  • var_log_messages_01.txt
    86,1 KB · Aufrufe: 0
  • var_log_messages_02.txt
    70,8 KB · Aufrufe: 0

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.946
Punkte für Reaktionen
1.217
Punkte
754
Zu 1. Du solltest den Wert im Blick behalten. Wenn er sich nicht ändert, musst Du m.E. auch nichts tun.
 

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
es geht schon wieder los....

Es geht schon wieder los... Argh. Über jede Hilfe beim Auswerten des Logs würde ich mich freuen!

Ich hatte gerade 100GB aufs NAS geschoben und komme eben an den PC zurück und merke, das das NAS (angeblich ein Netzwerkfehler sagt Windows) nicht mehr ganz da ist.

Die Weboberfläche reagierte zwar fast normal schnell, stellte aber nur noch sehr wenige Inhalte dar (z. B. keine Daten in den Widgets).

Was ich noch herausfinden konnte:
- Die Smart Werte haben sich nicht verändert
- im Protokoll Center stand nichts erhellendes
- Einen Auszug aus der /var/log/messages mit grep 'Jun 29' ist angehängt.

Hier ein interessanter Schnipsel aus dem messsages-Log:
Rich (BBCode):
Jun 29 19:02:40 NAS-NAME kernel: [691398.905613] INFO: task jbd2/dm-0-8:10825 blocked for more than 120 seconds.
Jun 29 19:02:40 NAS-NAME kernel: [691398.912701] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.


Zugriff aufs NAS habe ich jetzt nicht mehr. Nun warte ich auf einen Shutdown (die Box hängt wieder genauso wie letztes mal). Vielleicht kommt die Kiste ja auch dieses mal in 6 Stunden wieder...

Ich habe mir übrigens 2 GB zusätzliche RAM bestellt (liegt hier schon vor mir). Nur für den Fall, dass mein 1GB nicht mehr reicht und Linux sich selbst abschießt. Habe eben nämlich folgenden interessanten Beitrag gefunden: https://www.blackmoreops.com/2014/09/22/linux-kernel-panic-issue-fix-hung_task_timeout_secs-blocked-120-seconds-problem/. Kann ich das irgendwie auf dem NAS auch irgendwie beheben?
 

Anhänge

  • messages_Jun-29.txt
    29,5 KB · Aufrufe: 4

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
Das NAS hing heute morgen noch immer undefiniert da rum. Habe daher die Stromzufuhr gekappt.

Ich brauche bitte Hilfe. Ich kann nicht erkennen warum mein NAS so reagiert. Liest jemand mit der aus dem Log schlau wird? Gibt es etwas, das ich noch auswerten muss/soll? Liegt es am Mittwoch? Ist jemandem ein entsprechender Bug bei Syno bekannt?

Ich freue mich wirklich über jeden Strohhalm. So ist das jedenfalls ja kein Zustand, ich habe gerade kein Vertrauen mehr in das Produkt.
 

Viprex

Benutzer
Mitglied seit
19. Nov 2009
Beiträge
31
Punkte für Reaktionen
0
Punkte
0
Hallo zusammen,

liest niemand mit der/die sich mit der Interpretation der logfiles auskennt? Oder ist einfach nichts zu erkennen? Habe ich die falschen Logfiles?

Unabhängig der Situation habe ich nun 2 GB Ram eingebaut. Ich habe den Ram von einem Syno Händler gekauft und in der 2.Slot gesteckt (der äußere/externe). Damit startete das NAS gar nicht. Der Ram im primären/inneren/1. Slot funktioniert aber wunderbar. Nun habe ich die Kapazität von 1GB auf 2GB verdoppelt, evtl. beseitigt das ja schon das auftrendende Kernel Panic...?!?
 

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.878
Punkte für Reaktionen
1.503
Punkte
274
Wäre dennoch notwendig zu wissen um welchen Ram es sich genau handelt. Da müsste ja eine Kennzeichnung vorhanden sein.
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat