Synology hängt sich alle 2-3 Wochen auf

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
Hallo zusammen,

ich habe seit kurzem das Problem, dass sich meine Synology DS918+ alle 2-3 Wochen Samstags (und nur Samstags) aufhängt. Man hört dann sehr starke Festplatten-Aktivität und kommt nur sehr schwer auf die Synology. Heute war es mal wieder soweit. Das einloggen hat wesentlich länger gebraucht als sonst und der Ressourcen-Monitor hat gar nichts angezeigt / nichts geladen. Selbst ein im DSM angestoßener Neustart wurde nicht durchgeführt (er hat angezeigt das er neu startet, gemacht hat er es aber nicht).
Das Problem fängt immer Nachmittags an. Wie lange es geht, kann ich nicht sagen, da ich sie irgendwann immer hart ausschalten muss, damit ich überhaupt wieder "richtigen Zugriff" bekomme.
Da ich nicht sicher, ob manche Dinge etwas damit zu tun haben, hier mal alles was mir dazu einfällt:
- Ich bin mir nicht ganz sicher, aber ich glaube das erste Mal ist mir das Verhalten Anfang/Mitte Januar aufgefallen und ist heute das 3. Mal aufgetreten.
- Wir hatten Anfang / Mitte Januar einen komischen Stromausfall. Über 6 Stunden war der Strom mal weg, dann kam er wieder, dann fiel das Netz wieder aus. Sprich die Synology ist mehrfach abgestürzt.
- Ich habe seit Mitte Januar (seit dem Stromausfall) ein USV (Eaton USV Ellipse ECO 650 USB DIN) und einen USB-Hub (Inateck USB Hub 3.2 Gen 2) dran hängen. Könnte das evtl. damit zu tun haben?
- Auf der Synology läuft permanent eine Rezeptedatenbank in Docker (Mealie), Home Assistant in einer virtuellen Maschine, sowie Synology Photos, Plex und der Synology Chat.
- Backups werden Sonntag frühs automatisch angelegt, sonst sind mir keine geplanten Dienste / Aufgaben bekannt.
- Im Protokoll-Center ist absolut gar nichts hinterlegt.

Habt ihr evtl. einen Tipp für mich was das sein könnte?

Vielen Dank bereits im Voraus!

Gruß
Andreas
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.104
Punkte für Reaktionen
3.644
Punkte
414
Poste mal bitte die SMART Werte keinen Test machen, siehe Signatur.
Was steht im Speichermanager?
 
  • Like
Reaktionen: Benie

Benie

Benutzer
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
5.988
Punkte für Reaktionen
2.009
Punkte
259
Läuft evtl. das AV Paket im Hintergrund?
Läuft die Datenbereingung? Ein SMART Test?
 
  • Like
Reaktionen: ctrlaltdelete

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
Poste mal bitte die SMART Werte keinen Test machen, siehe Signatur.
Was steht im Speichermanager?
Das mit den SMART-Werten auslesen funktioniert nicht. Ich bekomme als Ergebnis nur "Smartctl open device: /dev/sata1 [SAT] failed: No such device" zurück (Aktion - Ergebnis anzeigen).
Im Speichermanager steht m.M.n. nichts auffälliges. Speicherpool 1 in Ordnung, letzte Datenbereinigung am 11.01.2024, Laufwerk 1-3 in Ordnung (Laufwerk 4 ist dem Speicherpool nicht zugeordnet).
Auch unter HDD/SSD sieht alles gut aus. Alle 4 Platten in Ordnung, Temperaturen con 37-39°C.


Läuft evtl. das AV Paket im Hintergrund?
Läuft die Datenbereingung? Ein SMART Test?
Als AV habe ich Antivirus Essential eingerichtet. Das läuft wirklich jeden Samstags, allerdings um 2 Uhr. Der letzte Eintrag im Protokoll ist von 14:00 Uhr. Aufgehängt hat sich die Synology um 15:35 Uhr (ich bekomme eine Nachricht, wenn mein Zigbee-Stick nicht mehr erreichbar ist).
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.104
Punkte für Reaktionen
3.644
Punkte
414
Bei manchen Geräten (insbesondere älteren DSen) sind die Platten anders eingebunden. Hier gilt dann folgender Befehl:
smartctl -A -d sat /dev/sda für Platte 1. Für Platte 2 usw. dann den Buchstaben erhöhen. Für Platte 2 also entsprechend smartctl -A -d sat /dev/sdb usw.
 
  • Like
Reaktionen: Benie

Benie

Benutzer
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
5.988
Punkte für Reaktionen
2.009
Punkte
259
Las doch mal den AV aus, stoppe einfach das Paket im Paket Manager, und beobachte das ganze mal ohne.
 

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
Bei manchen Geräten (insbesondere älteren DSen) sind die Platten anders eingebunden. Hier gilt dann folgender Befehl:
smartctl -A -d sat /dev/sda für Platte 1. Für Platte 2 usw. dann den Buchstaben erhöhen. Für Platte 2 also entsprechend smartctl -A -d sat /dev/sdb usw.
Damit hat es funktioniert. Hier die Werte:

Code:
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance                                           0x0004   130   130   054    Old_age   Offline      -       108
  3 Spin_Up_Time                                                     0x0007   148   148   024    Pre-fail  Always       -       34388836796
  4 Star/Stop_Count                                                  0x0012   100   100   000    Old_age   Always       -       452
  5 Reallocated_Sector_Count                                         0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x000a   100   100   067    Old_age   Always       -       0
  8 Seek_Time_Performance                                            0x0004   128   128   020    Old_age   Offline      -       18
  9 Power-On_Hours_Count                                             0x0012   094   094   000    Old_age   Always       -       45084
 10 Spin_Retry_Count                                                 0x0012   100   100   060    Old_age   Always       -       0
 12 Device_Power_Cycle_Count                                         0x0032   100   100   000    Old_age   Always       -       442
 22 Helium_Level                                                     0x0023   100   100   025    Pre-fail  Always       -       100
192 Power_off_Retrace_count                                          0x0032   099   099   000    Old_age   Always       -       2248
193 Load_Cycle_count                                                 0x0012   099   099   000    Old_age   Always       -       2248
194 Temperature_Celsius                                              0x0002   171   171   000    Old_age   Always       -       38 (Min/Max 22/41)
196 Reallocation_Event_Count                                         0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector_Count                                     0x0022   100   100   000    Old_age   Always       -       0
198 Off-Line_Scan_Uncorrectable_Sector_Count                         0x0008   100   100   000    Old_age   Offline      -       0
199 Ultra_DMA_CRC_Error_Count                                        0x000a   200   200   000    Old_age   Always       -       0

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance                                           0x0004   130   130   054    Old_age   Offline      -       108
  3 Spin_Up_Time                                                     0x0007   152   152   024    Pre-fail  Always       -       34388050353
  4 Star/Stop_Count                                                  0x0012   100   100   000    Old_age   Always       -       330
  5 Reallocated_Sector_Count                                         0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x000a   100   100   067    Old_age   Always       -       0
  8 Seek_Time_Performance                                            0x0004   128   128   020    Old_age   Offline      -       18
  9 Power-On_Hours_Count                                             0x0012   094   094   000    Old_age   Always       -       44308
 10 Spin_Retry_Count                                                 0x0012   100   100   060    Old_age   Always       -       0
 12 Device_Power_Cycle_Count                                         0x0032   100   100   000    Old_age   Always       -       324
 22 Helium_Level                                                     0x0023   100   100   025    Pre-fail  Always       -       100
192 Power_off_Retrace_count                                          0x0032   099   099   000    Old_age   Always       -       2109
193 Load_Cycle_count                                                 0x0012   099   099   000    Old_age   Always       -       2109
194 Temperature_Celsius                                              0x0002   171   171   000    Old_age   Always       -       38 (Min/Max 21/41)
196 Reallocation_Event_Count                                         0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector_Count                                     0x0022   100   100   000    Old_age   Always       -       0
198 Off-Line_Scan_Uncorrectable_Sector_Count                         0x0008   100   100   000    Old_age   Offline      -       0
199 Ultra_DMA_CRC_Error_Count                                        0x000a   200   200   000    Old_age   Always       -       0

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance                                           0x0004   129   129   054    Old_age   Offline      -       112
  3 Spin_Up_Time                                                     0x0007   150   150   024    Pre-fail  Always       -       34388509111
  4 Star/Stop_Count                                                  0x0012   100   100   000    Old_age   Always       -       453
  5 Reallocated_Sector_Count                                         0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x000a   100   100   067    Old_age   Always       -       0
  8 Seek_Time_Performance                                            0x0004   128   128   020    Old_age   Offline      -       18
  9 Power-On_Hours_Count                                             0x0012   094   094   000    Old_age   Always       -       45085
 10 Spin_Retry_Count                                                 0x0012   100   100   060    Old_age   Always       -       0
 12 Device_Power_Cycle_Count                                         0x0032   100   100   000    Old_age   Always       -       443
 22 Helium_Level                                                     0x0023   100   100   025    Pre-fail  Always       -       100
192 Power_off_Retrace_count                                          0x0032   099   099   000    Old_age   Always       -       2251
193 Load_Cycle_count                                                 0x0012   099   099   000    Old_age   Always       -       2251
194 Temperature_Celsius                                              0x0002   166   166   000    Old_age   Always       -       39 (Min/Max 22/41)
196 Reallocation_Event_Count                                         0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector_Count                                     0x0022   100   100   000    Old_age   Always       -       0
198 Off-Line_Scan_Uncorrectable_Sector_Count                         0x0008   100   100   000    Old_age   Offline      -       0
199 Ultra_DMA_CRC_Error_Count                                        0x000a   200   200   000    Old_age   Always       -       0

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance                                           0x0004   130   130   054    Old_age   Offline      -       109
  3 Spin_Up_Time                                                     0x0007   151   151   024    Pre-fail  Always       -       34388312501
  4 Star/Stop_Count                                                  0x0012   100   100   000    Old_age   Always       -       323
  5 Reallocated_Sector_Count                                         0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x000a   100   100   067    Old_age   Always       -       0
  8 Seek_Time_Performance                                            0x0004   128   128   020    Old_age   Offline      -       18
  9 Power-On_Hours_Count                                             0x0012   094   094   000    Old_age   Always       -       44175
 10 Spin_Retry_Count                                                 0x0012   100   100   060    Old_age   Always       -       0
 12 Device_Power_Cycle_Count                                         0x0032   100   100   000    Old_age   Always       -       317
 22 Helium_Level                                                     0x0023   100   100   025    Pre-fail  Always       -       100
192 Power_off_Retrace_count                                          0x0032   099   099   000    Old_age   Always       -       2127
193 Load_Cycle_count                                                 0x0012   099   099   000    Old_age   Always       -       2127
194 Temperature_Celsius                                              0x0002   175   175   000    Old_age   Always       -       37 (Min/Max 22/40)
196 Reallocation_Event_Count                                         0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector_Count                                     0x0022   100   100   000    Old_age   Always       -       0
198 Off-Line_Scan_Uncorrectable_Sector_Count                         0x0008   100   100   000    Old_age   Offline      -       0
199 Ultra_DMA_CRC_Error_Count                                        0x000a   200   200   000    Old_age   Always       -       0
 
Zuletzt bearbeitet:

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
Bei manchen Geräten (insbesondere älteren DSen) sind die Platten anders eingebunden. Hier gilt dann folgender Befehl:
smartctl -A -d sat /dev/sda für Platte 1. Für Platte 2 usw. dann den Buchstaben erhöhen. Für Platte 2 also entsprechend smartctl -A -d sat /dev/sdb usw.
Damit hat es funktioniert. Ich kann die Werte nur gerade nicht hier anhängen, da dann der Beitrag erst durch einen Moderator geprüft werden muss.
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.104
Punkte für Reaktionen
3.644
Punkte
414
Setze es als Code ein:
1708185205960.png
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.104
Punkte für Reaktionen
3.644
Punkte
414
SMART Werte sind ok, steht was im Protokollcenter?
 

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
SMART Werte sind ok, steht was im Protokollcenter?
Im Protokoll steht zu dem Zeitpunkt bzw. davor überhaupt nichts drin (Allgemein, Verbindung, Dateiübertragung, Laufwerke).
Kann ich hier irgendwo evtl. noch etwas aktivieren, so dass weitere Dinge protokolliert werden? Das wäre evtl. für den nächsten "Ausfall" interessant.
 

ctrlaltdelete

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
10.104
Punkte für Reaktionen
3.644
Punkte
414
du könntest auch mal AVRLogger installieren und die Temperaturen monitoren?
 

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
So, der AVRLogger ist installiert, aber das mit den Graphen verstehe ich nicht so. Ich sehe auch nur die Avr-Einstellungen. Was anderes zum Aufrufen gibt es bei mir nicht.
Gibts da irgendwo ne Anleitung?
 

Benie

Benutzer
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
5.988
Punkte für Reaktionen
2.009
Punkte
259

threadstone

Benutzer
Mitglied seit
18. Nov 2015
Beiträge
66
Punkte für Reaktionen
9
Punkte
8
Vielen Dank. Jetzt sind die Charts auch da. Allerdings nur CPU, Status, HDD und Load. Passt das oder sollte ich für meinen Fall weitere Dinge aktivieren?
 
Zuletzt bearbeitet von einem Moderator:

FricklerAtHome

Benutzer
Mitglied seit
01. Okt 2017
Beiträge
583
Punkte für Reaktionen
42
Punkte
54
Also mal nur als Nachfrage:

Wer von euch nutzt das snmp-Protokol zur Abfrage der Synologys?
Ich kann dort kontinuierlich ca. 60 Sensoren der Synologys abfragen und leite diese an eine PRTG Instanz. Diese ist bis zu 100 Sensoren kostenlos. Das ganze ist dann in einem WEB darstellbar, auch im Zeitverlauf. Mit den von mir protokolierten Sensoren sieht das bei 3 Synos
so aus:

Bildschirmfoto 2024-02-17 um 22.47.41.png

Meine Auswahl der Sensoren ist wirkürlich von mir ausgewählt, Schaut doch mal was ihr braucht. Den Vorteil dieser Methode gegenüber einem LOG File liegt darin das auch ein zeitlicher Verlauf ablesbar ist. Wie gesagt ich habe nur eine geringe Anzahl der Sensoren aktiviert. In den Logs wird wesentlich weniger abgebildet. Und ich erhalte ALARM mittels E-MAIL für jeden Sensor mit entsprechend ausgesuchtem Muster.

F@H
 
Zuletzt bearbeitet:

Benie

Benutzer
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
5.988
Punkte für Reaktionen
2.009
Punkte
259

Rotbart

Benutzer
Contributor
Sehr erfahren
Mitglied seit
04. Jul 2021
Beiträge
1.440
Punkte für Reaktionen
427
Punkte
109
Ich nutze dazu LibreNMS in einer VM, das überwacht bei mir mehrere Synos incl. einer EatonUPS ohne begrenzung.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat