System von jetzt auf gleich zerschossen

Status
Für weitere Antworten geschlossen.

frogtwist

Benutzer
Mitglied seit
08. Nov 2014
Beiträge
395
Punkte für Reaktionen
3
Punkte
18
Nun hat es mich also erwischt. Am späten Abend stellte meine DS 716+ den Betrieb mit blau blinkender LED ein. Mehrmaliges neustarten half nicht. Um der Sache auf den Grund zu gehen trennte ich die zwei Laufwerke und schaute was passiert. Die Status LED begann wieder zu blinken so das ich erstmal ein Hartwarefehler auschließen konnte. Nun steckte ich nacheinander beide Laufwerke wieder hinein und verband mich mit dem Webinterface. Und da verschlug es mir nun vollends die Sprache. kein Anmeldebildschirm sondern der Assistent zum Neueinrichten des Systems erschien auf der Bildfläche.

Dolle Sache dachte ich. Alles auf Anfang hatte ich keine Lust und so probierte ich es noch eine Weile mit ab- und anstecken der Laufwerke gefolgt von vielen Neustarts.

Das Problem blieb bestehen. Nur eine Neuinstallation schien noch möglich.

Also Backup raus und rödeln lassen. Soweit so gut. Leider werden, was ich nicht wusste, nicht alle Einstellungen übernommen. z.B. meine unzähligen reverseProxy Konfigurationen wurden nicht übernommen.

Jetzt habe ich aber das problem das meine CPU Auslastung ständig bei 99% steht. Das komische ist das das System nur ca. 20 % braucht und der Benutzer den Rest. Wechsel des Benutzers brachte auch nichts. Im Moment werden angeblich Medien indiziert, kann ich aber an Hand des ressourcen Monitors nicht nachvollziehen.
Vieleicht hat ja irgendjemand einen Tip bezüglich der hohen CPU Auslastung.

ds01.JPG
ds02.JPG
ds03.JPG
 

Ulfhednir

Benutzer
Sehr erfahren
Mitglied seit
26. Aug 2013
Beiträge
3.264
Punkte für Reaktionen
923
Punkte
174
Mal per SSH einloggen und mit top die weiteren Prozesse darstellen.
 

Kurt-oe1kyw

Benutzer
Sehr erfahren
Mitglied seit
10. Mai 2015
Beiträge
9.139
Punkte für Reaktionen
1.780
Punkte
314
Wie sind die SMART Werte dieser beiden HDDs?
Das System fliegt im Normalfall nicht einfach so raus.
Die HDDs werden bei der Installation im Hintergrund in 3 "Teile" geteilt.
1 x Volume (der Teil wo später deine Daten drauf sein werden)
1 x System (ein kleiner Teil mit ca. 2,3 GB wo DSM usw hinterlegt wird)
1 x SWAP (auch ein kleiner Systemteil)

Wenn jetzt deine HDDs einen Fehler haben und ausgerechnet der Teil mit dem System erwischt wird, dann ist es nur eine Frage der Zeit bis zum nächsten "Ausstieg" der DS.

Das mit der CPU Last 99% ist normal, da Laufen jetzt ein Haufen Hintergrundprozesse wie Systemoptimierung, Paritätsprüfungen, div. Indexerstellungen usw usw. hier musst du einfach Geduld haben und in der Hardwaresteuerung den Lüfter auf Max stellen für beste Kühlleistung.
Wenn sich alles wieder "beruhigt" hat, kannst du wieder auf eine kleinere Lüfterstufe stellen im DSM.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.984
Punkte für Reaktionen
624
Punkte
484
Klingt doch nach defekten Platten. Das sollte man doch zunächst checken, bevor man die Platten erneut nutzt und das System neu aufsetzt.
 

frogtwist

Benutzer
Mitglied seit
08. Nov 2014
Beiträge
395
Punkte für Reaktionen
3
Punkte
18
Der Schnelltest zeigt das beide Platten in Ordnung sind. Beide sind relativ neu vom September 2018.
Das sind die Smart Werte:
smart1.JPG
smart2.JPG

smart3.JPG
smart4.JPG
 

Fusion

Benutzer
Sehr erfahren
Mitglied seit
06. Apr 2013
Beiträge
14.137
Punkte für Reaktionen
898
Punkte
424
Außer dass sie ein wenig warm laufen sind die Werte unauffällig für Seagate Platten. Was nicht heißt, dass sie nicht trotzdem einen Schaden haben können.
 

Kurt-oe1kyw

Benutzer
Sehr erfahren
Mitglied seit
10. Mai 2015
Beiträge
9.139
Punkte für Reaktionen
1.780
Punkte
314
Ich würde den großen, erweiterten SMART Test drüberlaufen lassen und dann noch mal die SMART Werte ansehen.
ABER der dauert pro HDD ca. 18 Stunden.
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
5.566
Punkte für Reaktionen
1.400
Punkte
234
99% Last:
Im Ressourcenmanager statt auf "Dienste" oben auf "Prozesse" klicken.
Oder über SSH einloggen und einfach nur "top" eingeben.

Smartwerte:
Es sind wohl Seagate-HDDs. Dort sind ein Teil der Daten nicht einfach interpretierbar (z.B. ID1), sondern müssen umgerechnet werden (absolute Schweinerei). Die interpretierbaren Daten sehen gut aus. Etwas warm (44 bzw. 46 Grad) sind sie. Machen die gerade was? (siehe Ressourcenmanager).

Smart-Test:
Ich würde keinen großen Smarttest jetzt drüber laufen lassen. Es ist ja noch gar nicht klar, woher die Systemlast kommt, z.B. ob der Speichermanager gerade einen Raid repariert. Dann stehen die HDDs schon unter Stress und sollten dann keinen stundenlangen Smarttest machen.
Bevor man das macht, muss erst mal klar sein, was da so rackert und was die HDDs gerade zu tun haben.
 

frogtwist

Benutzer
Mitglied seit
08. Nov 2014
Beiträge
395
Punkte für Reaktionen
3
Punkte
18
Schon Lustig. gerade wollte ich noch etwas schreiben als ich sah das die CPU wieder bei 18 % angelangt ist :) Ich werde jetzt mal den langen test laufen lassen und dann berichten.
 
  • Like
Reaktionen: Synchrotron
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat