Raid5 stürzt ab bei Dateizugriff

Status
Für weitere Antworten geschlossen.

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Hallo Synology User
Ich bentutze ein DS508 mit 5 mal 1 GB Festplatten in einem RAID 5 Verbund. Eine dieser Festplatte hatte Probleme beim Hochfahren. Ich habe sie ausgetauscht. Daraufhin neue Platte eingebaut und eine Sync. durchgeführt. Hat alles bis dahin gut geklappt.
Beim Start eines Backups stürzt das Filesystem ab. Im Webinterfache keine Rückmeldung. In der Datei /var/log/message findet am folgende Fehlermeldung
Dec 9 23:53:45 kernel: EXT3-fs error (device md2): htree_dirblock_to_tree: bad entry in directory #275644435: rec_len % 4 != 0 - offset=0, inode=3605356527, rec_len=23378, name_len=233
Dec 9 23:53:45 kernel: Aborting journal on device md2.
Dec 9 23:53:45 kernel: Remounting filesystem read-only

Nach einem Reboot kommt das Filesystem wieder hoch. Aber nach kurzer Zeit und damit arbeiten stürzt es wieder mit gleicher Fehlermeldung ab. Alle Platten sind IO. Smart Tool sagt nichts.

Wie kann ich das Problem lösen,
Grüße und DANKE
 
Zuletzt bearbeitet:

Super-Grobi

Benutzer
Mitglied seit
28. Sep 2010
Beiträge
1.913
Punkte für Reaktionen
0
Punkte
62
Sieht für mich nach einem Dateisystemfehler aus. Mehr kann ich dazu nicht sagen, weil ich von der Materie absolut keine Ahnung habe. Ich schreib das auch nur, damit das Thema nochmal hoch poppt und die schweren Jungs mit Ahnung nochmal einen Blick drauf werfen ;)
 

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Danke für das Feedback
Ist auch meine Vermutung. Dabei kommen mir ein paar Fragen.

Der Befehl um ein ext3 Filesystem zu überprüfen ist e2fsck -yf. Kann/darf man e2fsck direkt gegen ein RAID5 laufen lassen, oder muss man vorher den Raidverbund auflösen und gegen jede Platte einzeln laufen lassen?

Ich benutze die Firmware DSM 2.3-1157. Könnte ein Upgrade auf die neuste Version evt. den Fehler beheben? Gibt es in der neusten Version bessere oder neue Werkzeuge um ein Filesystem wieder herzustellen und die Verzeichnissstruktur wieder herzustellen?

Die Dritte Möglichkeit die mir einfällt, jede Platte einzeln zu syncen. Dh Ausbau und wieder einbauen. Dann wir ja die Platte neu geschrieben. Ist zwar lange und aufwändig aber wenn es hilft. Könnte das jemand mit mehr Wissen bestätigen?

Grüße und DANKE für alle Antworten.
Einen schönen dritten Advent
 

Super-Grobi

Benutzer
Mitglied seit
28. Sep 2010
Beiträge
1.913
Punkte für Reaktionen
0
Punkte
62
Hi sgreg (immer noch nichts :rolleyes:)
Danke für das Feedback
Ist auch meine Vermutung. Dabei kommen mir ein paar Fragen.

Der Befehl um ein ext3 Filesystem zu überprüfen ist e2fsck -yf. Kann/darf man e2fsck direkt gegen ein RAID5 laufen lassen, oder muss man vorher den Raidverbund auflösen und gegen jede Platte einzeln laufen lassen?
nein, dass Raid muß schon ganz bleiben, sonst hast Du gar kein FS mehr ;-)

Ich benutze die Firmware DSM 2.3-1157. Könnte ein Upgrade auf die neuste Version evt. den Fehler beheben? Gibt es in der neusten Version bessere oder neue Werkzeuge um ein Filesystem wieder herzustellen und die Verzeichnissstruktur wieder herzustellen?
Würde empfehlen erst den Fehler zu beseitigen. Ansonsten kann bei so einem Update so ziemlich alles passieren, was man nicht möchte
Die Dritte Möglichkeit die mir einfällt, jede Platte einzeln zu syncen. Dh Ausbau und wieder einbauen. Dann wir ja die Platte neu geschrieben. Ist zwar lange und aufwändig aber wenn es hilft. Könnte das jemand mit mehr Wissen bestätigen?
Neeeeein Neiiin... Mach mal erstmal nichts... da kommt schon noch Hilfe...
Wenn doch nicht, wende Dich an den Synolgy Support. Die biegen Dir das über das internet wahrscheinlich in wenigen Minuten wieder grade....
Grüße und DANKE für alle Antworten.
Einen schönen dritten Advent


Grüße
 

janus

Benutzer
Mitglied seit
07. Sep 2010
Beiträge
667
Punkte für Reaktionen
0
Punkte
0
Danke für das Feedback
Ist auch meine Vermutung. Dabei kommen mir ein paar Fragen.

Der Befehl um ein ext3 Filesystem zu überprüfen ist e2fsck -yf. Kann/darf man e2fsck direkt gegen ein RAID5 laufen lassen, oder muss man vorher den Raidverbund auflösen und gegen jede Platte einzeln laufen lassen?

Ich benutze die Firmware DSM 2.3-1157. Könnte ein Upgrade auf die neuste Version evt. den Fehler beheben? Gibt es in der neusten Version bessere oder neue Werkzeuge um ein Filesystem wieder herzustellen und die Verzeichnissstruktur wieder herzustellen?

Die Dritte Möglichkeit die mir einfällt, jede Platte einzeln zu syncen. Dh Ausbau und wieder einbauen. Dann wir ja die Platte neu geschrieben. Ist zwar lange und aufwändig aber wenn es hilft. Könnte das jemand mit mehr Wissen bestätigen?

Grüße und DANKE für alle Antworten.
Einen schönen dritten Advent

Moin,
lass mal schön dein RAID in Ruhe, denn wenn es FS Fehler sind, dann machst du mit dem RAID nur mehr kaputt, als ganz. Ein Filesystem Check kann im Falle von Defekten Platten nicht mehr so viel schaden, also würde ich das mal machen.

Für den Filesystemcheck würde ich folgendermaßen vorgehen:
Also 1. Mach ein Backup, wo es noch möglich ist, wenn das nicht geht, hoffe, dass dein Backup in Ordnung ist :) Für die Daten wird dir keiner garantieren.

2. Login per root auf der Commandline und sorge dafür, dass das Dateisystem nicht mehr gemountet ist.

Also für /volume1:
Rich (BBCode):
fuser -mk /volume1
Danach noch mal Kontrolle mittels
Rich (BBCode):
fuser -m /volume1
ggf. weitere Prozesse killen. Zur not mit
Rich (BBCode):
kill -9 <pid>

Feststellen auf welches Device gemountet ist:
Rich (BBCode):
df -h

Wenn dann kein Prozess mehr Online ist:
Rich (BBCode):
umount /volume1

Kontrolle mittels:
Rich (BBCode):
df -h
Das Dateisystem sollte nicht mehr gemountet sein!

Wenn das geht, führe einen fsck aus, bei mir wäre das dann:
Rich (BBCode):
fsck /dev/vg1/lv
Bitte entsprechend das Device einsetzen, was vorher ermittelt worden ist!

Durchlaufen lassen und sich bei ggf. auftauchenden Meldungen Gedanken machen, inwieweit die Daten noch vertrauenswürdig sind :)

Wenn Fehler korrigiert wurden, ist es nicht verkehrt, noch einen 2. Durchlauf des fsck durchzuführen, eben solange, bis keine Fehler mehr auftauchen.

Zum Schluss
Durchbooten und für die wichtigen Daten ohne Backup Beten :)

Gruß

Janus
 

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Die Überprüfung des Filesystems läuft. Den Befehl fsck hab ich nicht gefunden, dafür aber e2fsck. Daumen DRÜCKEN.
Wenn er durch ist poste ich den output.
Grüße und DANKE für die Hilfe, einen schönen 3ten Advent
 

janus

Benutzer
Mitglied seit
07. Sep 2010
Beiträge
667
Punkte für Reaktionen
0
Punkte
0
Die Überprüfung des Filesystems läuft. Den Befehl fsck hab ich nicht gefunden, dafür aber e2fsck. Daumen DRÜCKEN.
Wenn er durch ist poste ich den output.
Grüße und DANKE für die Hilfe, einen schönen 3ten Advent

Hmm,
lapsus meinerseits.

Es gibt noch fsck.ext3 und fsck.ext4. Beide sind aber ein Link auf e2fsck von daher wohl in Ordnung.

Gruß

Janus
 
Zuletzt bearbeitet:

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Mein erster druchlauf:

Pass 1: Checking inodes, blocks, and sizes

da hat er was gefunden, leider hat er

Pass 2: Checking directory structure
Error allocating icount structure: Memory allocation failed
e2fsck: aborted

danach abgebrochen.
Mal sehen was das WWW dazu sagt
Grüße
 
Zuletzt bearbeitet:

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Final:
syno> e2fsck -yf /dev/md2
e2fsck 1.41.3 (12-Oct-2008)
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
1.39-Jun212008: 420546/486817792 files (7.8% non-contiguous), 672915584/973619200 blocks

:) Ich hoffe das jetzt alles gut geht
 

Super-Grobi

Benutzer
Mitglied seit
28. Sep 2010
Beiträge
1.913
Punkte für Reaktionen
0
Punkte
62
Moin,

na wunderbar ....

Und warum hatte der jetzt erst abgebrochen?
Bzw. wie hast Du das dann behoben? Einfach nochmal gestartet?

Dieses "fuser" finde ich auf meiner DS210+ garnicht. Muß man das nachträglich irgendwie installieren?

Grüße
Jörg
 

janus

Benutzer
Mitglied seit
07. Sep 2010
Beiträge
667
Punkte für Reaktionen
0
Punkte
0
Moin,

na wunderbar ....

Und warum hatte der jetzt erst abgebrochen?
Bzw. wie hast Du das dann behoben? Einfach nochmal gestartet?

Dieses "fuser" finde ich auf meiner DS210+ garnicht. Muß man das nachträglich irgendwie installieren?

Grüße
Jörg

DiskStation2> which fuser
/opt/bin/fuser
DiskStation2>

Daher liegt die Vermutung nahe, dass es aus einem IPKG stammt.

Gruß

Janus
 

goetz

Super-Moderator
Teammitglied
Sehr erfahren
Mitglied seit
18. Mrz 2009
Beiträge
14.017
Punkte für Reaktionen
272
Punkte
393
Hallo,
Rich (BBCode):
DS-106> ipkg list|grep psmisc
psmisc - 22.11-1 - A set of some small useful utilities that use the proc filesystem.

Gruß Götz
 

Super-Grobi

Benutzer
Mitglied seit
28. Sep 2010
Beiträge
1.913
Punkte für Reaktionen
0
Punkte
62
Moin,

Danke für die Info!

ipkg, hmm, hab ich ja noch nie gemacht....
Ich werd mich morgen mal damit auseinandersetzen.
Soweit ich das mitbekommen habe ist das ja ziemlich einfach.
schaun wä ma :D

Grüße
Jörg

ipkg list|grep psmisc
tut schon mal, start / stop scheint auch noch zu gehen...
 
Zuletzt bearbeitet:

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
e2fsck absturz

Ich habe gegoogelt und diese Lösung gefunden

http://www.readynas.com/forum/viewtopic.php?f=64&t=41766

".........
This is becaue fsck program store inode and related information into memory, on a system which may have not enough memory, the

error could appear.

To solve this:

1. Use fsck with more system memory.
2. create a /etc/e2fsck.conf file with following contents, which requires e2fsck program version above 1.40

[scratch_files]
directory = /var/cache/e2fsck
...."

Bei mir hat das geholfen damit e2fsck durch läuft.
 

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Und am Ende wurde alles gut :) Filesystem ist wieder gesund!! Backup ist durch.
DAFÜR ERSTMAL HERZLICHEN DANK

Ich habe den Befehl fuser auch nicht auf meiner DS508 mit DSM 2.3-1157. Ich werde demächst auf die 3 Version gehen. Im Internet wurde der Fehler im Dateisystem auch im Zusammenhang mit der Version von Linux genannt.

Grüße und noch einen schönen dritten Advent
 

janus

Benutzer
Mitglied seit
07. Sep 2010
Beiträge
667
Punkte für Reaktionen
0
Punkte
0
Ich habe gegoogelt und diese Lösung gefunden

http://www.readynas.com/forum/viewtopic.php?f=64&t=41766

".........
This is becaue fsck program store inode and related information into memory, on a system which may have not enough memory, the

error could appear.

To solve this:

1. Use fsck with more system memory.
2. create a /etc/e2fsck.conf file with following contents, which requires e2fsck program version above 1.40

[scratch_files]
directory = /var/cache/e2fsck
...."

Bei mir hat das geholfen damit e2fsck durch läuft.

Schön,
muss man erst mal darauf kommen, wenn man immer vor Systemen sitzt, wo mehr als genug Hauptspeicher verbaut ist.

Selbst meine 1010+ hat 3Gig ;-)

Gruß

Janus
 

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Die Geschichte geht weiter :-|. Gestern ist die nächste Platte in die ewigen Jagdgründe eingegangen. Wurde nicht mehr erkannt.

2010/12/14 07:03:20 Disk [4] was removed.
2010/12/14 07:02:23 System volume [Swap] was degrade, current disk status [4/5], please repair it.
2010/12/14 07:01:41 Volume [1] was degrade [4/5], please repair it.
2010/12/14 07:01:41 System volume [Root] was degrade, current disk status [4/5], please repair it.
2010/12/14 07:01:40 Internal disk [4] was defective.
2010/12/14 01:00:16 Local Backup started.

Können sich Festplatten verabreden?

Ich werde meine Smart der verbliebenen 3 alten Festplatten mal posten, evt. kann ja jemand was dazu sagen.

Grüße
 

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Platte 3

hat folgende SMART Informationen

1 Raw_Read_Error_Rate 100 100 051 OK 0
3 Spin_Up_Time 068 068 011 OK 10360
4 Start_Stop_Count 092 092 000 OK 8132
5 Reallocated_Sector_Ct 100 100 010 OK 0
7 Seek_Error_Rate 253 253 051 OK 0
8 Seek_Time_Performance 100 100 015 OK 9884
9 Power_On_Hours 098 098 000 OK 10884
10 Spin_Retry_Count 100 100 051 OK 2
11 Calibration_Retry_Count 100 100 000 OK 0
12 Power_Cycle_Count 100 100 000 OK 37
13 Read_Soft_Error_Rate 100 100 000 OK 0
187 Reported_Uncorrect 100 100 000 OK 0
190 Airflow_Temperature_Cel 066 061 000 OK 5724569
194 Temperature_Celsius 065 060 000 OK 5892342
195 Hardware_ECC_Recovered 100 100 000 OK 1200287
196 Reallocated_Event_Count 100 100 000 OK 0
197 Current_Pending_Sector 100 100 000 OK 0
198 Offline_Uncorrectable 100 100 000 OK 0
199 UDMA_CRC_Error_Count 100 100 000 OK 0
200 Multi_Zone_Error_Rate 100 100 000 OK 0
201 Soft_Read_Error_Rate 100 100 000 OK 0

Ein Fachmann/frau könnte ja einen Tipp geben wie man die Zahlen interpretiert. Evt. gibt es ja im Internet Hinweise wie man die Zahlen versteht.

Grüße und Danke für alle Antworten
 

Super-Grobi

Benutzer
Mitglied seit
28. Sep 2010
Beiträge
1.913
Punkte für Reaktionen
0
Punkte
62
Hmm, sagte das System nicht oben, dass Platte 4 defekt ist, und nicht Platte 3?

Die Werte sehen für mich erstmal so ok aus....

Grüße
 

sgreg

Benutzer
Mitglied seit
10. Dez 2010
Beiträge
50
Punkte für Reaktionen
0
Punkte
6
Hi
Platte 4 ist ausgefallen und tauchte unter S.M.A.R.T garnicht mehr auf. Platte 3 ist eine "alte" Platte und ich habe die Sorge das sie eine Verabredung hat, d.h. auch ihren Geist aufgibt. Ich möchte lernen die SMART Werte besser einzuordnen um eine Platte auszutauschen zu können bevor sie kaputt geht.
Grüße und Danke
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat