CS407e Raid5 Volume 1 on Cube has crashed, the server may not be able to start up.

Status
Für weitere Antworten geschlossen.

kickback

Benutzer
Mitglied seit
04. Nov 2008
Beiträge
44
Punkte für Reaktionen
0
Punkte
0
Hallo, pünktlich zum Wochenende sowas :-(
Wegen akutem Platzmangel habe ich vorgestern meiner Cube eine 4te 1TB Festplatte eingebaut und das Volume erweitert. Das hat dann auch bis heute mittag fleissig gearbeitet und dann kam die Mail "Volume crashed".

Unbeholfen, wie ich war, hab ich nach ner Weile mal das Gerät runtergefahren (Powerknopf) und wieder hochgefahren.
Nach einiger Zeit war die Cube wieder da, aber nur mit 1,7TB Speicher bei 4 eingebauten 1TB Platten. ich hatte eigentlich auf 2,5 oder so gehofft.
Also habe ich den Volumemanager aufgerufen und (aus dem Gedächtnis) "allocate unused Space" gestartet.

Das führte dann wieder zu der Mail "Volume 1 on cube has crashed" :-(
Nun steht se da, die Status LED blinkt gelb, die Festplatten LEDs leuchten konstant und das Ding piept herzzerreißend.
Telnet, ssh, https://cube:5001, no contact :-(

Kann ich die für nächtliches Backup angeschlossene Festplatte abstöpseln? Würde mich mal gerne extern überzeugen, dass ich ein Backup habe :)
Bringt es was, nochmal den Strom zu klauen und hochfahren zu lassen? Muss ich doch eh, oder? ping geht zwar, aber ansonsten komme ich ja gar nicht ran, bekomme schon connection refused bevor ich überhaupt username und passwort eingeben kann.

Hat jemand schon ein ähnliches Problem gehabt? Die lief bisher ohne Probleme, nur die Erweiterung scheint im letzten Schritt nicht zu klappen. Gibt es irgendwo logs, die ich ziehen könnte, um dieses Problem einzugrenzen?

ciao

frank
 

kickback

Benutzer
Mitglied seit
04. Nov 2008
Beiträge
44
Punkte für Reaktionen
0
Punkte
0
Ich hab eben nochmal den Powerknopf gedrückt und die cube runterfahren lassen und neu angeworfen, da auch der Support der Meinung ist, der Beep lasse sich in der Oberfläche abschalten dumm nur, wenn man da nicht mehr hinkommt.
Jetzt ist die Cube wieder online, überall steht alles auf normal, nur finde ich es doof, kein Byte mehr Speicherplatz zu haben als vor dem Einbau der zusätzlichen Festplatte.
Vollbildaufzeichnung%252013.07.2013%2520213824.jpg


So sah es auch aus, bevor der zweite Crash kam. Würde ich jetzt im Volume Manager den Menupunkt "ungenutzten Platz dem Volume hinzufügen" nutzen, dann käme wieder das gleiche raus. :-(
Woran könnte sowas liegen? Habe ich eine inkompatible Platte erwischt?
Da ich nun mit putty per ssh drauf komme, wo müsste ich schauen, um Infos auszugraben, mit denen Experten hier mir helfen könnten?

Cube> mdadm --query --detail /dev/md2
/dev/md2:
Version : 0.90
Creation Time : Sat Feb 13 12:45:38 2010
Raid Level : raid5
Array Size : 2920857600 (2785.55 GiB 2990.96 GB)
Used Dev Size : 973619200 (928.52 GiB 996.99 GB)
Raid Devices : 4
Total Devices : 4
Preferred Minor : 2
Persistence : Superblock is persistent

Update Time : Sat Jul 13 22:36:12 2013
State : clean
Active Devices : 4
Working Devices : 4
Failed Devices : 0
Spare Devices : 0

Layout : left-symmetric
Chunk Size : 64K

UUID : a6632795:9def84a9:6a394430:ed96cee3
Events : 0.698292

Number Major Minor RaidDevice State
0 8 19 0 active sync /dev/hdb3
1 8 3 1 active sync /dev/hda3
2 8 35 2 active sync /dev/sdc3
3 8 51 3 active sync /dev/hdd3

Cube> cat /proc/mdstat
Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md2 : active raid5 sdb3[0] sdd3[3] sdc3[2] sda3[1]
2920857600 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]

md1 : active raid1 sda2[0] sdb2[1] sdc2[2] sdd2[3]
522048 blocks [4/4] [UUUU]

md0 : active raid1 sda1[0] sdb1[1] sdc1[2] sdd1[3]
2489920 blocks [4/4] [UUUU]

unused devices: <none>


Messages:

Jul 12 14:41:05 spacetool: spacetool.c:2089 [Info] Activate all VG
Jul 12 14:41:25 scemd: scemd.c:125 fan_type=2, raid_type=1, led_type=1, thermal_type=1, fanctrl_type=1, auto_poweron_type=2, dual_power_type=1, usbcopy_type=2, fan_number=1, ebox_type=1, pis_type=2, rtc_type=1
Jul 12 14:41:26 scemd: modules/raid_sys_volume_check.c:163 MD0 active disks 4, designed disks 4
Jul 12 14:41:26 scemd: modules/raid_sys_volume_check.c:163 MD1 active disks 4, designed disks 4
Jul 12 14:41:26 scemd: modules/disk_hibernation.c:429 Force hibernation enable, idle minutes 20
Jul 12 14:41:30 synocheckshare: Fix shares in smb.conf.
Jul 12 14:41:41 syno_hdd_util: Model:[WDC WD10EZRX-00A], Firmware:[01.01A01], S/N:[WD-WCC1U2782952] in [/dev/sdd] is not ssd
Jul 12 14:41:42 syno_hdd_util: Model:[WDC WD10EADS-65M], Firmware:[01.00A01], S/N:[WD-WMAV51513718] in [/dev/sdc] is not ssd
Jul 12 14:41:42 syno_hdd_util: Model:[WDC WD10EACS-65D], Firmware:[01.01A01], S/N:[WD-WCAU42478674] in [/dev/sdb] is not ssd
Jul 12 14:41:42 syno_hdd_util: Model:[WDC WD10EACS-65D], Firmware:[01.01A01], S/N:[WD-WCAU42477933] in [/dev/sda] is not ssd
Jul 12 14:41:43 usbhid-ups[2675]: Startup successful
Jul 12 14:41:43 upsd[2699]: Startup successful
Jul 12 14:41:43 upsd[2699]: upsd.c:719 IP [127.0.0.1] add to ACL list
Jul 12 14:41:43 upsd[2699]: upsd.c:723 IP [::1] add to ACL list
Jul 12 14:41:44 upsmon[2705]: Startup successful
Jul 12 14:41:44 upsmon[2706]: UPS [ups@localhost] connected
Jul 12 14:41:45 kernel: drivers/scsi/sd.c (1754) Got USB disk
Jul 12 14:41:45 kernel: sd 4:0:0:0: [sdk] Assuming drive cache: write through
Jul 12 14:41:45 kernel: sd 4:0:0:0: [sdk] Assuming drive cache: write through
Jul 12 14:41:51 synousbdisk: RCClean succeeded
Jul 12 14:41:51 synosata: synosata.c:174 failed to enum all external sata devices
Jul 12 14:41:52 ddnsd: main(ddnsd.c:2790): not enable DDNS, shutdown daemon
Jul 12 14:41:53 hotplugd: ACTION:add.
Jul 12 14:41:53 hotplugd: DEVNAME:sdk.
Jul 12 14:41:53 hotplugd: DEVICE:/proc/bus/usb/001/003.
Jul 12 14:41:53 hotplugd: DEVGUID:000000000000011E0A4C0.
Jul 12 14:41:53 hotplugd: SYNO_PMP_EVENT:.
Jul 12 14:41:53 hotplugd: hotplugd.c (332) ==== USB disk [sdk] plugged in ====
Jul 12 14:41:53 kernel: FAT: codepage cp437 not found
Jul 12 14:41:53 kernel: FAT: nls_disk load default table
Jul 12 14:41:53 kernel: FAT: IO charset iso8859-1 not found
Jul 12 14:41:53 kernel: FAT: nls_io load default table
Jul 12 14:43:24 sm-notify[3740]: Failed to open /var/lib/nfs/sm.bak: No such file or directory
Jul 12 14:43:24 syno_bkp_data_update: Fail to get share information (NetBackup)
Jul 12 14:43:24 syno_bkp_data_update: syno_bkp_data_update.c: main(234) - Fail to update netbakup data format.
Jul 12 14:43:31 synorcd: hw_raytac.c (222) failed to open /dev/usb/hiddev5 (No such device).
Jul 12 14:43:34 scemd: scemd.c:379 stop manutild.
Jul 12 14:47:15 synoaudiod: synoaudiod.cpp:530 synoaudiod exit
Jul 12 14:47:21 scheduler: scheduler.c (1644) Got signal. Die gracefully.
Jul 12 14:47:30 kernel: nfsd: last server has exited
Jul 12 14:47:30 kernel: nfsd: unexporting all filesystems
Jul 12 14:47:35 kernel: force close libgcc_s.so.1 file(3) dentry(6)
Jul 12 14:47:35 kernel: force close libpthread-0.10.so file(18) dentry(3)
Jul 12 14:47:35 kernel: force close librt-2.3.3.so file(18) dentry(1)
Jul 12 14:47:35 kernel: force close libutil-2.3.3.so file(3) dentry(1)
Jul 12 14:47:35 kernel: force close libgcc_s.so.1 file(3) dentry(5)
Jul 12 14:47:35 kernel: force close libpthread-0.10.so file(3) dentry(2)
Jul 12 14:47:35 kernel: force close libpthread-0.10.so file(3) dentry(1)
Jul 12 14:47:35 kernel: force close libgcc_s.so.1 file(3) dentry(4)
Jul 12 14:47:35 kernel: force close libgcc_s.so.1 file(6) dentry(3)
Jul 12 14:47:35 kernel: force close libgcc_s.so.1 file(3) dentry(2)
Jul 12 14:47:35 kernel: force close libgcc_s.so.1 file(3) dentry(1)
Jul 12 14:47:35 kernel: filemap_fault: force unmount hit
.
.
.
Jul 12 14:47:41 kernel: filemap_fault: force unmount hit
Jul 12 14:47:44 scemd: modules/raid_data_volume_check.c:1020 /dev/md2 state changes from 0 to 3.


ciao

frank
 
Zuletzt bearbeitet:

kickback

Benutzer
Mitglied seit
04. Nov 2008
Beiträge
44
Punkte für Reaktionen
0
Punkte
0
Habe jetzt vom Support folgende Antwort bekommen:
We found you install 3rd party packages which we don't really support, that may cause DS may not function normally
Could you lease uninstall 3rd party packages in advance and see if this issue persists?

/volume1/opt on /opt type bind (bind)

Wäre jemand so nett mir das zu Übersetzen? Mir ist kein 3rd Party Paket bewußt, das ich installiert hätte. Im Paketmanager wird auch nix angezeigt. Irgendwie kann ich nix mit dem anfangen :-(

Hier mein hilfloses Gefuchtel im Terminal:

Cube> /volume1/opt on /opt type bind
-ash: /volume1/opt: Permission denied
Cube> cd /opt
Cube> bind
-ash: bind: not found
Cube> cd volume1/opt
-ash: cd: can't cd to volume1/opt
Cube> cd /volume1/opt
Cube> ls
bin etc lib sbin share tmp var
Cube> bind
-ash: bind: not found
Cube>



ciao

frank
 

Merthos

Benutzer
Mitglied seit
01. Mai 2010
Beiträge
2.709
Punkte für Reaktionen
1
Punkte
84
Du hast IPKG installiert, was sie nicht unterstützen. Das hat aber gewiss nichts mit dem Problem zu tun (was Synology eigentlich wissen müsste, scheint eine 08/15-Standardantwort zu sein).

Effektiv hat sich das Resize des Dateisystems durch die Abstürze zwischendurch verschluckt. Persönlich hätte ich in kein allzu großes Vertrauen mehr zu dem Volume (wie weiß, was zwischendurch falsch geschrieben wurde) und würde es neu aufsetzen.
 

raymond

Benutzer
Mitglied seit
10. Sep 2009
Beiträge
4.704
Punkte für Reaktionen
21
Punkte
118

kickback

Benutzer
Mitglied seit
04. Nov 2008
Beiträge
44
Punkte für Reaktionen
0
Punkte
0
Okay, ich hab das mal gelöscht. Fahre gerade ein zusätzliches Backup der Dateien auf eine nagelneue externe Platte (gestern eingetroffen, lieber 2 Backups als nur eins).
Danach versuche ich nochmal die Größe des Voulmes hochzufahren und schau, ob es wieder crasht.

Firmwareupdates gibt es keine mehr, aber der Support antwortet freundlicherweise noch.

ciao

frank
 
Zuletzt bearbeitet:

kickback

Benutzer
Mitglied seit
04. Nov 2008
Beiträge
44
Punkte für Reaktionen
0
Punkte
0
Ich hab ja die Verzeichnisse gelöscht, trotzdem ist das /volume1/opt nun wieder da:
Cube> df -h
Filesystem Size Used Available Use% Mounted on
/dev/md0 2.3G 585.1M 1.7G 25% /
/tmp 30.0M 668.0K 29.4M 2% /tmp
/dev/md2 1.8T 1.7T 94.5G 95% /volume1
/volume1/opt 1.8T 1.7T 94.5G 95% /opt
/dev/sdk1 1.8T 1.5T 310.1G 83% /volumeUSB1/usbshare
Cube> ls /volume1
@autoupdate @smbd.core aquota.group opt zeitkapsel
@database @spool aquota.user photo
@download @sshd.core download public
@eaDir @tmp lost+found tmp
@postfix Dateien music video
Cube> ls /volume1/opt
Cube> ls
Cube>



muss ich da noch irgendwo einen mount Befehl entfernen oder sowas?

Freue mich über jeden Hinweis. vi kann ich für den Hausgebrauch.

ciao

frank
 

kickback

Benutzer
Mitglied seit
04. Nov 2008
Beiträge
44
Punkte für Reaktionen
0
Punkte
0
So, das Backuppen hat etwas länger gebraucht. Nachdem ich endlich mal zum Erwerb eines GigaBit Switches durchgerungen habe, ging es aber :)

Ich habe heute das Volume erfolgreich vergrößert und bin jetzt sicher, das Übel identifiziert zu haben. Die für Backups angeschlossene USB-Festplatte wars (!!?)

Offenbar ließ die USB-Festplatte sich nicht herunterfahren, was der Cube irgendwie nicht geschmeckt hat. Heute habe ich dann die Platte ausgestöpselt, die Cube sicherheitshalber neu gestartet und das Volume erfolgreich erweitern können.

Das ist so skuril, dass ich es lieber mal hier auch schreiben wollte, falls jemand ähnliche Probleme bekommt.

ciao

frank
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat