NAS bootet nach Plattentausch nicht mehr; kurzzeitig doch mit degraded Volume; jetzt wieder nicht

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Naja, ich lasse es mal bis morgen früh so laufen.
Auch nach 12h keine Veränderung. Nach einem Reboot (soft shutdown über den Power Button) war das Verhalten gleich. In der Mitte des Bootvorgangs waren in den DHCP-Serverlogs die gleichen DHCPDISCOVER / DHCPOFFER Einträge zu sehen, aber kein DHCPREQUEST. `arp` zeigt "incomplete". Ein gleichzeitig laufender arp scan (netdiscover im passiven modus) hat nichts gefunden. Irgendwas stimmt schon auf Link-Layer / IP-Layer nicht.

Ich hab auch noch einen aktiven ARP scan (netdiscover) gemacht, während das NAS in diesem Zustand gelaufen ist. Das LAN LED hat angeregt geblinkt, aber Antworten kamen wohl keine.

Mal sehen ob man mit dem seriellen Terminal etwas sieht.
 

himitsu

Benutzer
Sehr erfahren
Mitglied seit
22. Okt 2018
Beiträge
2.904
Punkte für Reaktionen
336
Punkte
123
TxD, RxD und GND reichen eigentlich aus.
Falls man aber unbedingt auch VCC mit anschließen will, aufpassen, dass es 3.3V sind ... nicht 5V.
Und falls du dir mit TxD und RxD nicht ganz sicher bist, sollte es nicht schlimm sein, wenn du die ausversehn vertauscht hast ... du kannst sie also auch einfach mal unternander tauschen, wenn nichts im Terminal zu sehen ist.


Ich wollte mal probieren, ob es auch mit einem HC-05 oder HC-06 (Bluetooth-Modul) im Client-Modus geht und dann mit dem Handy verbunden. (da drauf der Terminal-Emulator)
Oder vielleicht auch ein ESP8266 / ESP-01 oder Sowas.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: NikolausDemmel

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Der Adapter ist da. Die Verbindung mit dem Serial Port funktioniert gut.

Log fuer den "guten" Fall ohne Disk: bootlog-no-disk.txt

Problemfall beim booten mit der frischen Reinstallation: bootlog-fresh-install.txt

Es stimmt in der Tat was mit dem networking nicht. Der dhcp-client crashed immer, und es wird keine IP zugewiesen.

Code:
...
[   75.570000] init: dhcp-client (eth0) main process (3463) killed by TERM signal
[   79.530000] init: dhcp-client (eth0) main process (3641) terminated with status 1
[   79.530000] init: dhcp-client (eth0) main process ended, respawning
[   82.830000] init: dhcp-client (eth0) main process (3792) terminated with status 1
[   82.830000] init: dhcp-client (eth0) main process ended, respawning
...

Wenn ich mich mit dem Terminal einlogge, kann ich manuell eine IP mit ifconfig setzen und dann auch via IP verbinden (zB http). Juhu :)!

Naechste Schritte:
  1. Die Neuinstallation nochmal mit verbundenem Serial Port durchfuehren, so dass ich nach dem Neustart die IP setzen kann, so dass der letzte Schritt "Writing config files" abgeschlossen werden. Hoffentlich behebt sich der dhcp Fehler wenn ich das aktuellste Update installiere.
  2. Die bootlog checken fuer einen Boot mit den alten Disks, um zu verifizieren, dass es in der Tat an einem kaputten RAID1 liegt. Die Frage waere dann hier, ob ich dort irgendwie die Systempartitionen reparieren kann, oder lieber mit der Neuinstallation von Schritt 1 arbeiten sollte, und dort versuchen, das degradete RAID5 als Volume hinzuzufuegen und zu reparieren.
PS, das hier war sehr praktisch, um das root passwort fuer den Shell login herauszufinden: https://wrgms.com/synologys-secret-telnet-password/

PPS: RX and TX musste ich tatsaechlich vertauschen. Danke fuer den Tipp!
 

Anhänge

  • bootlog-fresh-install.txt
    21,4 KB · Aufrufe: 1
  • bootlog-no-disk.txt
    16,3 KB · Aufrufe: 0
  • Like
Reaktionen: Penthys

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.320
Punkte für Reaktionen
2.871
Punkte
423
Mmh, schon mal überlegt, ob evtl. dein DHCP-Server nicht richtig arbeitet / falsch konfiguriert ist und den dhcp-client zum Absturz bringt :unsure:
 
Zuletzt bearbeitet:

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Guter Punkt, aber ich denke nicht, dass das das Problem ist. Es verhält sich gleich bei 3 verschiedenen DHCP Servern (Fritzbox, Mac, Linux).
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.320
Punkte für Reaktionen
2.871
Punkte
423
Was mir da noch einfällt: Ist zu einem Zeitpunkt immer nur ein DHCP-Server aktiv? Du zeigst ja oben immer nur das Log von einem und nicht, was tatsächlich im Netzwerk passiert (Stichwort Wireshark).
 

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Auch das kann ich hier ausschließen, da es eine Driektverbindung zwischen NAS und Rechner ist, ohne switch. Ich muss nochmal probieren, was die logs sagen, wenn ich bei der Initialisierung eine statische IP setze. Damit hätte es auch nicht funktioniert. (Aber Danke für die Tipps! Gerne weitere Ideen, was man probieren kann. Aber ich hab auch noch Todos für heute Abend.)
 

Georgius

Benutzer
Mitglied seit
10. Apr 2021
Beiträge
231
Punkte für Reaktionen
10
Punkte
18
Wad für einen Adapter verwendest Du?
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.320
Punkte für Reaktionen
2.871
Punkte
423

Georgius

Benutzer
Mitglied seit
10. Apr 2021
Beiträge
231
Punkte für Reaktionen
10
Punkte
18
Direktverbindung Nas-Rechner? Wo soll da der DHCP her kommen?
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.320
Punkte für Reaktionen
2.871
Punkte
423
Von seinem Linux-Rechner, auf dem ein DHCP-Server läuft.
 
  • Like
Reaktionen: NikolausDemmel

himitsu

Benutzer
Sehr erfahren
Mitglied seit
22. Okt 2018
Beiträge
2.904
Punkte für Reaktionen
336
Punkte
123
PPS: RX and TX musste ich tatsaechlich vertauschen. Danke fuer den Tipp!
RX und TX müssen eh immer gekreuzt werden.
Der Sender (transmit) des Einen muß in den Empfänger (receive) des Anderen und rückzu andersrum.

In einigen Beschreibungen ist an den Anschüssen der DS nicht das drangeschrieben, was es in der DS ist (kreuzen), sondern das was man dort anstecken soll (ungekreuzt).



Zum Glück hat man beim LAN das Problemchen mit Patch- und Crossover-Kabeln abgeschafft.
 
  • Like
Reaktionen: NikolausDemmel

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Zwischenerfolg:

Ich hab jetzt nochmal mit den 3 alten "guten" Disks gestartet (log im Anhang). Komischerweise hat er jetzt wieder erfolgreich gebootet. Fragt mich nicht, was jetzt anders war also die gefuehlt 20 vorherigen Versuche (ausser, dass das Terminal verbunden ist).

Das RAID1 war degraded, die DS konnte aber von Disk1 starten (so aehnlich war es ja ganz am Anfang schonmal, als ich ploetzlich einmal wieder Zugriff hatte). Das Raid 5 wurde automatisch gemountet (im "degraded" Zustand).

Um eine Verbindung aufzubaun, brauchte ich aber auch hier wieder das Terminal, da keine IP vergeben wurde (dhcp client ist auch wieder abgeschmiert laut Terminal Output). Nach dem manuellen Setzen der IP konnte ich ueber HTTP zugreifen. Ich konnte dann die Systempartitionen reparieren, hab die neue Disk eingelegt, und die Volume Reperatur angestossen (laeuft noch).

Das DHCP Problem koennte diesmal wohl tatsaechlich an dem Test-DHCP-Server auf dem Linux Rechner liegen. Ich habe hier das 192.168.11.0/24 Netz, und die alte Installation der DiskStation erwartet die IP 192.168.178.20 aus dem Netz der Fritz.Box. Ich probiere es nach dem Repair nochmal mit Netzwerkanschluss an der Fritzbox (wollte aber jetzt keinen Neustart vor dem Repair riskieren).
 

Anhänge

  • bootlog-old-disks.txt
    32,9 KB · Aufrufe: 0

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Eine Ueberlegung hatte ich noch: Die Systemzeit war auf irgendwas bei 1909 (ich hatte ja auch zwischenzeitlich die BIOS Batterie gewechselt). Das koennte vielleicht etwas mit den Netzwerk Problemen zu tun haben. Ich hab jetzt ueber das HTTP Interface die Systemzeit manuell richtig gesetzt. Ich hoffe, das ist jetzt persistent ueber Neustarts hinweg.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
12.320
Punkte für Reaktionen
2.871
Punkte
423

NikolausDemmel

Benutzer
Mitglied seit
29. Mai 2022
Beiträge
18
Punkte für Reaktionen
2
Punkte
3
Ein paar Monate spaeter nochmal ein Update von meiner Seite. Das NAS laeuft weiterhin problemlos. Ich hatte vor ein paar Tagen die letzte "alte" Festplatte durch eine neue ersetzt. Diesmal gab es beim Neustart mit neuer Platte keinerlei Probleme. Das Raid war wie erwartet degraded und konnte mit der neuen Platte repariert werden.

Im Nachhinein ist meine Vermutung, was das urspruengliche Problem ausgeloest hat, folgendes:
1. Die BIOS Batterie war so schwach, dass nach dem Tausch der defekten Platte, wobei das NAS ja vom Netz getrennt wurde, die Systemzeit auf 1909 zurueckgesetzt wurde.
2. Mit dieser Systemzeit hat DHCP / Netzwerk nicht funktioniert.
3. Zwischendurch hatte ich ja die BIOS Batterie ersetzt, was alleine aber keine Verbesserung gebracht hatte.
4. Zwischendurch hatte ich ja mehrfach gestartet und auch recht kurz nach dem Neustart eine Force-Shutdown gemacht, was u.U. weitere Probleme verursacht hatte.

Die Rettung war letztlich das setzen der Systemzeit ueber das Debug Terminal.

Vielen Dank nochmal an alle fuer die vielen Tips und Unterstuetzung!
 
  • Like
Reaktionen: ctrlaltdelete


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat