ESXI verliert alle paar Stunden kurz die Verbindung zum NFS Store

Status
Für weitere Antworten geschlossen.

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Hallo,

ich habe seit der letzten Firmware Aktualisierung (glaube ich zumindest) folgendes Problem:

Wir betreiben auf einer Ds1812+ (Software: DSM 4.1-2668) einen NFS Store der als gemeinsamer Datenstore für zwei ESXi 5.1 Hosts dient.
Das lief auch über Wochen stabil, jetzt sehe ich immer wieder Warnungen dass die Hosts die verbindung zum NFS Share verlieren
und ihn ca. nach 1 min wieder herstellen.
In dieser Zeit frieren alle Maschinen natürlich ein, ich habe schon einen kompletten Restart aller Geräte gemacht und kann keine Lösung
dazu finden.
Hatte jemand schon mal was ähnliches, die DS zeigt in den Logs nichts an ( wobei sie zu NFS überhaupt nichts anzeigt).
Die Switche können es auch nicht sein, da hab ich alle Logs durchsucht.

Gruß
Erzwodezwo
 

Tommi2day

Benutzer
Mitglied seit
24. Aug 2011
Beiträge
1.165
Punkte für Reaktionen
63
Punkte
68
ich habe ein ähnliches Problem mit iSCSI und Win2008. Die Variante mit Zuteilung der Platte durch die VM mit Datastore auf NFS läuft bei mir mit ESXi5.1 jedoch ohne Probleme. Ich habe aber kein Root-fs auf NFS, so das bei einem Ausfall theoretisch die Maschine nicht einschlafen sollte.
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Testweise habe ich jetzt mal eine VM auf unsere Backup NAS (DS213+ mit selber Firmware) verschoben, dort ist bis jetzt dieser Fehler noch nicht aufgetreten.
Ich denke ich werde mich mal am Montag an den Support wenden, denn das ganze ist doch etwas unangenehm, da wir auch ein Softwareverteilungssystem einsetzen und das jedes mal in einen Fehler läuft wenn gerade eine Maschine betankt wird und dann die Verbindung vom Host zur VM kurz unterbrochen wird.

Was mir jetzt auffiel, auf der DS213+ wird der Zugriff per NFS vom Host angezeigt, auf der DS 1812+ wird gar nichts von diesem Host angezeigt??? Das finde ich etwas seltsam.

Gibt es log files in denen zu sehen ist was das NFS gerade macht und wenn ja wo liegen die auf der NAS?
 
Zuletzt bearbeitet:

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Morgen zusammen,

ich habe jetzt mal folgende Tests gemacht:

Ich hab eine VM auf unseren zweiten Host geschoben und dort bis heute laufen lassen um zu sehen ob der Fehler nur auf dem einen Host auftritt.
Auf dem zweiten Host konnte ich den Fehler bis jetzt nicht nachstellen.
Wobei ich vorher auf der DS1812+ die NFS freigaben sowie den NFS Server deaktiviert hatte, dann habe ich die ganze NAS neu gestartet und danach den Server wieder aktiviert und
die Freigaben neu eingerichtet.
Seit der Neukonfiguration des NFS Servers wird unser Host auch unter aktuelle Verbindungen angezeigt, ich glaube das ist ein gutes Zeichen.
Ich warte jetzt mal bis morgen ab ob der Fehler nochmal auftritt, da er ja normalerweise alle paar Stunden aufgetreten ist.
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Leider doch keine Besserung, das Problem ist wieder da....
Ich hab mal ein Ticket aufgemacht und eine Idee ist noch den ESXI neu zu installieren.....
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
@Tommy2day
Hast Du noch andere Sachen auf der NAS laufen, wie z.B CIFS, App Pakete, Netbackup, Hidrive Backup?
Ich hab mal alles deinstalliert bzw. abgeschaltet was ich nicht unbedingt brauche und jetzt ist der Fehler nur noch heute morgen zwischen 5:40 und 6:20 Uhr aufgetretten.
Ich habe den verdacht dass das Netbackup und das Hidrive Backup eventuell bei der Datensicherung kurz den NFS Dienst stoppt und dadurch diese Fehler kommen, denn beides habe ich auf unserer zweiten NAS nicht
laufen und dort tritt der Fehler ja nicht auf.

Übrigens ich habe am Montag ein Ticket bei Synology eröffnet, heute morgen hatte ich eine Standard mail zurück bekommen dass ich die Kernel.log hin schicken soll....
Jetzt warte ich wieder....

Also ganz ehrlich ein bisschen Enttäuscht vom Support bin ich schon, die DS1812+ kostet jetzt zwar keine tausende von Euro, aber wir haben bei verschiedenen Kunden einige der größeren Rack Modelle laufen die ja schon Geld kosten und wenn dort so ein Fehler auftritt bei einem Produktiv System wär das schon Sche...e bei diesen Reaktionszeiten.
Ein echter Minuspunkt.
 

Tommi2day

Benutzer
Mitglied seit
24. Aug 2011
Beiträge
1.165
Punkte für Reaktionen
63
Punkte
68
ich habe die DS als noch als Backup-Ziel und als Recorder für die Surveillance-Station laufen. Wenn das Backup natürlich die Leitung dicht macht, kann ich mir schon vorstellen, das es Probleme bei NFS und ISCSI geben kann. Aber dafür hat man ja das 2. Interface.
Zu Deinem "Support-Problem": Bei anderen Herstellern kannst Du schon bei der Beschaffung locker eine Null an das Preisschild heften, + stattlicher Wartungspauschale. Du kannst extra Support auch für Syno-Geräte bekommen,z.B. siehe Forums Startseite. i.d.R. wird es aber zielführender sein, sich ein zweites Gerät daneben zu stellen. Evtl. ist die neue HA-Lösung in 4.2 was für diese Ansprüche.
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Ich hab bereits die Datenleitungs Auslastung überprüft, da ist immer noch genug Spielraum
Bei uns ist die 1812+ Backup Quelle und zwar werden sowohl Daten wie auch die Konfiguration der NAS gesichert.
Und da könnte es doch sein, dass gewisse Daten kurzfristig gesperrt werden, was dazu führen kann dass der NFS Server nicht erreichbar ist.
Die zweite NAS ist Backupziel, dort tritt der Fehler nicht auf.
Ich konnte das ganze ja schon mal eingrenzen auf ein den Zeitraum von 5:40 bis 6:20 Uhr, ansonsten ist der Fehler heute nicht aufgetreten und die Tage davor tratt er den ganzen Tag über auf.
Sollte es am Backup liegen dann könnte ich mit einem kurzen Ausfall gegen 6 Uhr leben, da arbeitet eh meist noch niemand..... ;-)
 

genab

Benutzer
Mitglied seit
07. Sep 2012
Beiträge
45
Punkte für Reaktionen
0
Punkte
6
Hallo Forum,

ich hab das gleiche Problem das nach ca einer halben Stunde die NFS Datastores als inaktiv gekennzeichnet werden.

Das Problem ist allerdings erst seid der Version 5.1-914609 aufgetaucht... Wir haben am Freitag alle ESX Server neu installiert mit ESXi5.1

vorher hatten wir ESX 4.1, und da haben die NFS Shares ein Jahr lang ohne Probleme funktioniert....

ich habe DS1812+ mit Firmware 4.1.2668 im einsatz (hab noch DS411 II und DS412 Plus im Einsatz)

Wir haben bei VMware Gold wartung (Produktive)

das hat sich dann auch heute ein VMware Engeneer angeschaut, und viel getestet und überprüft, er meinst es liegt an den NFS stores.

Netzwerkproblem etc kann also ausgeschlossen werden.

Was kann ich tun?
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Hallo,

Fallen bei Dir die NFS Stores nach einer halben Stunde komplett weg?
Bei mir sind Sie nur kurz weg und dann wieder da, also ein kurzer APD (All parts down).

Ich konnte das Problem etwas eingrenzen:
Wir haben HiDrive Backup auf der NAS im Einsatz um Daten (keine aus den NFS Freigaben) in die Strato Cloud zu sichern.
Das habe ich jetzt seit ca. 1 Woche deaktiviert und seitdem trat das Problem nur noch ein bis zweimal auf.
Die letzten beiden Tage ist komplett ruhe.

Mach mal ein Ticket bei Synology auf, die Entwickler sind da dran, sie baten mich um Logfiles aus der VMWare Umgebung, allerdings kann ich die momentan nicht liefern, da ja das Problem nicht mehr auftrat.

Ansonsten als Tip würde ich so vorgehen und mal alles deaktivieren an zusätzlichen Diensten was nicht unbedingt auf der NAS seien muss.

Gruß
Torsten
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Heute war das Problem wieder da.... ich kann keinen Zusammenhang sehen zwischen einer auf der NAS installierten App und dem Phänomen.
Ich schick jetzt mal die Logfiles an Synology und warte was die Entwickler sagen......
 

Theslowman

Benutzer
Mitglied seit
24. Sep 2012
Beiträge
372
Punkte für Reaktionen
2
Punkte
18
Sehr wundersam das ganze. Ist auf den Nas System ext4 im Einsatz oder ist es unterschiedlich zur 213+ ? Nur mal so als Gedanke ...
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Hallo,

auf beiden Systemen ist EXT4 im Einsatz, der einzige Unterschied ist dass die 1812+ einen SHR2 Raid konfiguriert hat und die DS212+ einen Raid 0, aber das dürfte nicht die Ursache des Problems sein.
Ich spiele mit dem Gedanken auf die 4.2 upzudaten, testweise werde ich mal die 212+ updaten und dann wenn alles klappt am WE die 1812+ (hier müssen ja erst alle VMs heruntergefahren werden).
 

Theslowman

Benutzer
Mitglied seit
24. Sep 2012
Beiträge
372
Punkte für Reaktionen
2
Punkte
18
Ich werd das Gefühl nicht los das Ext4 das Prob ist/war. In der neuen 4.2 sollte der "Ext4" Fix drin sein .........

Gruß TSM
 

erzwodezwo

Benutzer
Mitglied seit
09. Dez 2012
Beiträge
67
Punkte für Reaktionen
0
Punkte
6
Ich hab jetzt mal ein Update auf die neue Version 4.2 gemacht und seit dem hatte ich keine NFS Unterbrechung mehr, anscheinend haben die da was geändert.
Allerdings geht jetzt die ACL Funktion auf der NAS nicht mehr richtig, ist sie aktiviert kann keine Office Anwendung Dateien abspeichern. :-(

Naja neues Problem.... irgendwas ist ja immer

Gruß
Torsten
 

Theslowman

Benutzer
Mitglied seit
24. Sep 2012
Beiträge
372
Punkte für Reaktionen
2
Punkte
18
wenns das war is doch super !
 

genab

Benutzer
Mitglied seit
07. Sep 2012
Beiträge
45
Punkte für Reaktionen
0
Punkte
6
so, nach nun fast 3 Wochen habe ich die erfahrung gemacht, das die NS immer wieder mal weg waren.. vor allem wenn ich an der NAs viel rumgespielt habe und viel traffic auf der NAS war (beispielsweise snapshots von virtuellen maschinen löschen...)


die Virtuellen Maschinen waren dann aus gegraut

auf die NAS NFS Storages konnte ich aber zugreifen unter vmware

das war schon sehr komisch..

bei mir half dann nur ein Neustart des ESX Servers...

dann geht wieder alles,

ich werden nun mal vorsichtig die NAS auch auf 4.2 updaten, in der Hoffnung, das es besser geht
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat