High Availability Cluster: Fragen, Anregungen, Know-How und Erfahrungsaustausch

Status
Für weitere Antworten geschlossen.

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Hallo zusammen, :)

habe mich jetzt entschieden ein "High Availability Cluster" zu testen.

Das Thema scheint mir im Forum noch nicht sehr verbreitet (gibt auch keinen Bereich dafür), auch habe ich nirgends ausführliche Berichte von Leuten gefunden die das praktizieren, das Thema taucht eher mal in der Theorie in der Kaufberatung auf oder es werden vereinzelte Fragen gestellt aber meist nicht beantwortet.

Dieser Thread ist nun ein Versuch das Thema zu vertiefen und Praxiserfahrung auszutauschen, es wäre schön wenn möglichst viele Leute die sich damit befassen hier ab und zu mal reinschauen und ihren Senf dazu geben.


Vorab: Meine Gründe für ein HA-Cluster

Von allem hat man ein Backup, nur die Hardware wird meist vergessen.

Grundsätzlich bin ich immer dafür, dass man Hardware auf die man wesentliche Abläufe aufbaut doppelt haben sollte, denn wenn sie in einer zeitkritischen Phase kaputt geht braucht man sie nur wechseln und muss nicht unter Zeitdruck etwas Neues beschaffen und installieren. Das gilt mal ganz unabhängig davon, ob man mit HA-Cluster arbeiten will oder nicht.

Zweitens kann man zum Beispiel seine Installation auch mal auf dem Reservegerät in aller Ruhe neu aufbauen, und man kann damit herumexperimentieren ohne den Betrieb oder die Daten auf dem Hauptgerät zu gefährden.

Drittens können auch mal beide Geräte gleichzeitig genutzt werden (ok, das macht bei einem Notebook o.ä. mehr Sinn als bei einem Server).

Dummerweise habe ich zuerst zwei verschiedene DS beschafft, nun kommt aber aus diesen Gründen eine zweite DS1513+ hinzu, so dass die DS414 evtl. entbehrlich wird, mal sehen.

So weit so gut, zwei gleiche Geräte führen aus meiner Sicht noch nicht zwingend zu einem HA-Cluster, die Hochverfügbarkeit im Sinne des minutenschnellen Umschaltens brauche ich nicht. Wenn ich bei Ausfall einer DS die Platten in die andere umbauen kann dann würde mir das reichen, so eilig habe ich es auch wieder nicht.

Warum also HA-Cluster?

Was mich daran primär reizt ist das permanente Echtzeit-Backup der Daten auf eine zweite Station. Diese zweite Station kann im Gebäude anderswo stehen, an einer anderen USV hängen usw. Wenn also eine Station absaufen, abrauchen, abbrennen, abkotzen, abschmieren, abfackeln, abtauchen oder was auch immer sollte, egal warum, dann sind die kompletten Daten hochaktuell auf einer zweiten Station noch vorhanden.

Ja, ich weiß: Dies ist kein Ersatz für zeitlich und räumlich wirklich getrennte Backups, die werde ich weiterhin zyklisch anfertigen, wobei ich parallel 2 Methoden einsetzen will:

Die eine Methode besteht im rotierenden Herausnehmen und Austauschen vom RAID-Platten, so mache ich es bisher, damit habe ich Daten und DSM im Synology-Format gesichert.

Die andere Methode ist eine Kopie über USB oder eSATA auf NTFS. Bei dieser Methode erhoffe ich mir vom HA-Cluster ebenfalls einen weiteren entscheidenden Vorteil: Ich stelle mir das so vor:

Zwecks Backup wird das HA-Cluster getrennt, zu dem Zeitpunkt darf von extern kein Datenzugriff erfolgen, die Daten müssen konsistent sein. Nach der Trennung darf dann aber auf den aktiven Server sofort wieder zugegriffen und auch geschrieben werden, währenddessen wird das Backup vom passiven, abgetrennten Server erstellt.

Ist das Backup fertig, dann wird das HA-Cluster wieder gebunden, d.h. das System bringt dann den passiven Server wieder auf den neusten Stand.

Somit ist mein Hauptserver während des Backups voll aktiv und Daten dürfen geschrieben werden, ohne dass ich befürchten muss ein inkonsistentes Backup anzufertigen.

Das sind jetzt so meine Grundüberlegungen. Kommentare, Einwände, Fragen, Kritik und Gegenvorschläge sind willkommen.

Konkrete Fragen zum HA-Cluster habe ich auch noch:

- Inwieweit kann ich die Performance des Standby-Servers lesend nutzen?
- Müssen beide Server zwingend genau identisch installiert sein?
- Kann ich mit LACP ans Netz?

Versuchen werde ich das Ganze mal mit DSM 5.0.
 
Zuletzt bearbeitet:

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.715
Punkte für Reaktionen
1.023
Punkte
754
Das ist ein sehr spannendes Vorhaben. Ich finde es toll, dass Du das Forum daran teilhaben lässt, und werde diesen Thread mit Interesse verfolgen. Viel Erfolg!
 

Matthieu

Benutzer
Mitglied seit
03. Nov 2008
Beiträge
13.222
Punkte für Reaktionen
88
Punkte
344
Ich finde das auch interessant - habe aber selbst auch keine Möglichkeit HA auszuprobieren/einzusetzen.

Meinem Verständnis nach(!): Ja, man braucht absolut identische Hardware. Bezüglich der Nutzung des "passiven" Gerätes hat sich bei 5.0 was getan - wie das im Detail aussieht kann ich aber auch nicht sagen. So wie ich es bisher gesehen habe, sollte man möglichst eine Direktverbindung zwischen beiden Geräten herstellen. Wenn du also eine große physikalische Distanz zwischen die Geräte bringen möchtest, bedenke die "durchgehende" Leitung die u.U. nötig ist. Ansonsten wird diese Verbindung ganz schnell zum Flaschenhals.

MfG Matthieu
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Danke euch beiden für die Beteiligung!

Meinem Verständnis nach(!): Ja, man braucht absolut identische Hardware.
Ja, werde ich haben. Außer bei den Disks, da habe ich eine Mischung aus WD40EFRX und ST4000VN000, die sind aber exakt gleich groß, die Seagate ist nur deutlich schneller.

Bezüglich der Nutzung des "passiven" Gerätes hat sich bei 5.0 was getan - wie das im Detail aussieht kann ich aber auch nicht sagen.
Da bin ich gespannt. Ich habe bisher an der DS1513+ LACP im Einsatz, aber leider wird selbst für mehrere Kopioervorgänge zwischen zwei Stationen immer nur ein LAN-Port benutzt. LACP nutzt mehrere Ports erst bei mehreren Clients, das ist aber nicht der typische Fall in dem es mir auf Performance ankommt.

So wie ich es bisher gesehen habe, sollte man möglichst eine Direktverbindung zwischen beiden Geräten herstellen.
Ja, und seit DSM 5 ist für den Heartbeat angeblich auch ein LACP-Bond möglich der dann auch ausgenutzt wird. Ich will dafür 2 von 4 Ports verwenden.

Wenn du also eine große physikalische Distanz zwischen die Geräte bringen möchtest, bedenke die "durchgehende" Leitung die u.U. nötig ist. Ansonsten wird diese Verbindung ganz schnell zum Flaschenhals.
Ja. Vorerst sollen die Geräte mal testweise nebeneinander neben meinem Switch stehen. Wenn dann die zweite tatsächlich räumlich ausgelagert wird will ich dorthin vier Gigabit-Kabel verlegen.
 

Leberkasbepi

Benutzer
Mitglied seit
19. Feb 2012
Beiträge
315
Punkte für Reaktionen
0
Punkte
22
Die eine Methode besteht im rotierenden Herausnehmen und Austauschen vom RAID-Platten, so mache ich es bisher, damit habe ich Daten und DSM im Synology-Format gesichert.

Das solltest du nicht machen, weil die SATA Stecker in der DS nicht für häufiges wechseln vorgesehen sind! Das führt nur zu einer schnellen Abnutzung.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Die Stecker sind laut Synology und laut SATA-Spec für 500 Zyklen ausgelegt, dann kannst du es dir ausrechnen. Mir reicht das aus (nach 50 Jahren kann ich ja mal das Backplane wechseln :D )
 

Leberkasbepi

Benutzer
Mitglied seit
19. Feb 2012
Beiträge
315
Punkte für Reaktionen
0
Punkte
22
Naja, ich würds trotzdem nicht riskieren. :)
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Das Thema ist hier ein bißchen Off Topic. Dort habe ich ausführlich begründet, warum ich das mache.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Ich habe das Cluster nun eingerichtet:

Vorbereitungen:
Ich teile die 4 LANs der 1513 so auf, dass je 2 als LACP-Bond am Netz sind und die 2 anderen als weiteres LACP-Bond die Heartbeat-Verbindung des Clusters bilden. Die notwendigen Einstellungen am Switch und am Router für das Arbeiten mit Bonds (Link Aggregation) spare ich mir hier, das ist ein anderes Thema, das selbe gilt für das Thema Einrichten fester IPs. (Link Aggregation ist natürlich nicht zwingend notwenidg, man kann auch mit jeweils nur einem LAN-Port arbeiten.)

1. Vorbereitung der laufenden DS1513:
a) Datensicherung
b) Netzwerkkonfiguration geändert:
c) Bond1 erstellt aus LAN1 und LAN2 mit IEEE 802.3ad, feste IP 192.168.178.16, LAN1 und LAN2 am Switch eingesteckt
d) Bond2 erstellt aus LAN3 und LAN4 mit IEEE 802.3ad, weitere Konfiguration später automatisch für Heartbeat
e) im Paketzentrum High Availability installiert, das fordert zuvor Phyton 2.7.3-036, verfügbar war 2.7.3-0038, also das installiert (nicht Phyton3)


2. Inbetriebnahme der zweiten DS1513:
a) Platten gesteckt, identische Ausrüstung wie erste DS1513
b) DSM 5.0 installiert, Name DS1513-B, leeres Volume identisch zu erster DS1513 eingerichtet damit Pakete installiert werden können
c,d,e wie oben, lediglich andere IP für Bond 1: 192.168.178.14
f) Heartbeat verbunden, in meinem Fall DS1513-B LAN3 verbunden mit DS1513 LAN3, DS1513-B LAN4 verbunden mit DS1513 LAN4

Beide Stations sind nun also im Netz und per DSM bedienbar.

Das Einrichten des HA-Clusters erfolgt dann ausschließlich am Originalserver (bei mir DS1513), der neue und zukünftig passive Server (bei mir DS1513-B) wird dabei nicht weiter angefaßt. Das Einrichten folgt im Folgebeitrag:
 

Leberkasbepi

Benutzer
Mitglied seit
19. Feb 2012
Beiträge
315
Punkte für Reaktionen
0
Punkte
22
Das Thema ist hier ein bißchen Off Topic. Dort habe ich ausführlich begründet, warum ich das mache.

Also damit habe ich nicht gerechnet, dass jetzt die Kabel weniger Steck Zyklen haben als die internen Verbindungen. So gesehen macht es wirklich mehr sinn, die Platten zu wechseln.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Das Thema können wir im anderen Thread ja gern weiter diskutieren.

Hier mache ich mal weiter mit dem HA-Cluster.

Der Aufbau geht durch folgende Dialoge:
HA1.jpg

Hier gebe ich IP und Zugangsdaten zu meiner DS1513-B an:
HA2.png

Auswahl der Schnittstelle die die Server verbindet:
HA3.png

Nun muss ich einen neuen Namen und eine neue IP wählen, die dann für das Cluster gilt:
HA4.png

Die Daten nochmals im Überblick:
HA5.png
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Nun sind wir erstmal ein paar Minuten zum Zusehen verurteilt:
HA6.png


HA7.png

HA8.png


HA9.png


HA10.png


HA11.png

Hier wird nun der DSM-Zugang im Browser von 192.168.178.16 umgeleitet auf 192.168.178.12:

HA12.jpg
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Der passive Server, die DSM1513-B ist komplett abgetaucht:
HA13.jpg

Sie ist auch über CIFS nicht mehr erreichbar, d.h. ich kann ihre Ordner in Windows nicht mehr als Netzlaufwerke verbinden.


Einstweilen wird der Server nun gespiegelt:
mkvs287c.jpg


Über den Heartbeat scheinen dabei ca. 120 MB/s zu gehen:
HA16.png
 
Zuletzt bearbeitet:

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.715
Punkte für Reaktionen
1.023
Punkte
754
Sieht bisher sehr sauber aus. Danke für die tollen Screens, durch die jeder Schritt nachvollziehbar ist. War es auch für Dich so rund, wie es hier aussieht?
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Danke.

Ja, insoweit war es recht einfach die Probleme folgen noch, siehe unten:

Zunächst mal kann ich nun alle 3 Adressen pingen, also
- die IP des Clusters DS1513-HA 192.168.178.12
- die IP der DS1513 192.168.178.16
- die IP der DS1513-B 192.168.178.14

Wie geht sowas? Kann ein Port zwei IP-Adressen bedienen? Real habe ich zwei Maschinen im Netz, davon jede mit nur einer (logischen) Schnittstelle.

Auch per DSM-HTTP ist sowohl die .12 als auch unter díe .16 erreichbar, allerdings meldet sich in beiden Fällen der Cluster-Server DS1513-HA.

Die Fritz-Box registriert dagegen nur die DS1516 unter .16 und die DS-1516-B unter .14:
HA17.jpg

Nun die Probleme:

1.) VPN-Server geht nicht mehr

Der VPN-Server ist aktiviert und meldet keinen Fehler, ist aber unter der 192.168.178.16 nicht mehr erreichbar. Und da es in der Fritz-Box keine Station mit 192.168.178.12 gibt, kann ich dorthin auch nichts weiterleiten, wobei fraglich ist ob es nur daran liegt, also ob es mit .12 funktionieren würde.

Da ich mit der DS414 einen weiteren VPN-Server im Netz habe ist das insoweit momentan kein Problem.


2.) LDAP-Server geht nicht mehr

Der LDAP-Server wurde beim Bilden des Clusters deaktiviert und läßt sich auch nicht mehr aktivieren:
HA18.png

D.h. ich müßte auch den LDAP-Server nun erstmal auf die DS414 umziehen, denn der steuert die Benutzerverwaltung meiner Rechner.


Beides ist also kein großes Problem. Andererseits baut man sich aber kein HA-Cluster damit man dann die Hälfte der Dienste auslagern muss. :confused:

Das ist mal für heute der Stand.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.715
Punkte für Reaktionen
1.023
Punkte
754
Andererseits baut man sich aber kein HA-Cluster damit man dann die Hälfte der Dienste auslagern muss.

Dazu kommt aus meiner Sicht, dass ich einen LDAP-Server eher auf einem HA-Cluster erwarten würde als z.B. eine PhotoStation. :)

Andererseits ist die Software völlig neu, da wird sich sicherlich noch einiges tun.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Mit beidem hast du natürlich völlig Recht.

Mal sehen, wie das morgen aussieht wenn das Cluster synchronisiert ist. Inzwischen müßte ich mal rausfinden, wie ich an der Fritz Portweiterleitungen auf die 192.168.178.12 machen kann, sollte ja nicht so schwer sein.
 

Leberkasbepi

Benutzer
Mitglied seit
19. Feb 2012
Beiträge
315
Punkte für Reaktionen
0
Punkte
22
@ Galileo
Du hast nicht zufällig noch ein älteres Modell daheim stehen oder? Würde gerne wissen ob der High Availability Cluster auch mit den alten DS funktioniert.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Hier mal ein Status-Update:

Das Spiegeln war heute morgen fertig:
HA19.jpg


OpenVPN geht wieder:

Da ich dem Server als Benutzerbasis den LDAP-Server angegeben hatte, und der ja nicht mehr geht, konnte OpenVPN auch nicht mehr gehen. Nun habe ich OpenVPN umgestellt auf die lokalen DS-User und es geht.

Und zwar geht es sowohl mit Portweiterleitung an die DS1513 (192.168.178.16) als auch an die DS1513-HA (192.168.178.12), bei letzterer allerdings erst nachdem ich in der OpenVPN-conf im Client (Notebook) die Option "float" aktiviert hatte. Fragt mich nicht warum das so ist. Ich bekam eine entsprechende Fehlermeldung die als Abhilfe gleich diesen Tipp enthielt, und dann habe ich es ganz dumm gemacht und es ging. :D

Mit dem LDAP-Server bin ich noch nicht weiter.
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat