High Availability Cluster: Fragen, Anregungen, Know-How und Erfahrungsaustausch

Status
Für weitere Antworten geschlossen.

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Im Prinzip haben sich meine Eingangsfragen nun ja wie folgt beantwortet:

- Inwieweit kann ich die Performance des Standby-Servers lesend nutzen?
Kann man nicht, es sei denn man würde das Cluster lösen.


- Müssen beide Server zwingend genau identisch installiert sein?
Der passive Server wird beim Aufbau des Clusters sowieso komplett überschrieben, also ja: Sie sind da zwangsläufig identisch.


- Kann ich mit LACP ans Netz?
Bei DSM 5.0: Ja! LACP geht sowohl zum Netz als auch für den Heartbeat. Obwohl es im Tutorial noch anders steht:
Synology High Availability unterstützt Folgendes nicht: PPPoE, Link Aggregation, Wi-Fi und VLAN. Bitte stellen Sie sicher, dass alle oben genannten Dienste ausgeschaltet sind, bevor der High-availability Cluster erstellt wird.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Nochmal Update:

LDAP geht auch wieder: Einmal im Paketzentrum anhalten und neu starten, so einfach kann es sein. :eek:

Damit würde ich sagen: Bisher geht nun alles!
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Nächster Schritt:

Ich habe mal umgeschaltet, nun läuft die andere Station:
HA20.jpg


Aber: Ich muss den LDAP-Server wieder neu starten, weitere Tests haben ergeben, dass das nach jedem Wechsel so ist, das ist also jedenfalls ein Bug.

OpenVPN auf DS1513-HA geht weiterhin, ferner geht es nun auch direkt auf die DS1513-B und erwartungsgemäß nicht auf die DS1513.
 

Leberkasbepi

Benutzer
Mitglied seit
19. Feb 2012
Beiträge
315
Punkte für Reaktionen
0
Punkte
22
Kurz ne andere Frage. Was hältst du eigentlich von der 5.0 final Version? Noch warten oder kann man schon das Upgrade machen? Schließlich haben scheinbar viele Probleme damit, zumindest was man hier so liest.
Habe zwar auf meinem Server keine wichtigen Dienste laufen aber wenn's noch so viele Probleme gibt....
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Ich bin jetzt umgestiegen weil DSM5 beim HA-Cluster Link Aggregation unterstützt. Ansonsten hätte ich mir noch etwas Zeit gelassen. Da ich aber nicht so wahnsinnig viele Dienste und Funktionen nutze kann ich sonst wenig dazu sagen.
 

michaeljk

Benutzer
Mitglied seit
07. Mrz 2012
Beiträge
59
Punkte für Reaktionen
0
Punkte
6
Ich habe nur das was in meiner Signatur steht, die 414 kann kein HA.

Schade das HA mit der 414 nicht funktioniert, sonst hätte ich dir glatt deine bisherige 414 abgekauft :) Interessant dürfte zudem sein, dass zum Erstellen eines HA kein SHR Volume genutzt werden darf und die Festplatten beim Aktiven/Passiven DS-System auch an der jeweils selben Stelle (Ports) eingesteckt sein müssen.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Die 414 werde ich wohl für Medien behalten, nicht alles muss auf einem gespiegelten Server untergebracht sein. :D Außerdem bin ich sehr experimentierfreudig, ich brauche immer auch ein freies Testsystem auf dem ich mit Diensten "spielen" kann bevor ich irgendwas "produktiv" mache. Den Hauptserver will ich hingegen so weit wie möglich dann in Ruhe lassen, also nicht ständig irgendwas installieren usw.


@topic

Nachdem der erste Test erfolgreich war habe ich mir eine endgültige Speicherkonfiguration überlegt:

Meine wichtigen Hauptdaten auf Volume 1 bleiben trotz Server-Spiegelung auf RAID1, allerdings nicht mehr 3fach sondern 2fach. 4 TB reichen mir da mittelfrsitig jedenfalls aus. Dank RAID1 habe ich die Option hier weiterhin meine Backup-Methode mit rotierenden Platten zu praktizieren solange ich nichts besseres finde. Sollte ich mich davon einmal trennen können und mich auch sonst sicher fühlen, dann kann ich Volume 1 auch mal auf 3 Platten mit RAID5 ändern.

Dann habe ich ein zweites Volume angelegt, das hat zwei Zwecke: Time-Backup sowie schneller temporärer Speicher, dafür habe ich kein Problem mit RAID0. Dank gespiegeltem Server ist es ja de facto ein RAID10, hat also insoweit auch Datensicherheit.

Somit haben wir:

DS1513
Disk 1 und 2: ST4000VN000 auf RAID1. Volume 1: 3,7 TB
Disk 4 und 5: ST4000VN000 auf RAID0. Volume 2: 7,4 TB

DS1513-B
Disk 1 und 2: WD40EFRX auf RAID1. Volume 1: 3,7 TB
Disk 4 und 5: WD40EFRX auf RAID0. Volume 2: 7,4 TB
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Nun habe ich folgende neuen Erkenntnisse gewonnen:

Erstens: Spiegelungsdauer beim Neubilden / Neubinden des Clusters.

Wann immer man das Cluster neu bildet oder auch nur trennt und neu bindet findet eine komplette Spiegelung statt. Die Dauer dieser Spiegelung hängt offensichtlich an der Summe der Volume-Kapazitäten: Summiert man die Volume-Kapazitäten und dividiert sie durch die Geschwindigkeit auf dem Heartbeat, dann erhält man etwa die Dauer für den Cluster-Aufbau.

Beispiel: Beim 1. Versuch hatte ich 3*4TB in RAID1, macht Volumekapazität 4 TB. 4000.000 MB / 110 MByte/s = 10 Stunden. Das kam etwa hin.

Beim 2. versuch habe ich nun 2*4TB in RAID1 + 2*4TB in RAID0 macht zusammen Volumekapazität 12 TB. Dem entsprechend langsam läuft nun auch die Spiegelung, ich rechne dem Fortschritt entsprechend mit 30 Stunden.

Mit der tatsächlichen Speicherbelegung hat es NICHTS zu tun! Gespiegelt wird also wohl ganz einfach auf Blockebene.
 
Zuletzt bearbeitet:

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Zweitens habe ich beim zweiten Aufbau des Clusters den Heartbeat geändert.

Nachdem der Heartbeat beim ersten Mal über 2*Giga-LAN LACP ja nur bei knapp 120 MB/s lag habe ich es nun mit einer Einzel-LAN versucht, und siehe da die Geschwinddigkeit ist gleich:

Das LACP dient hier also rein der Ausfallsicherheit, und die brauche ich nicht, meine Leitung ist gut.

Ich halte mir somit die LAN3 nun frei. Evtl. baue ich ein zweites Subnetz um zwischen zwei Stations (PC, DS), einen zweiten Kopiervorgang mit voller Geschwindigkeit betreiben zu können wenn das Port am Hauptnetz voll belastet ist.

Vergleich:
Heartbeat über LAN3 und LAN4 als LACP
HA16.png

Heartbeat nur über LAN4
HA22.png
 

Leberkasbepi

Benutzer
Mitglied seit
19. Feb 2012
Beiträge
315
Punkte für Reaktionen
0
Punkte
22
Hey, eine Hot Spare Festplatte hast du bei deinen HA-Clustern nicht zufällig eingerichtet oder? Ich würde gerne wissen wie stark sich dann das RAID Verbund bei der Reperatur in Sachen Perfomance verschlechtert. :)
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Hey, eine Hot Spare Festplatte hast du bei deinen HA-Clustern nicht zufällig eingerichtet oder?
Nein, macht bei mir keinen Sinn.

Ich würde gerne wissen wie stark sich dann das RAID Verbund bei der Reperatur in Sachen Perfomance verschlechtert. :)
Wenn ich aus meinem RAID1 zwecks extermem Backup eine Platte klaue und durch eine leere ersetze dann geht während der Reparatur die Performance des Volumes etwa um die Hälfte runter.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Ich will mal eine vorläufige Bilanz ziehen, Soll zu Ist:

Warum also HA-Cluster?

Was mich daran primär reizt ist das permanente Echtzeit-Backup der Daten auf eine zweite Station.

Diese zweite Station kann im Gebäude anderswo stehen, an einer anderen USV hängen usw. Wenn also eine Station absaufen, abrauchen, abbrennen, abkotzen, abschmieren, abfackeln, abtauchen oder was auch immer sollte, egal warum, dann sind die kompletten Daten hochaktuell auf einer zweiten Station noch vorhanden.
Ok, das ist gegeben. Vor allem ist gut dass das auf Blockebene passiert. Bei kleinen Änderungen in meinem TC-Container wird also nicht jedes Mal der gesamte Container zum anderen Server kopiert.

Zum Thema externes Backup:
Zwecks Backup wird das HA-Cluster getrennt, zu dem Zeitpunkt darf von extern kein Datenzugriff erfolgen, die Daten müssen konsistent sein. Nach der Trennung darf dann aber auf den aktiven Server sofort wieder zugegriffen und auch geschrieben werden, währenddessen wird das Backup vom passiven, abgetrennten Server erstellt.

Ist das Backup fertig, dann wird das HA-Cluster wieder gebunden, d.h. das System bringt dann den passiven Server wieder auf den neusten Stand.

Somit ist mein Hauptserver während des Backups voll aktiv und Daten dürfen geschrieben werden, ohne dass ich befürchten muss ein inkonsistentes Backup anzufertigen.
Das kann man zwar machen, ist aber so nicht praktikabel, einfach weil das erneute Synchronisieren zu lange dauert, momentan bin ich bei 30 h, da wird mir die gesamte Prozedur zu umständlich.


Obwohl dieser Punkt also nicht den Erwartungen entspreicht werde ich wohl erstmal das HA-Cluster weiterhin testen.

Wie mache ich also meine Backups, ohne den Datenzugriff (lange) zu unterbrechen:

Zwecks Versionsverwaltung werde ich zyklisches Time-Bachup lokal auf das RAID0-Volume machen. Für externe NTFS-Backups kann ich dann auf definitiv konsistente Versionen des Time-Backups zugreifen, ohne den Zugriff auf die Original-Daten zu unterbrechen. Definitiv konsistente Versionen bekomme ich wenn ich während des Time-Backups keine Schreibzugriffe auf die Daten zulasse. Da die Time-Backups schnell gehen (sofern sich nicht viele Daten geändert haben) ist das kein Problem.

Im Übrigen bleibt der rotierende Tausch der RAID1-Platten aber wohl weiterhin die eleganteste Backup-Methode.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Update:

Habe soeben zum ersten Mal im Cluster DSM-Update gemacht, von 5.0 final auf Update 1. Das funktioniert im Cluster genauso wie ohne HA.

Nach dem Neustart hat HA dann aber erstmal Rot angezeigt, und Fehler gemeldet, "Volume kann nicht zum passiven Server kopiert werden" oder so ähnlich.

Die Aufregung war aber umsonst: Nach wenigen Minuten wurde ohne weitere Aktion wieder alles grün gezeigt.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
Thema USV für ein HA-Cluster:

Wenn ich in der Hilfe richtig lese ist eine gemeinsame USV für beide Systeme in der Software nicht vorgesehen. Konsequenterweise sollte man also wohl zwei kaufen.

Oder hat da jemand andere Infos?
 

Lenard

Benutzer
Mitglied seit
05. Apr 2014
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hallo,
habe Deine Angaben hier verfolgt.....super das Du es so hin bekommen hast, ich habe hier zu eine Frage, denke das ich die Antwort schon kenne, würde egerne eine DS 412+ (4 Festplatten) spiegeln mit einer DS 713+ (7 Festplatten), wo eine Erweiterung DX 513 mit dran ist....an Anfang Deine Doke hast Du kurz festgestellt das es nur bei gleider DS geht ist das richtig...oder kann ich dies mit meinen beiden Geräten auch spiegeln......für eine kurze Antwort wäre ich Dir dankbar... Grüße Lenard
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.905
Punkte für Reaktionen
1.179
Punkte
754
Ich greife Galileo einmal vor, weil er das m.E. ganz eindeutig bereits geschrieben hat. Es müssen identische DS sein, mit Deinem Setup geht es nicht.
 

Galileo

Benutzer
Mitglied seit
22. Jan 2014
Beiträge
329
Punkte für Reaktionen
0
Punkte
16
So ist es, die Hardware muss identisch sein, incl. gleich großer Platten (meine 4 TB Seagates und WDs sind ganz genau gleich groß), und auch die Konfiguration wird komplett auf den Slave übertragen.

Das Cluster funktioniert seither ganz unauffällig, genau wie eine Einzel-DS.
 

Lenard

Benutzer
Mitglied seit
05. Apr 2014
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hallo...danke an euch beiden für die schnelle Antwort....habe mir das auch schon gedacht...wollte mich nur noch mal eine Bestätigung holen....mist falsch gekauft....mal sehen wie ich es sonst noch hin bekomme....
 

Reiner_1957

Benutzer
Mitglied seit
17. Feb 2013
Beiträge
8
Punkte für Reaktionen
0
Punkte
0
Hallo zusammen, bisher war ich über Monate Lesender hier im Forum. Dann habe ich mir meine erste DS gekauft, jetzt sind es derer zwei und ich versuche nun auch ein Zwillingspärchen daraus zu machen und hoffe, dass es funktioniert. Im Einzelbetrieb habe ich auch die zweite DS erst einmal etliche Tage laufen lassen um zu sehen, ob sie genau so stabil läuft wie die Erste. Lange habe ich gesucht ob es ausführliche Beschreibungen zum Thema gibt. Nun kommt mir dieser Beitrag gerade zum rechten Zeitpunkt.
Jetzt erst einmal zu meiner Hardware. Es handelt sich um zwei DS 412+ mit je 4 x 2TB WD Red. Jede ist mit einer APC Pro 1500 gegen den eventuellen Stromausfall gesichert. Zumindest hoffe ich, dass es zum Zeitpunkt X auch funktioniert. Verbunden sind beide über einen Cisco 16 Port Smart-Switch.

Nummer_1.jpg

Die erste Verwunderung gab es für mich bereits. An jeder DS bekamen die Netzwerkanschlüsse beginnend bei 192.168.3.5 (Port 1), 192.168.3.6 (Port 2), nächste DS dann 192.168.3.7 und danach 192.168.3.8 damit konnte ich aber kein HA-Cluster erstellen. Dann habe ich hier noch einmal von Anfang an gelesen und die beiden Port 2 jeweils auf automatische Vergabe gestellt. Seit 21:40 läuft die Erstellung.

Nummer_2.jpg

Beim betrachten der vergebenen Adressen habe ich mich dann das doch gewundert. Die beiden DS haben sich ganz andere Adressbereiche gewählt. Aber es funktioniert, der erreichbare Port ist jetzt 192.168.3.9.

Nummer_3.jpg

Nummer_4.jpg

Jetzt bin ich gespannt, ob ich am Ende ein richtig sicheres Datengrab für meine Fotos bekomme. Mit der erste DS war ich schon sehr zufrieden. Jetzt, so hoffe ich, kann es dann nur noch besser werden.
 
Zuletzt bearbeitet:

Reiner_1957

Benutzer
Mitglied seit
17. Feb 2013
Beiträge
8
Punkte für Reaktionen
0
Punkte
0
Lange genug hat es ja gedauert. So, es ist geschafft, jetzt beginnt das Testen. Die Zwillinge sind, wie vorher die Single, aus dem Internet erreichbar und verhalten sich völlig normal.

Unbenannt-1.jpg
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat