Berncom It-Service

auf der grünen Insel Föhr

 

DRBD - Distributed Replicated Block Device

DRBD Distributed Replicated Block Device

DRBD ist ein Linux Kernelmodul, welches eine zusätzliche Schicht zwischen einem Blockgerät (Festplatte) und dem Dateisystem implementiert. Für das Dateisystem spielt es keine Rolle, ob das Gerät auf dem es sich befindet, eine Festplatte oder ein DRBD ist. Für alle Anwendungen ist das DRBD transparent(nicht sichtbar). Bei jedem Zugriff auf das DBRD werden die geschriebenen Blöcke via TCP/IP auf einen zweiten Server repliziert. Zusätzlich werden Metadaten aller Blöcke des DRBD gespeichert, die den Zustand gegenüber dem zweiten Server enthalten(gleich/ungleich). Nach Rückmeldung des zweiten Servers, dass der geänderte Block ebenfalls geschrieben wurde, wird in den Metadaten dieses Ergebnis gespeichert und das Gerät ist wieder konsistent. Bei einem Ausfall des zweiten Servers sind alle geänderten Blöcke in den Metadaten als nicht repliziert markiert. Sobald der zweite Server wieder zur Verfügung steht, werden nur die Blöcke an den zweiten Server übertragen, die auf den beiden Servern unterschiedlich sind. Das geschieht durch den Vergleich der Metadaten.

Hochverfügbarkeit (HA - High Availability)

Hochverfügbarkeit bezeichnet die Fähigkeit eines Systems, bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten.

  • 99% ≡ 3,7 Tage/Jahr (AEC-0)

  • 99,9% ≡ 8,76 Stunden/Jahr (AEC-1)

  • 99,99% ≡ 52,6 Minuten/Jahr (AEC-2)

  • 99,999% ≡ 5,26 Minuten/Jahr (AEC-3)

  • 99,9999% ≡ 32 Sekunden/Jahr (AEC-4)

  • 99,99999% ≡ 3 Sekunden/Jahr (AEC-5)

Die Harvard Research Group (HRG) teilt Hochverfügbarkeit in ihrer Availability Environment Classification (kurz: AEC 0-5) in 6 Klassen ein

HRG-Klasse

Bezeichnung

Erklärung

AEC-0

Conventional

Funktion kann unterbrochen werden, Datenintegrität ist nicht essentiell.

AEC-1

Highly Reliable

Funktion kann unterbrochen werden, Datenintegrität muss jedoch gewährleistet sein.

AEC-2

High Availability

Funktion darf nur innerhalb festgelegter Zeiten oder zur Hauptbetriebszeit minimal unterbrochen werden.

AEC-3

Fault Resilient

Funktion muss innerhalb festgelegter Zeiten oder während der Hauptbetriebszeit ununterbrochen aufrechterhalten werden.

AEC-4

Fault Tolerant

Funktion muss ununterbrochen aufrechterhalten werden, 24*7 Betrieb (24 Stunden, 7 Tage die Woche) muss gewährleistet sein.

AEC-5

Disaster Tolerant

Funktion muss unter allen Umständen verfügbar sein.



Cluster = logischer Verbund von physikalischen Einheiten

Arbeitsweise DRBD HA

  • Kopplung von zwei oder mehr Systemen

  • sofortiges Replizieren auf Blockebene bei jedem Schreibvorgang





Beim Ausfall der Hartbeat-Kommunikation wird angenommen, dass das primäre System nicht mehr zur Verfügung steht und die konfigurierten Dienste werden dann auf dem sekundären System gestartet. Das sekundäre System übernimmt die Arbeit und wird zum primären System.

Ab Version 8 von DRBD ist ein Multi-Primary Betrieb möglich

Replikation

Replikation ist die mehrfache Speicherung von Daten an typischerweise unterschiedlichen Standorten(Kopie) und deren Abgleich bei Änderung. Die Daten der Replikate stellen nur eine Momentaufnahme der primären Daten zu einem bestimmten Zeitpunkt dar.

Rainer Schnoege
Berliner Ring 43
25938 Wyk
Mail:
Telefon: 0172 4218161