Vorwort

In den letzten Monaten erreichten uns immer wieder Kundenanfragen zum Thema verschiedene Rechenzentrumsstandorte. Nicht zuletzt durch den Rechenzentrumsbrand bei OVH sehen wir daher einen großen Bedarf, Serversysteme / Clusterumgebungen auf mehrere Standorte zu verteilen, die technisch voneinander unabhängig sind.

Im Zuge einer Kundenanfrage haben wir daher versucht das Thema Ceph Cluster über mehrere Standorte zu beleuchten, konnten aber nur wenige Informationen dazu finden. Bevor wir daher unseren Kunden eine Umgebung anbieten, ein weiteres Rechenzentrum erschließen, Routingerweiterungen durchführen und co. erschien uns der logischste Schritt, zunächst eine Testumgebung zu schaffen, die weitestgehend mit einen Ceph Aufbau über mehrere Standorte identisch ist, um verschiedene Failover Szenarien zu simulieren.

 

Technischer Aufbau

Der Clusteraufbau besteht insgesamt aus 9x Dedizierten Servern mit folgender technischer Ausstattung:

Intel Xeon Silver 4210R
2x 32 GB DDR4 ECC Reg
2x 1 TB NVMe SSD – Ceph NVMe Pool
2x 960 GB SAS SSD – Ceph SSD Pool
2x 480 GB SSD – Betriebssystem SSDs
Adaptec 8405E – Betriebssystem RAID Controller
2 HE Gehäuse mit redundanten Netzteilen
2x 1 Gigabit/s Management Netzwerkanbindung
2x 10 Gigabit/s SFP+ Netzwerkanbindung

Mit diesen Servern sollen 3x unabhängige Ceph Pools abgebildet werden. Pro Serverstandort quasi ein Ceph Pool bestehend aus NVMe- und SAS SSDs. Wir wollen dabei simulieren, wie sich das Ceph Cluster verhält, wenn ein/zwei Standorte Netzwerkseitig ausfallen und welche Kapazitäten bei einer Neusynchronisation des Clusters auf Netzwerkseite benötigt werden. Dabei werden kurze Netzwerkausfälle/Netzwerkinstabilitäten und längere Netzwerkausfälle sowie zahlreiche weitere Testfälle definieren- und simulieren.

Die Server selbst befinden sich am Standort FRA1 in verschiedenen Gebäuden. Dabei befinden sich 3x Server in Gebäude 1 und 6x Server im Gebäude 2.

 

 

 

 

Zusätzlich haben wir einen weiteren Server für eine Desaster Recovery Simulation mit Hilfe von Proxmox Backup installiert:

Intel Xeon Silver 4210
2x 32 GB DDR4 ECC Reg
4x 4 TB HDD
Adaptec 8405E
2 HE Gehäuse mit redundanten Netzteilen
2x 1 Gigabit/s Management Netzwerkanbindung
2x 10 Gigabit/s SFP+ Netzwerkanbindung

 

Weiternutzung der Testumgebung

Sobald der Testlauf im Zuge unseres Kundenprojektes abgeschlossen ist, wird der Aufbau natürlich nicht ausgemustert. Dieser wird für folgende Anwendungsfälle weiterhin zur Verfügung stehen:

 

  • Validierung der Clusterfähigkeit von Kundenanwendungen vor Buchung eines Clusters
  • Entwicklungsumgebung für unsere eigenen vServer Produkte
  • Testaufbau für neue Ceph Versionen / Testlauf von Versionsupdates (Synchron / Asynchron) vor rollout in Kundenumgebungen
  • Schulungsplattform für unsere Mitarbeiter
  • Präsentationsumgebung für neue Kundenanfragen

 

Gerne stellen wir die Testumgebung auch Kunden und Partnern zur Verfügung um Problem Analysen oder spezielle Testszenarien abzubilden. Man kann sich dafür direkt mit unseren Kundensupport in Verbindung setzen.