OVH Community, your new community space.

Der "Leclerc" Cluster


oles@ovh.net
19.06.09, 00:04
Guten Tag,

wir arbeiten derzeit an einem neuen Clustertyp unter dem Codenamen "Leclerc" (wie der französische Panzer, siehe zum Beispiel hier: http://de.wikipedia.org/wiki/Leclerc_(Panzer))

Um was handelt es sich dabei?

Stellen Sie sich eine Festplatte vor. Diese ist per SAS/SCSI mit 2 verschiedenen Servern verbunden. Diese beiden Server greifen auf exakt die gleichen Daten zu. Ein Wenig wie bei NFS, aber mit direktem Blockzugriff über ein Filesystem. Man benötigt dazu natürlich ein etwas spezielles Filesystem, das die "locks" zwischen 2 Servern verwalten kann. Man kann in diesem Zusammenhang zum Beispiel gfs2 oder lustre erwähnen:
http://en.wikipedia.org/wiki/Global_File_System

Stellen Sie sich jetzt ein Festplattenrack mit 1 PB oder 4 PB Daten vor, das auf die gleiche Art mit 2 HG Servern verbunden ist. Die beiden Server arbeiten parallel mit den gleichen Daten. Die 2 HGs bearbeiten exakt das gleiche Datenvolumen. Wenn einer die Daten ändert, dann sieht das der andere sofort. Man hängt ein System zur Lastverteilung davor, und schon hat man einen unverwüstlichen "Leclerc" Cluster. Egal ob eine der Festplatten kaputt geht, einer der Server defekt ist, eines der Racks mit den Daten ausfällt: alles funktioniert Dank jeder Menge Redundanzen weiter.

Warum so viel Redundanz?
Ab mehreren Dutzend TB an Daten stellt sich irgendwann die Frage nach sehr sehr hoher Stabilität. Was bedeutet, dass alles redundant ausgelegt sein muss. Das System muss mit einer Vielzahl an Ausfällen klarkommen und trotzdem weiter funktionieren (im "degraded" Modus zwar, jedoch ohne Totalausfall). Man benötigt also Systeme, die in Echtzeit an den gleichen Daten arbeiten UND keinen "Single Point of Failure" aufweisen.

Wir hoffen, dass wir Ihnen in Kürze etwas anbieten können, das diesen Anforderungen entspricht. Ganz sicher unter Linux, vielleicht auch unter Windows, aber erstmal noch nicht unter Solaris (SUN hat lustre aufgekauft, wahrscheinlich um die Fähigkeiten von lustre in ZFS zu implementieren - wir warten ungeduldig auf das Ergebnis). Wenn alles gut läuft, dann werden wir Ihnen später dann auch das Gleiche mit 64 parallelen Servern anbieten können...

Mit freundlichen Grüssen

Octave