OVH Community, your new community space.

RPS Update... Es geht los


oles@ovh.net
23.02.10, 10:14
Guten Tag,

vor etwa 3 Wochen haben wir von Sun einen Patch für ZFS erhalten. Dieser Patch behebt ein grosses Problem bei Verwaltung unserer Storageinfrastruktur für die RPS, vor allem auf der Ebene der für die Wiederherstellung des Dienstes nach einem Reboot eines Filers benötigten Zeitspanne. Bis jetzt musste man nach einem Crash, einem Ausfall oder einer Wartung des Filers etwa 2 Stunden einplanen, in denen der Dienst nicht verfügbar war. Diese Beeinträchtigung hat uns bei unseren Entwicklungen in einigen Punkten wie der Suche nach mehr Performance für die Storageinfrastruktur blockiert. Wir haben es deshalb erst einmal vorgezogen, das bestehende System besser abzusichern, um Ausfälle zu verhindern, als die Entwicklung hin zu mehr Leistung und Flexibilität weiter zu verfolgen. Aus den gleichen Gründen wurde auch die weitere Entwicklung des NFS Storage für die RPS Server auf Eis gelegt. Dies ist die Ursache dafür, dass das Storage beim RPS als langsam (1 MB/sek) angesehen wird.

Mit dem neuen Patch starten wir nun einen neuen Anlauf.

Wir haben seit 3 Wochen an der Neueinrichtung der Backupinfrastruktur aller RPS Filer gearbeitet. Auf dieser Ebene wirkte sich das Problem noch 100 Mal schlimmer aus: im Falle des Reboots eines Backupfilers musste man etwa eine Woche lang warten, um wieder Zugang zu haben und erneut mit den Backups beginnen zu können. Mit dem neuen Patch ist das nun alles wieder zum aushalten. Die Arbeiten an der Backupinfrastruktur der RPS sind fast abgeschlossen. Heute Nacht haben wir mit den Arbeiten an den iSCSI Filern angefangen, dies wird noch einige Tage dauern. Danach werden wir dann wieder einige kleine Betatests verschiedener Ideen, die wir auf Lager haben und bei der "Cloud" teilweise schon erfolgreich und mit gutem Feedback (wenn man Ihre Anmerkungen dazu liest) verwenden, durchführen.

Diese ganzen Updates und Weiterentwicklungen sollten wir dann mit dem Start der ersten geolokalisierbaren RPS (zuerst in Paris, dort laufen bereits Betatests - vor allem dann aber in Madrid und Frankfurt) abschliessen können.

Wir haben dabei 3 Ziele:

- Eine Hardwareplattform für Onlinespiele mit möglichst geringen Latenzzeiten (Ping) anbieten
- Überall in unserem Netzwerk geolokalisierbare Infrastrukturen aufbauen, ausserdem aber auch in Japan, den USA, Russland und Brasilien, mit dem Ziel, die Verteilung der Inhalte (Webcache, Streaming, oder einfach die Verbreitung von Content) näher an die Besucher unserer Kunden zu bringen
- Am Konzept eines "100% online" Servers arbeiten, also eines Servers, der niemals ausfällt. Wenn ein Problem egal welcher Art auftritt, ob Störung oder Wartungsarbeiten, erfolgt die Umstellung inklusive Storage auf einen anderen Standort automatisch im laufenden Betrieb, und der Dienst wird dabei nicht unterbrochen.

Dies ist die Richtung, die wir zukünftig mit unserer "RPS" Technologie einschlagen wollen. Man kann also davon ausgehen, dass die RPS in der derzeitigen Form in 2 bis 3 Monaten nicht mehr bestellbar sein werden. Stattdessen werden Sie dann eine einfach zu verwendende schlüsselfertige Lösung mit 1 Klick und für bestimmte Bedürfnisse bei definierter Performance bestellen können. Die bereits an die Kunden ausgelieferten RPS bleiben dann aber selbstverständlich weiter in Betrieb. Wir werden diesen Dienst weiterhin sicherstellen und auch weiter verbessern, solange die laufenden RPS weiter verlängert werden.

Mit freundlichen Grüssen

Octave