OVH Community, your new community space.

OCO: OvhCheckOut


oles@ovh.net
10.03.08, 12:00
Hallo,

um die RPS Server zu überwachen um zu wissen ob diese korrekt funktionieren, ob eine Partition read-only ist oder sich einfach zu versichern dass alles in Ordnung ist werden wir OCO verwenden.

Was ist OCO? OvhCheckOut wurde ursprünglich für das Shared Hosting bei OVH entwickelt. Damit kann man sich den Zustand des Servers binär anzeigen lassen: "OK" oder "KO". Im Laufe der Zeit haben wir dann noch den Zustand "OK, aber" hinzugefügt. OCO ist sehr schnell und benötigt weder Zeit noch CPU-Ressourcen um ausgeführt zu werden. Es ist ein einfaches "cat" der Dateien.

OCO wurde für die Angebote beim Hosting mit hoher Verfügbarkeit verwendet und funktioniert mit jeder Art von Monitoring wie Mon, Slb... Fürs Monitoring genügt es, den Zustand auf dem Port 79 abzufragen.

# telnet 79
Trying ...
Connected to .
Escape character is '^]'.
200 OK oco-1.14h
Connection closed by foreign host.

# telnet 79
Trying ...
Connected to .
Escape character is '^]'.
350 KO oco-1.14h 300-http,300-php,300-php5
Connection closed by foreign host.

OCO zu verwenden ist extrem einfach und sicher. Das Skript überprüft das was ihm aufgetragen wurde (das kann sein ob der Webserver funktioniert, das kann ein PHP Skript zur Überprüfung der Datenbanken sein, eine Überprüfung dass die Festplatte nicht kaputt ist, es kann im Prinzip sein was Ihr wollt) und updated den Zustand nach dem Test. Auf dem Port 79 kann man den allgemeinen Zustand des Servers sehen und ob er korrekt funktioniert. Wenn überall 200 steht ist er "OK", wenn mindestens ein 2XX da steht ist er "OK, aber", und wenn wenigstens ein 3XX da steht ist er "KO".

Ihr könnt die Überprüfungsskripte auch personalisieren: Ihr startet eure Überprüfungen und wenn das Resultat in Ordnung ist erstellt Ihr eine Datei mit 200 darin. Ansonsten wir eine Datei mit 300 erzeugt. Wenn die Datei in den letzten 5 Minuten nicht geupdated wurde ist es eine 300 auch wenn in der Datei 200 steht.

Zuerst wird OCO standardmässig auf allen Distributionen für die RPS eingerichtet, anschliessend dann für alle dedizierten Server genau so wie RTM. Das OCO Monitoring mit Meldungen per E-Mail und/oder SMS wird dann im Manager genauso angeboten wie das Monitoring der Ports (80, 22, 23, 25, 53, 3306, 110...), die Performance einer URL und das ICMP Monitoring der IP Adressen. Einige Dinge sind bereits fertig entwickelt aber noch nicht im Manager, andere werden noch kommen.

Das OCO System wird es erlauben Vorfälle innerhalb von OVH automatisch zu erstellen und laufende Vorfälle zu vervollständigen. Wenn Sie einen 5XX Fehler haben wird automatisch ein Vorfall erstellt und ein Technikerteam wird sich darum kümmern. Sie können Ihre Vorfälle und deren Behebung genauer und personalisierbar verfolgen. Es wird auch ein SLA zum Zeitrahmen in dem ein Vorfall bearbeitet wird angeboten werden.

Was RTM betrifft so erlaubt dieses quantitative Informationen über den Server, die Last der Maschine, die Auslastung der Festplatte, die CPU und RAM-Verwendung zu erhalten. In Kürze werdet Ihr Graphen mit diesen Informationen im Manager haben.

Mit freundlichen Grüssen

Octave