Netzwerkproblem in RBX-2 Rack 24A18
mc63515-ovh
24.12.13, 15:12

Zitat von
mathias
Hallo,
es sieht bei beiden aktuell wieder besser aus. Danke für die Geduld, es handelte sich womöglich um ein spezielleres Problem, welches mit http://status.ovh.net/?do=details&id=6019 in Verbindung stand. Aber das ist nur eine Vermutung meinerseits, es liegen mir noch keine weiteren Infos vor.
Mathias
Kann bestätigen, dass der Server mit allen seinen Diensten wieder erreichbar ist.
Das System ist übrigens tatsächlich seit dem letzten Boot gestern gegen 18:00 Uhr up, obwohl per Webinterface eigentlich ein Boot in den Rescuemode ausgelöst wurde.
Ebenfalls vielen Dank auch für das Weiterleiten der Kritik und schöne Weihnachtstage.
mc
Hallo,
danke für die Rückmeldung.
Welche Folgeerscheinungen bestimmte Eingriffe und Störungen haben, ist schwer einzuschätzen. Ich war mit einem Techniker persönlich in Kontakt, an welchen ich den Dank weiterleiten werde
Auch eine schöne stress-/ und störungsfreie Zeit wünsche ich,
Mathias
Ich kann bestätigen, dass ab dem Reboot um 11:00 Uhr der Zugang zum System wieder möglich ist.
Das Ticket 6019 kann es aber eigentlich nicht direkt sein, da es schon nachts abgeschlossen
wurde und morgens um 8 Uhr und 9 Uhr das Netzwerk Problem noch bestand, so das kein Rescue System
gestartet werden konnte.
Ich hoffe, das nun alles wieder stabil läuft. Vielen Dank und Frohe Weihnachten!
Hallo,
es sieht bei beiden aktuell wieder besser aus. Danke für die Geduld, es handelte sich womöglich um ein spezielleres Problem, welches mit
http://status.ovh.net/?do=details&id=6019 in Verbindung stand. Aber das ist nur eine Vermutung meinerseits, es liegen mir noch keine weiteren Infos vor.
Mathias
Gut, ich warte dann den Reboot bzw. das Ticket ab.
Hallo,
nur eine Zwischeninfo:
http://status.ovh.net/?do=details&id...08bd75b640a51d
@Bit: Reboot wurde initiiert, ich beobachte das und öffne dann wie gesagt ein Ticket.
@mc: eine sinnvolle konstruktive Kritik, leite ich gerne genau so weiter!
Mathias
Netboot ist umgestellt. 2 Rebootversuche mit viel Wartezeit gaben keine Email. Weder Email für Reboot noch Email mit den Zugangsdaten zum Rescuesystem.
Pingverhalten des Servers ist gleich, kleine Pings gehen, größere gehen nicht durchs Netz,
Könnt Ihr als Support einen Reboot versuchen oder den Reboot genauer überwachen?
mc63515-ovh
23.12.13, 19:00

Zitat von
mathias
mc63515-ovh, vielen Dank. Die Vorgaben dürfen wir nicht außer acht lassen, der komplette Support für Isgenug Server findet im Forum statt.
Ich habe das Ticket geöffnet, bitte noch darauf antworten und dem Eingriff zustimmen.
Mathias
Hallo Mathias,
das war nicht persönlich gemeint, aber es ist schon ein wenig merkwürdig, wenn man auf eine automatisch generierte Störungsmail vom OVH-Support antwortet, und dann mitgeteilt bekommt, dass man sich erstmal noch hier im Forum registieren muss, damit ein Problem welches offenkundig auf OVH-Seite liegt (was ja spätestens klar ist, seit sich herausgestellt hat, dass der Netboot in den Rescuemode nicht funktioniert) überhaupt bearbeitet wird.
Da stimmt die Benutzerführung nicht und auf einem Smartphone kommt richtig Spaß auf, wenn man sich per Web irgendwo registrieren und einloggen muss...
Netboot ist umgestellt. Hard Reboot habe ich vor etwa 30 Minuten gestartet und warte nun auf die Email.
Ich melde mich wieder, wenn ich den Test durchführen konnte.
mc63515-ovh, vielen Dank. Die Vorgaben dürfen wir nicht außer acht lassen, der komplette Support für Isgenug Server findet im Forum statt.
Ich habe das Ticket geöffnet, bitte noch darauf antworten und dem Eingriff zustimmen.
Mathias
mc63515-ovh
23.12.13, 18:34
Nachdem der Kundendienst mein Problem als solches anerkannt hat, sich jedoch nicht berechtigt sah eine Störungsmeldung zu eröffnen (guter Support sieht anders aus), schließe ich mich diesem Thread an.
Daten meines Server:
ks3096911.kimsufi.com
Datacenter: rbx2
Rack: 24A18
Nummer: 81055
Server scheint pingbar, aber von außen nicht ansprechbar (http, ssh). Selbst ein netboot über den ovh-manager in den Rescuemode kommt nicht an. Habe das schon zweimal durchgeführt aber laut Kundendienst läuft der Server weiterhin im normalen Modus.
http://status.ovh.net/?do=details&id=6016 scheint weiterhin nicht behoben. Bitte um schnelle Abhilfe.
Hallo,
versuch bitte einmal, den Server im Rescue Modus zu starten und führe dort den Speedtest durch (
http://hilfe.ovh.de/AdministrationRescueModus).
Mathias
Datacenter: rbx2
Rack: 24A18
Nummer: 81067
Ping ab einer gewissen Paketgröße geht schief. Alle TCP Verbindungen brechen sehr früh ab, vermutlich wenn das erste Netzwerkpaket ein paar Bytes zu groß wird. Getestet habe ich immer aus dem Internet heraus, also von außerhalb.
Zum Nachtesten bitte entweder Ping benutzen (Log siehe unten) oder gern auch eine Verbindung mit SSH oder Http probieren. Den Hostnamen kennt ihr ja.
Ping mit Defaultgröße 32 Bytes klappt ganz normal, aber mit größeren Paketen nicht:
ping -l 200 xxx
Ping wird ausgeführt für xxx [xx.xx.xx.xx] mit 200 Bytes Daten:
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Ping-Statistik für xx.xx.xx.xx:
Pakete: Gesendet = 4, Empfangen = 0, Verloren = 4 (100% Verlust),
Dieselben Pingpakete werden vom Proof-Server problemlos beantwortet:
ping -l 200 proof.ovh.net
Ping wird ausgeführt für proof.ovh.net [188.165.12.106] mit 200 Bytes Daten:
Antwort von 188.165.12.106: Bytes=200 Zeit=24ms TTL=51
Antwort von 188.165.12.106: Bytes=200 Zeit=22ms TTL=51
Antwort von 188.165.12.106: Bytes=200 Zeit=29ms TTL=51
Antwort von 188.165.12.106: Bytes=200 Zeit=23ms TTL=51
Ping-Statistik für 188.165.12.106:
Pakete: Gesendet = 4, Empfangen = 4, Verloren = 0 (0% Verlust),
Ca. Zeitangaben in Millisek.:
Minimum = 22ms, Maximum = 29ms, Mittelwert = 24ms
Und hier ist noch ein SSH Log:
2013-12-23 17:01:12 Looking up host "xx.xx.xx.xx" (IPv4)
2013-12-23 17:01:12 Connecting to xx.xx.xx.xx port 22
2013-12-23 17:01:12 Server version: SSH-2.0-OpenSSH_5.3
2013-12-23 17:01:12 Using SSH protocol version 2
2013-12-23 17:01:12 We claim version: SSH-2.0-PuTTY_Release_0.63
2013-12-23 17:01:34 Network error: Software caused connection abort
Kann ich sonst noch etwas tun um das Problem besser zu belegen?
Hallo Bit,
bitte schicken Sie uns verschiedene Logfiles, die eine Netzwerkstörung belegen. Erst dann können wir ein Störungsticket erstellen. Darüber hinaus brauchen wir auch noch die Servernummer oder den Hostnamen.
Sebastian

Zitat von
Bit
Scheinbar hat sich auch jemand mit besserem Supportvertrag beschwert. Denn immerhin gibt es jetzt ein Ticket http://status.ovh.net/?do=details&id=6016 von dem ich hoffe, dass es dann auch mein Problem lösen wird. Leider liege ich nicht direkt mit in dem angegebenen IP-Bereich...
In dem Eintrag ist die Rede von "HG-Switch", so viel ich weiß hängen die HG Server an eigenen Switches.
Der Serverausfall besteht jetzt bald den ganzen Tag, ohne eine Antwort (abgesehen von den automatischen "Ende des Fehlers"-Emails). Ein richtiges Ticket habe ich noch nicht bekommen.
Scheinbar hat sich auch jemand mit besserem Supportvertrag beschwert. Denn immerhin gibt es jetzt ein Ticket
http://status.ovh.net/?do=details&id=6016 von dem ich hoffe, dass es dann auch mein Problem lösen wird. Leider liege ich nicht direkt mit in dem angegebenen IP-Bereich...
Hallo Support,
schaut sich das denn noch jemand an? In der letzten Stunde hat sich nichts mehr verändert. Ping funktioniert solange es wenige Bytes sind, TCP nicht. Portscan ergibt, dass die richtigen Ports offen sind, aber die TCP Verbindungen bleiben immer gleich hängen.
Probiert doch mal größere Pings z.B. mit 200 Bytes aus, denn das klappt schon nicht mehr. Mit den paar Bytes die vom Server kommen, lässt sich aktuell nicht mal SSH durchführen. Das Netzwerkproblem ist also noch nicht behoben, auch wenn das Rack im Status wieder grün angezeigt wird.
Vor einer Minute hat sich etwas getan. Die Paketverluste für Ping scheinen jetzt weg zu sein, aber es sind keine TCP Verbindungen mehr möglich. Ich beobachte das weiter.
Nein, es ist nicht dasselbe Problem. In RBX-2 gehen einige Pings durch, der Server und selbst SSH antwortet. Nur macht das bei so hohen Paketverlusten keinen Spass. Seit Beginn der Störung kann man auf
http://status.ovh.net/vms/index_rbx2.html verfolgen, dass in dem genannten Rack jede Minute zwischen 2-10 Servern nicht erreichbar sind. Ich glaube also kaum, dass es ein spezifisches Problem auf einem Server ist.
Dies scheint das identische Probleme wie bei mir zu sein, nur das ich in einem anderem Rechnenzentrum (RBX5) bin.
Das Monitoring Tool hat mich um 9:34 Uhr über einen Fehler informiert. Aber eine Minute später kam die Mail, dass der Fehler beendet ist. Das stimmt aber so nicht.
Aktuell gibt es noch immer eine sehr hohe Paketverlustrate um die 61% und im
http://status.ovh.net/vms/index_rbx2.html sind ständig einige Rechner dieses Racks offline. Bitte überprüft das Rack nochmal.