OVH Community, your new community space.

Netzwerkproblem in RBX-2 Rack 24A18


mc63515-ovh
24.12.13, 15:12
Zitat Zitat von mathias
Hallo,

es sieht bei beiden aktuell wieder besser aus. Danke für die Geduld, es handelte sich womöglich um ein spezielleres Problem, welches mit http://status.ovh.net/?do=details&id=6019 in Verbindung stand. Aber das ist nur eine Vermutung meinerseits, es liegen mir noch keine weiteren Infos vor.

Mathias
Kann bestätigen, dass der Server mit allen seinen Diensten wieder erreichbar ist.
Das System ist übrigens tatsächlich seit dem letzten Boot gestern gegen 18:00 Uhr up, obwohl per Webinterface eigentlich ein Boot in den Rescuemode ausgelöst wurde.

Ebenfalls vielen Dank auch für das Weiterleiten der Kritik und schöne Weihnachtstage.

mc

mathias
24.12.13, 10:57
Hallo,

danke für die Rückmeldung.
Welche Folgeerscheinungen bestimmte Eingriffe und Störungen haben, ist schwer einzuschätzen. Ich war mit einem Techniker persönlich in Kontakt, an welchen ich den Dank weiterleiten werde
Auch eine schöne stress-/ und störungsfreie Zeit wünsche ich,

Mathias

Bit
24.12.13, 10:31
Ich kann bestätigen, dass ab dem Reboot um 11:00 Uhr der Zugang zum System wieder möglich ist.
Das Ticket 6019 kann es aber eigentlich nicht direkt sein, da es schon nachts abgeschlossen
wurde und morgens um 8 Uhr und 9 Uhr das Netzwerk Problem noch bestand, so das kein Rescue System
gestartet werden konnte.

Ich hoffe, das nun alles wieder stabil läuft. Vielen Dank und Frohe Weihnachten!

mathias
24.12.13, 09:59
Hallo,

es sieht bei beiden aktuell wieder besser aus. Danke für die Geduld, es handelte sich womöglich um ein spezielleres Problem, welches mit http://status.ovh.net/?do=details&id=6019 in Verbindung stand. Aber das ist nur eine Vermutung meinerseits, es liegen mir noch keine weiteren Infos vor.

Mathias

Bit
24.12.13, 07:26
Gut, ich warte dann den Reboot bzw. das Ticket ab.

mathias
24.12.13, 06:57
Hallo,

nur eine Zwischeninfo: http://status.ovh.net/?do=details&id...08bd75b640a51d
@Bit: Reboot wurde initiiert, ich beobachte das und öffne dann wie gesagt ein Ticket.

@mc: eine sinnvolle konstruktive Kritik, leite ich gerne genau so weiter!

Mathias

Bit
23.12.13, 20:03
Netboot ist umgestellt. 2 Rebootversuche mit viel Wartezeit gaben keine Email. Weder Email für Reboot noch Email mit den Zugangsdaten zum Rescuesystem.
Pingverhalten des Servers ist gleich, kleine Pings gehen, größere gehen nicht durchs Netz,
Könnt Ihr als Support einen Reboot versuchen oder den Reboot genauer überwachen?

mc63515-ovh
23.12.13, 19:00
Zitat Zitat von mathias
mc63515-ovh, vielen Dank. Die Vorgaben dürfen wir nicht außer acht lassen, der komplette Support für Isgenug Server findet im Forum statt.
Ich habe das Ticket geöffnet, bitte noch darauf antworten und dem Eingriff zustimmen.

Mathias
Hallo Mathias,

das war nicht persönlich gemeint, aber es ist schon ein wenig merkwürdig, wenn man auf eine automatisch generierte Störungsmail vom OVH-Support antwortet, und dann mitgeteilt bekommt, dass man sich erstmal noch hier im Forum registieren muss, damit ein Problem welches offenkundig auf OVH-Seite liegt (was ja spätestens klar ist, seit sich herausgestellt hat, dass der Netboot in den Rescuemode nicht funktioniert) überhaupt bearbeitet wird.
Da stimmt die Benutzerführung nicht und auf einem Smartphone kommt richtig Spaß auf, wenn man sich per Web irgendwo registrieren und einloggen muss...

Bit
23.12.13, 18:52
Netboot ist umgestellt. Hard Reboot habe ich vor etwa 30 Minuten gestartet und warte nun auf die Email.
Ich melde mich wieder, wenn ich den Test durchführen konnte.

mathias
23.12.13, 18:41
mc63515-ovh, vielen Dank. Die Vorgaben dürfen wir nicht außer acht lassen, der komplette Support für Isgenug Server findet im Forum statt.
Ich habe das Ticket geöffnet, bitte noch darauf antworten und dem Eingriff zustimmen.

Mathias

mc63515-ovh
23.12.13, 18:34
Nachdem der Kundendienst mein Problem als solches anerkannt hat, sich jedoch nicht berechtigt sah eine Störungsmeldung zu eröffnen (guter Support sieht anders aus), schließe ich mich diesem Thread an.
Daten meines Server:

ks3096911.kimsufi.com
Datacenter: rbx2
Rack: 24A18
Nummer: 81055

Server scheint pingbar, aber von außen nicht ansprechbar (http, ssh). Selbst ein netboot über den ovh-manager in den Rescuemode kommt nicht an. Habe das schon zweimal durchgeführt aber laut Kundendienst läuft der Server weiterhin im normalen Modus.

http://status.ovh.net/?do=details&id=6016 scheint weiterhin nicht behoben. Bitte um schnelle Abhilfe.

mathias
23.12.13, 17:52
Hallo,

versuch bitte einmal, den Server im Rescue Modus zu starten und führe dort den Speedtest durch (http://hilfe.ovh.de/AdministrationRescueModus).

Mathias

Bit
23.12.13, 16:06
Datacenter: rbx2
Rack: 24A18
Nummer: 81067

Ping ab einer gewissen Paketgröße geht schief. Alle TCP Verbindungen brechen sehr früh ab, vermutlich wenn das erste Netzwerkpaket ein paar Bytes zu groß wird. Getestet habe ich immer aus dem Internet heraus, also von außerhalb.

Zum Nachtesten bitte entweder Ping benutzen (Log siehe unten) oder gern auch eine Verbindung mit SSH oder Http probieren. Den Hostnamen kennt ihr ja.

Ping mit Defaultgröße 32 Bytes klappt ganz normal, aber mit größeren Paketen nicht:
ping -l 200 xxx

Ping wird ausgeführt für xxx [xx.xx.xx.xx] mit 200 Bytes Daten:
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.

Ping-Statistik für xx.xx.xx.xx:
Pakete: Gesendet = 4, Empfangen = 0, Verloren = 4 (100% Verlust),

Dieselben Pingpakete werden vom Proof-Server problemlos beantwortet:
ping -l 200 proof.ovh.net

Ping wird ausgeführt für proof.ovh.net [188.165.12.106] mit 200 Bytes Daten:
Antwort von 188.165.12.106: Bytes=200 Zeit=24ms TTL=51
Antwort von 188.165.12.106: Bytes=200 Zeit=22ms TTL=51
Antwort von 188.165.12.106: Bytes=200 Zeit=29ms TTL=51
Antwort von 188.165.12.106: Bytes=200 Zeit=23ms TTL=51

Ping-Statistik für 188.165.12.106:
Pakete: Gesendet = 4, Empfangen = 4, Verloren = 0 (0% Verlust),
Ca. Zeitangaben in Millisek.:
Minimum = 22ms, Maximum = 29ms, Mittelwert = 24ms

Und hier ist noch ein SSH Log:
2013-12-23 17:01:12 Looking up host "xx.xx.xx.xx" (IPv4)
2013-12-23 17:01:12 Connecting to xx.xx.xx.xx port 22
2013-12-23 17:01:12 Server version: SSH-2.0-OpenSSH_5.3
2013-12-23 17:01:12 Using SSH protocol version 2
2013-12-23 17:01:12 We claim version: SSH-2.0-PuTTY_Release_0.63
2013-12-23 17:01:34 Network error: Software caused connection abort

Kann ich sonst noch etwas tun um das Problem besser zu belegen?

hemmerseb
23.12.13, 14:48
Hallo Bit,

bitte schicken Sie uns verschiedene Logfiles, die eine Netzwerkstörung belegen. Erst dann können wir ein Störungsticket erstellen. Darüber hinaus brauchen wir auch noch die Servernummer oder den Hostnamen.

Sebastian

marius
23.12.13, 14:36
Zitat Zitat von Bit
Scheinbar hat sich auch jemand mit besserem Supportvertrag beschwert. Denn immerhin gibt es jetzt ein Ticket http://status.ovh.net/?do=details&id=6016 von dem ich hoffe, dass es dann auch mein Problem lösen wird. Leider liege ich nicht direkt mit in dem angegebenen IP-Bereich...
In dem Eintrag ist die Rede von "HG-Switch", so viel ich weiß hängen die HG Server an eigenen Switches.

Bit
23.12.13, 14:28
Der Serverausfall besteht jetzt bald den ganzen Tag, ohne eine Antwort (abgesehen von den automatischen "Ende des Fehlers"-Emails). Ein richtiges Ticket habe ich noch nicht bekommen.
Scheinbar hat sich auch jemand mit besserem Supportvertrag beschwert. Denn immerhin gibt es jetzt ein Ticket http://status.ovh.net/?do=details&id=6016 von dem ich hoffe, dass es dann auch mein Problem lösen wird. Leider liege ich nicht direkt mit in dem angegebenen IP-Bereich...

Bit
23.12.13, 10:56
Hallo Support,

schaut sich das denn noch jemand an? In der letzten Stunde hat sich nichts mehr verändert. Ping funktioniert solange es wenige Bytes sind, TCP nicht. Portscan ergibt, dass die richtigen Ports offen sind, aber die TCP Verbindungen bleiben immer gleich hängen.

Probiert doch mal größere Pings z.B. mit 200 Bytes aus, denn das klappt schon nicht mehr. Mit den paar Bytes die vom Server kommen, lässt sich aktuell nicht mal SSH durchführen. Das Netzwerkproblem ist also noch nicht behoben, auch wenn das Rack im Status wieder grün angezeigt wird.

Bit
23.12.13, 09:46
Vor einer Minute hat sich etwas getan. Die Paketverluste für Ping scheinen jetzt weg zu sein, aber es sind keine TCP Verbindungen mehr möglich. Ich beobachte das weiter.

Bit
23.12.13, 09:26
Nein, es ist nicht dasselbe Problem. In RBX-2 gehen einige Pings durch, der Server und selbst SSH antwortet. Nur macht das bei so hohen Paketverlusten keinen Spass. Seit Beginn der Störung kann man auf http://status.ovh.net/vms/index_rbx2.html verfolgen, dass in dem genannten Rack jede Minute zwischen 2-10 Servern nicht erreichbar sind. Ich glaube also kaum, dass es ein spezifisches Problem auf einem Server ist.

Tobias-W
23.12.13, 09:12
Dies scheint das identische Probleme wie bei mir zu sein, nur das ich in einem anderem Rechnenzentrum (RBX5) bin.

Bit
23.12.13, 08:56
Das Monitoring Tool hat mich um 9:34 Uhr über einen Fehler informiert. Aber eine Minute später kam die Mail, dass der Fehler beendet ist. Das stimmt aber so nicht.
Aktuell gibt es noch immer eine sehr hohe Paketverlustrate um die 61% und im http://status.ovh.net/vms/index_rbx2.html sind ständig einige Rechner dieses Racks offline. Bitte überprüft das Rack nochmal.