OVH Community, your new community space.

Massive Probleme im RBX4?


PhilipM
04.10.11, 21:13
Zitat Zitat von mathias
Hallo,

diese Störungen sind behoben:
http://status.ovh.net/?do=details&id...f5478a20ff7523

http://status.ovh.net/?do=details&id...f5478a20ff7523

Müsste eigentlich wieder alles funktionieren...?

Mathias
Also jetzt sind gerade die Racks: 51B11, 51B12, 51B13, 51B14 und 51B15 komplett down. Es scheint immer noch etwas nicht zu stimmen

mathias
04.10.11, 11:45
Hallo,

diese Störungen sind behoben:
http://status.ovh.net/?do=details&id...f5478a20ff7523

http://status.ovh.net/?do=details&id...f5478a20ff7523

Müsste eigentlich wieder alles funktionieren...?

Mathias

Shawn
03.10.11, 14:41
Ich hatte gestern bei meinem keine Probleme, dafür ist seit 13 Uhr heute mein Server in RBX4 weg

PhilipM
03.10.11, 11:21
Verstehe ich das richtig? Ein Konfigurationsfehler war Schuld an dem ganzen Theater?

Zitat Zitat von http://status.ovh.net/?do=details&id=1876
A human error on the configuration of the network:

46.105.116.0/24
46.105.117.0/24
46.105.118.0/24
46.105.119.0/24
176.31.226.0/24
176.31.227.0/24

It can be explained by the tireness of our team's members.
We have been on this task since 48 hours

marius
03.10.11, 00:22
Meine Server stehen leider alle in RBX4 und sind nicht von allen Internetanbietern aus erreichbar.

Nibor
03.10.11, 00:21
Zitat Zitat von felix3103
Ebenso. Mein Server ist aber auch in RBX4.
Server ist nur über Fail-Over-IPs erreichbar.
Diese sind über den Tag verteilt auch ab und zu ausgefallen.
Bei mir ist nur ein Server bedingt über eine der 8 Failover IPs erreichbar

PhilipM
02.10.11, 23:52
Laut VMS sind >450 Server seit mehr als 50 Minuten nicht zu erreichen. Inkl einer von mir

Es gibt ein Update. Angeblich soll ein Angriff Schuld an dem Problem sein. Was mich als Routing-Laie verwundert ist, dass 5Gbps so einen Schaden verursachen können

Edit: Nun sind es 800 Server.

felix3103
02.10.11, 23:45
Ebenso. Mein Server ist aber auch in RBX4.
Server ist nur über Fail-Over-IPs erreichbar.
Diese sind über den Tag verteilt auch ab und zu ausgefallen.

marius
02.10.11, 23:34
root@s1:~# traceroute youtube.com
traceroute to youtube.com (209.85.148.91), 30 hops max, 60 byte packets
1 * * *
2 * * *
3 * * *
4 * * *
5 * * *
6 * * *
7 * * *
8 * * *
9 * * *
10 * * *
11 * * *
12 * * *
13 * * *
14 * * *
15 * * *
16 * * *
17 * * *
18 * * *
19 * * *
20 * * *
21 * * *
22 * * *
23 * * *
24 * * *
25 * * *
26 * * *
27 * * *
28 * * *
29 * * *
30 * * *
root@s1:~#
Hängt das auch damit zusammen?
Problem besteht auf meinen Servern und auf den clouds.

PhilipM
02.10.11, 17:46
Laut Support hängt das Problem mit dem von Nibor verlinkten Beitrag zusammen.

PhilipM
02.10.11, 16:37
Und plötzlich waren, zumindest gefühlt, alle Server die ich im RBX 4 habe auf einen Schlag down: http://img510.imageshack.us/img510/2015/downud.png

(Die Grafik entspricht 311 Servern, welche Down sind.)

PhilipM
02.10.11, 16:10
Mayday! Schon wieder nen Server für 15 Minuten down! Wenn das mit einem Software Bug auf Force10 Switchen zusammenhängt, dann dürften das für uns noch sehr erlebnisreiche Stunden werden

Nibor
02.10.11, 15:48
http://status.ovh.de/?do=details&id=1876
könnte immerhin den Packetverlust erklären

nobody123
02.10.11, 13:55
kann ich auch bei einem server beobachten den ich betreue:

1772 packets transmitted, 1529 received, +2 duplicates, 13% packet loss, time 1773099ms
rtt min/avg/max/mdev = 55.287/62.651/895.369/28.426 ms

Server4pro
02.10.11, 13:44
Ähnliches Problem mit Kundenserver. Diese Nacht. 7 Downtimemeldungen von jeweils einer Minute beim einten Server.
http://s14.directupload.net/images/111002/28xr3j9u.jpg

Beim Zweiten Server nur eine Downtime von 10Minuten heute Mittag.
Da die Serverkennung ns...3.ovh.net und ns...4.ovh.net nebeneinander ist vermute ich da einen Zusammenhang. Wäre schön wenn das schnell ein Ende finden würde.

PhilipM
02.10.11, 12:36
Seit gestern Abend scheint es massive Probleme im RBX 4 zu geben. Ich habe gerade die VMS-Seite geladen und da waren 218 Server down. Es scheint so, als würden spontan ganze Racks ausfallen und nicht mehr erreichbar sein.

Zum Glück waren bei mir bisher nur 2 Server betroffen, wovon einer gerade neu bestellt war und nicht produktiv verwendet wurde.

Hat irgendwer schon genauere Infos zu dem Problem und eventuell ein ETA für die Behebung erhalten?

Korrektur: Nun sinds 3 Server