OVH Community, your new community space.

Arbeiten heute Nacht: vss-1 Split


oles@ovh.net
02.09.10, 06:14
Guten Abend,

der Eingriff wurde abgeschlossen (mit einigen Schwierigkeiten und
einem Problem mit den Failover-IPs bei den HG).

Mit freundlichen Grüssen

Octave

oles@ovh.net
01.09.10, 23:58
Guten Tag,

vor etwa einem Monat haben wir einen "Split" von vss-2 (doppeltes
Chassis) auf eine Konfiguration mit einem einzigen Chassis durchgeführt.
Dies hat alle Probleme gelöst, die wir mit diesem vss hatten. Das BGP
ist schnell und lastet die CPU nicht mehr aus. Es treten auch keine ARP
Probleme mehr auf.

Wir werden deshalb auch für den Router vss-1 heute Nacht ab Mitternacht
einen Split durchführen. Es wird etwa 30 Minuten dauern, dies einzurichten.
Während dieser halben Stunde werden die von vss-1 verwalteten Server nicht
erreichbar sein.

Um mehr zu erfahren:
http://status.ovh.net/?do=details&id=472

Wenn wir mit vss-1 fertig sind bleibt dann als Letztes nur noch vss-3 zu
erledigen. Danach sollten wir dann keine Probleme mehr mit den vss haben.

Vor etwa 2 Jahren hatten wir die im Rückblick falsche Entscheidung für
eine Konfiguration getroffen, die nicht richtig funktionierte, und haben
vergeblich darauf gewartet, dass diese Probleme gefixt werden. Indem wir
uns nun wie früher mit den Mitteln, die uns auf unserer Seite zur Verfügung
stehen, selbst helfen, werden nun alle verbleibenden Probleme eines nach
dem anderen ohne weitere Verzögerungen abgearbeitet. Ich schätze, dass wir
noch Arbeit für etwa 2 Wochen damit haben werden.

Ansonsten werden wir die Nexus 7016 nicht verwenden, die wir ursprünglich
vorgesehen hatten. Wir haben einen bestellt, um Tests durchzuführen, und
was wir geliefert bekommen haben entspricht nicht unseren Erwartungen. Es
gibt Limitierungen beim RAM, die uns daran hindern, BGP richtig zum Laufen
zu kriegen, Cloud Funktionen sind nicht entwickelt und werden es anscheinend
auch nicht, ausserdem gibt es verschiedene Bugs bei der Einrichtung (z.B.
proxy-arp mit HSRP und erzwungener MAC, kein proxy-arp bei ipv6 usw.).
Kurz gesagt, dieses Equipment ist derzeit noch nicht bereit für einen L3
Betrieb. Wir haben also Zeit verloren. Viel Zeit. Wir haben nun Bestellungen
bei Juniper und Brocade für vergleichbares Equipment und ASR 9000 aufgegeben.
All dies, um (erst einmal) Tests durchzuführen und die Hardware selbst in
Augenschein nehmen zu können. Und die Bugs, die dazugehören...

Stellt dies unsere Pläne in Frage?
Bizarrerweise nicht. Die Router, die wir heute verwenden, funktionieren bis
zu einer bestimmten Grenze gut. Die Idee ist also, lieber erst einmal diese
Grenze nicht zu überschreiten, als nach neuem Equipment zu suchen, mit dem
dies möglich wäre. Anstatt also die Router zu upgraden werden wir parallel
dazu neue Router aufstellen. Ganz einfach. Das Backbone wird "weniger
zentralisiert" ausgelegt, also "mehr/besser verteilt". Aufteilen und nochmal
aufteilen, um 2 oder 3 parallele Backbones zu erhalten, die jedes etwa 500
Gbit/s Kapazität haben und quasi voneinander unabhängig betrieben werden.

Die anderen derzeit noch laufenden Arbeiten an unserem Netzwerk:

Die Einrichtung von BGP Route Reflectors:
http://travaux.ovh.com/?do=details&id=4490
Die Problematik des QoS bei den Rackswitches:
http://status.ovh.net/?do=details&id=301
Die Absicherungen gegen UDP Angriffe:
http://status.ovh.net/?do=details&id=158

Mit freundlichen Grüssen

Octave