Vorweg, ich bin kein Linux-Crack und würde mich nur maximal als durchschnittlich begabt bezeichnen.
Heute morgen ist bei einem meiner Server /dev/sda ausgefallen, also habe ich ein Störungsticket erstellt und innerhalb von weniger als 20 Minuten wurde die Platte getauscht und der Server war wieder am Netz. Dann begann das große grübeln: Wie sorge ich jetzt wieder für ein funktionierendes Raid? Ich dachte mir, bevor ich mir Rat bei irgendwelchen dubiosen Scraper-Seiten im Netz suche, checke ich mal die
OVH Hilfe.
Gesagt getan, war alles sehr einfach. Ich habe die folgenden Befehle ausgeführt:
Code:
sfdisk -d /dev/sdb | sfdisk /dev/sda
mdadm /dev/md1 --manage --add /dev/sda1
mdadm /dev/md2 --manage --add /dev/sda2
Danach ging die Syncronisation auch schon los und ich habe es mal laufen lassen. Nach einigen Stunden jedoch ist der Server aus nicht geklärten Gründen abgestürzt und dann konnte er nicht mehr von der Festplatte booten. Schon ging die Show los: Automatisches Störungsticket, System in den Rescue Modus versetzt -> "
Störung behoben". Zuerst habe ich probiert den Server selbst noch einmal neu zu starten, als das fehlschlug habe ich beim OVH Support angerufen und nach mehr Details zu der Störung gefragt. Der Mitarbeiter konnte sehen, dass der Server nicht mehr von der Festplatte booten konnte, in meinem Störungsticket steht jedoch nur, dass die "
Störung behoben" wurde. Wieso, verschickt ihr irreführende Tickets und gebt euren Kunden nicht direkt die Informationen? Nunja, mir wurde gesagt, dass wieder ein neues Ticket erstellt wurde und ich besser warten sollte, bis ein Techniker an den Server geht, da dann mehr Informationen vorliegen. Halbe Stunde später wieder das Gleiche: Server in den Rescue Modus -> "
Störung behoben". Dann habe ich wieder bei OVH angerufen und nach den Details gefragt: Es war wieder nur bekannt, dass der Server nicht von der Festplatte booten kann.
Ich habe den Supporter gefragt, ob er mir einige Hilfestellungen zur Problembehebung geben könnte. Er meinte, er könne mir nicht helfen, da es sich um ein Software Problem handelt und das nicht von der SLA gedeckt ist. Völlig verständlich, also habe ich gefragt ob es Hilfe gegen Gebühr gibt. Auch das würde nicht gehen: Meine letzte Hoffnung war, dass er mir wenigstens einen Anhaltspunkt geben könnte, da sämtliche Logfiles keine Einträge mehr seit dem Absturz enthielten. Auch das war nicht möglich, immerhin müsste ich selbst wissen, was ich gemacht hätte (Ja ich habe das gemacht was mir die OVH Hilfe gesagt hat)
Nach viel vielen Google-Queries konnte ich bisher nur erfahren, dass es angeblich problematisch ist /dev/sda auszutauschen, da sich dort der Boot-Record befinden würde. Durch Zufall habe ich dann auch noch euren Kernel-Netboot entdeckt und konnte den Server zumindest wieder in Betrieb nehmen und die Syncronisierung weiterlaufen lassen (Wieso wird der nicht vom Support empfohlen? Ist er noch nicht bereit für Produktiv-Einsätze?)
Ich werde jetzt die Syncronisation durchlaufen lassen und danach den Server komplett austauschen. Das ist für mich aber nur eine Notlösung, von daher würde ich gerne wissen welche Schritte in der OVH Anleitung fehlen um den Server von der Festplatte booten zu lassen.