Never touch a running System!

Jeder kennt diesen Spruch, jeder weiß es, aber was will man machen ?!?!?! Gestern hab ich von dem gefährlichen Bug im Kernel berichtet und mich natürlich gleich mit Frank gekümmert, dass unsere Server gefixt sind. Wie gut, dass es entgegen aller Erwartungen seit 14.08.2009 ein Kernel-Update im Yast zu finden gibt für SuSE 10.3 und man konnte wetten, dass er nach dem Update nicht mehr hochfährt. Doch ein Wunder passierte, trotz Kernel-Update ist die Kiste problemlos hochgefahren und alles funktionierte problemlos … ich wollte es nicht glauben, ich dennoch fasziniert, ein Kernel-Update ohne Probleme? Das kann doch nich sein …

Ja, ich wusste es, zu früh gefreut, denn schon 3 Stunden später sind die Kisten abgeschmiert und wie immer, hat kein Mensch ne Ahnung wie es jetzt weiter geht. Problemstellung ist einfach, der Server kommt an einen Punkt X, dort ist es dann wie, als wenn ich den Strom wegnehme. Er ist offline, er schreibt nichts in die Logfiles und ich habe kein Ping mehr, alles weg! Nun mach mal ne Fehlersuche ohne irgend einen Anhaltspunkt ohne irgend einen Eintrag in den Logfiles, die einzigste Konstante die verändert wurde ist der Kernel.

So, nun kann man den originalen einspielen, hat dann wieder ein unsicheres System, man kann mit ständigen Abstürzen leben oder was weiß ich was. Und wenn im Rechenzentrum von den Fachleuten auch niemand Ideen hat, dann kommt Freude auf. Ergo würde ich jedem anraten, dass Update nicht einzuspielen, zumindest den Leuten die weiterhin ruhig leben wollen … und wo ich das gerade schreibe, ist der Bock schon wieder offline. *ARRRRGGGHHHHH*

SK

Inhaber einer IT-Firma die sich auf exklusives & individuelles Webhosting spezialisiert hat. Als einer der ersten Anbieter von speziellen Wordpress Hosting Angeboten, schreibt er hier Artikel über Wordpress. Aber auch in der Welt von Windows, Linux und den modernen Smartphones kennt er sich aus und schreibt hier entsprechende Artikel, Tests und Tipps & Tricks.



1 Kommentar zu “Never touch a running System!”

  1. fwolf sagt:

    Naja .. hab davon nix gemerkt (um 10), hab da noch geschlafen (lange (Arbeits)Nacht) :D

    Gibt es sowas wie dmesg nicht auch für die HeulSuse?
    Da sollte doch alles nötige drinstehen ..

    Ansonsten mal uname -a bzw. uname -r in Kombination mit den Schlüsselworten “kernel freeze” auf die Jagd gehen, vielleicht ergibt sich da ja was (andere Möglichkeiten: Mainboard? sonstige als anfällig bekannte HW?).

    cu, w0lf.

    ps: Empfehlung fürs nächste Mal: Virtuelle Maschine o.ä. plus exakt nachgebaute Umgebung – Update dort durchführen und anschließend fröhliche (Volllast-)Tests mit den einzelnen Server-Daemons durchführen. Ist zwar nicht identisch mit dem Produktivsystem, sollte aber dennoch solche Freeze-Geschichten aufzeigen können.

Schreibe ein Kommentar: