Serverausfall Info 14:25

Nun, der Serverhoster ist immer noch an unserm Server am Werkeln.
Hier ist mehr kaputt gegangen als nur die Festplatte.

Und hier noch eine Zusammenfasung des Serverhosters:

Sehr geehrte Kunden,

wir möchten Sie hiermit abschließend informieren bezüglich des Ausfalls in unserem Rechenzentrum 3.
Die Chronologie der Ereignisse haben wir Ihnen hier im Kundenmenü KCM mitgeteilt. Unabhängig von dem stundenlangen, umfangreichen Ausfall in Erfurt-Mitte hat unser Notstromsystem nicht gegriffen, bedingt durch einen Defekt einer von zwei vorhandenen USV- Anlagen. Daraus resultierte ein Komplettausfall, von dem mehrere tausend Maschinen betroffen waren. Unser Bestreben war es natürlich, nachdem seitens der Stadtwerke Erfurt die Versorgung wieder sichergestellt war, die Maschinen wieder online zu bringen und so die Ausfallzeiten zu verkürzen. Der Techniker unseres Lieferanten, der Firma Emerson Network Power, konnte anfahrtsbedingt nicht sofort vor Ort sein, so dass wir uns entschlossen hatten, ohne USV-Versorgung die Maschinen wieder online zu bringen, da ein Zuschalten der USV-Anlage in der Regel unkompliziert möglich ist.

Leider war das Problem dann doch schwieriger, so dass wir die Maschinen noch einmal herunter fahren mussten. Nach erfolgter Reparatur der USV-Anlage konnten wir gegen 20:30 Uhr die Server wieder einschalten. Aufgrund der Menge der betroffenen Server war damit zu rechnen, dass einige Maschinen nicht ohne technische Unterstützung von allein wieder online gehen. Ursachen sind zum Teil Schäden an Netzteilen oder softwareseitig manuelle Filechecks, die zu reparieren sind. Darüber hinaus müssen u.U. Backups zurück gespielt werden, was natürlich auch einen enormen Zeitaufwand mit sich bringt.
Aktuell sind noch 4% (125 Maschinen) nicht wieder online – hauptsächlich bedingt durch die o.a. Probleme.
Wir bedauern sehr, dass wir trotz Aufbringung aller Kräfte in der vergangenen Nacht noch nicht alle Maschinen wieder online haben – setzen jedoch alles daran, auch diese Maschinen wieder ans Netz zu bringen. Die betroffenen Kunden erhalten im Ticketsystem entsprechende Nachricht über den Status oder – sofern gewünscht – auch telefonisch.

Unabhängig davon werden wir mit unseren Lieferanten die Ereignisse auswerten. Zum jetzigen Zeitpunkt ist noch absolut unklar, warum die USV-Anlage versagte, obwohl diese erst vor Kurzem gewartet und sich aufgrund modernster Elektronik auch einem permanenten Selbsttest unterzieht – bislang ohne Fehler. Selbstverständlich konnten wir auf dieser Basis davon ausgehen, eine funktionstüchtige Anlage zu haben. Da wir vor ca. einem Jahr schon einmal ein ähnlich gelagertes Problem hatten, können und wollen wir nicht mehr von einem Einzelfall ausgehen und werden entsprechend eine herstellerseitige Lösung verlangen. Wir werden Sie hier entsprechend informieren inkl. der anzusetzenden Prüfungstermine.

Mit freundlichen Grüßen

Dieser Beitrag wurde unter BF2 - Server veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert