Neues SSL-Zertifikat für mail.gocept.net

Heute haben wir turnusgemäß ein neues SSL-Zertifikat für die Dienste
  • SMTP (Mail-Versand)
  • IMAP/POP3 (Mail-Empfang)
  • HTTPS (Weboberfläche)
auf mail.gocept.net installiert. Das Zertifikat wurde von Thawte Consulting unterschrieben und ist bis zum 20.01.2011 gültig.

Es ist möglich, dass Ihr Mail-Client Sie beim ersten Zugriff dazu auffordert, das neue Zertifikat zu bestätigen. Weitere Nachfragen sollten nicht auftreten.

Ausfall der Rechenzentrums-Anbindung [2. Update]

Am heutigen Dienstag, dem 15. Oktober sind seit 8:55 keine Verbindungen ins Rechenzentrum möglich. Dadurch sind sämtliche Server nicht erreichbar. Wir arbeiten an dem Problem und werden Sie über Änderungen der Situation weiter auf dem Laufenden halten.

Update 09:50: Der Fehler ist vermutlich durch einen ARP-Adressen-Konflikt erzeugt worden und muss lokal im RZ behoben werden. Voraussichtliche Wiederherstellung der Konnektivität ist 11:00.

Update 16:00: Der Fehler wurde um 12:00 endgültig behoben.

Ursache war im Ursprung eine Fehlkonfiguration, die eine Netzwerkschleife und damit einen Paketsturm erzeugt hat. Zusätzlich gab es ein Fehlverhalten in der Switch-Hardware des Rechenzentrumsbetreibers, wodurch auch nach Beseitung des Paketsturms die Konnektivität nicht wieder hergestellt werden konnte und nach langwieriger Analyse erst durch vollständigen Reset des Switches wieder verfügbar war.

Die Fehlkonfiguration kam im Rahmen des Ausbaus unserer Kapazitäten zustande, wofür wir uns ausdrücklich entschuldigen.

Ausfall der Rechenzentrums-Anbindung

Am heutigen Freitag, dem 6. Juni 2008, ist in der Zeit von 15:30-16:30 Uhr die Außenanbindung unseres Rechenzentrums zusammengebrochen. Das hat dazu geführt, dass sämtliche Server nicht erreichbar waren. Wir entschuldigen uns für die entstandenen Unannehmlichkeiten.

Ursache war laut Aussage des Rechenzentrumsbetreibers ein Fehler in den Routing-Tabellen. Das Problem lag damit außerhalb unseres Einflussbereichs.

Downtime Mailserver am Donnerstag

Am Donnerstag, dem 17.04.2008, müssen wir den Mailserver in der Zeit zwischen 18 und 19 Uhr herunterfahren, um den Hauptspeicher zu erweitern. In der Zeit können keine Mails verschickt oder abgerufen werden. Es ist nicht zu erwarten, dass Mails verloren gehen. Die Mailzustellung wird sich jedoch verzögern.

Der Hintergrund ist, dass der Mailserver in der Vergangenheit sehr stark ausgelastet war. Durch die RAM-Erweiterung werden wir die Leistungsfähigkeit und Zuverlässigkeit erhöhen.

Ungeplante Mailserver-Ausfaelle zwischen 29.3.2008 und 1.4.2008

Im Rahmen einer umfassenden System-Aktualisierung hat die Installation eines neuen Linux-Kernels leider unvorhergesehene Probleme verursacht und damit die Stabilität des Servers stark beeinträchtigt. Dadurch wurden mehrere Ausfälle zwischen Freitag (28.3.2008) und Dienstag (1.4.2008) verursacht.

Die Reparaturen sind vorerst abgeschlossen, wir beobachten die Stabilität des Systems momentan sehr genau. Eine genaue Root-Cause-Analysis steht noch aus.

Wir entschuldigen uns für die entstandenen Unannehmlichkeiten.


Technische Details:

Der Linux-Kernel mit "tickless"-Option erzeugt leider nicht genügend Entropie, um den Mailserver mit ausreichend Zufallszahlen für die kryptographischen Funktionen zu versorgen, was dazu führt, dass Verbindungen lange warten müssen und sich ansammeln. In der Folge wird sämtlicher Speicher im System verbraucht, was nach etwa 1 Stunde zu sehr hoher Last im System und schließlich einem Neustart führt.

Vorrübergehend konnte das Problem durch den Einsatz von `rngd` gemildert werden. Nach Deaktivieren der Tickless-Option hat sich die Entropie noch nicht sichtbar gebessert, so daß der `rngd` weiterhin im Einsatz bleibt, jedoch mit erhöhter Produktionsrate.

Wir werden das System in der nächsten Woche mit 2 GB zusätzlichem Hauptspeicher versehen, was die Performance insgesamt nochmal heben sollte. Der Einbau wird eine Downtime von etwa 15 Minuten verursachen und wird noch einmal getrennt angekündigt werden.

Leider verfügt der betroffene Server über keine "lights off"-Konsole, so dass die Wartungsarbeiten am Kernel nur vor Ort im Rechenzentrum durchgeführt werden können, was die hohen Latenzen (~1h) beim Reparieren eines defekten Kernel-Updates verursacht. In Zukunft wollen wir dies auf zwei Wege verbessern: einzelne Systeme durch Virtualisierung stärker voneinander abschotten, sowie nur noch Server mit integrierten "lights off"-Konsolen einkaufen.

Das "gocept hosting status Blog" ist da

Mit diesem Blog wollen wir unsere Kunden aktuell und transparent ueber Neuigkeiten, Wartungsarbeiten und Ausfälle in unserer Hosting-Infrastruktur informieren. Dazu gehören Ankündigungen von Wartungsarbeiten, Ausfällen, Analysen und Statistiken.

Wir werden hier sowohl nicht-technische Zusammenfassungen, als auch technisch detailliertere Erläuterungen bereitstellen.

Sollten Sie Fragen zu unserem Hosting haben, wenden Sie sich bitte per E-Mail an support@gocept.com.