- Einführung eines Routers für das Frontend-Netzwerk
- Austausch des störanfälligen Switches durch ein robusteres Gerät
Wartungsarbeiten am Mittwoch, 11.03.2009, ab 21:00
Am Mittwoch (11.03.2009) ab 21:00 CET werden wir mehrere Umstrukturierungen in der Hosting-Umgebung vornehmen, die die Ursachen für die letzten Ausfälle beseitigen wird. Dazu zählen:
Ausfall der Rechenzentrums-Anbindung [4. Update]
Seit heute 12:00 sind keine Verbindungen zu unseren Servern ins Rechenzentrum möglich. Sämtliche Dienste sind daher nicht erreichbar. DNS-Anfragen werden durch ns2.gocept.com von unserem Bürostandort verarbeitet.
Die erste Diagnose weist auf ein Problem seitens des RZ hin, dessen Techniker die Situation momentan bearbeiten.
Update: Seit 13:20 ist die Anbindung wieder hergestellt, die Dienste sind soweit erreichbar. Die genaue Ursache wird noch ermittelt.
Update: Die Anbindung ist noch einmal zusammengebrochen.
Update: Der Uplink-Switch verliert die Verbindung zu unserem Switch nach einem Reset erneut. Die weitere Diagnose muss vor Ort erfolgen. Die Störung wird voraussichtlich bis 15:00 andauern.
Update: Seit etwa 15:00 ist die Verbindung wieder zuverlässig. Die Ursache lag an einer abgestürzten Netzwerkkarte, die den davorliegenden Switch auf unserer Seite durcheinandergebracht hat. Die Netzwerkkarte wurde kurzfristig reaktiviert. Der Switch wird voraussichtlich in Kürze gegen ein robusteres Modell ausgetauscht werden.
Die erste Diagnose weist auf ein Problem seitens des RZ hin, dessen Techniker die Situation momentan bearbeiten.
Update: Seit 13:20 ist die Anbindung wieder hergestellt, die Dienste sind soweit erreichbar. Die genaue Ursache wird noch ermittelt.
Update: Die Anbindung ist noch einmal zusammengebrochen.
Update: Der Uplink-Switch verliert die Verbindung zu unserem Switch nach einem Reset erneut. Die weitere Diagnose muss vor Ort erfolgen. Die Störung wird voraussichtlich bis 15:00 andauern.
Update: Seit etwa 15:00 ist die Verbindung wieder zuverlässig. Die Ursache lag an einer abgestürzten Netzwerkkarte, die den davorliegenden Switch auf unserer Seite durcheinandergebracht hat. Die Netzwerkkarte wurde kurzfristig reaktiviert. Der Switch wird voraussichtlich in Kürze gegen ein robusteres Modell ausgetauscht werden.
Ausfall der Rechenzentrums-Anbindung
Am Dienstag, dem 13. Januar waren zwischen 15:30 und 18:00 keine Verbindungen ins Rechenzentrum möglich. Dadurch waren sämtliche Server nicht erreichbar.
Im Augenblick sind die meisten Verbindungen wieder möglich, einige Dienste, die Datentransfer zwischen unserem Backend-Netz und dem Internet benötigen sind momentan nur eingeschränkt funktionsfähig. Dienste, die im normalen Kundennetz angebunden sind laufen regulär.
Die Behebung der Probleme des Backend-Netzes und die Ursachenanalyse sind für morgen Vormittag geplant.
[Update]
Mittlerweile hat sich die Situation stabilisiert. Alle Dienste laufen wieder. Der Rechenzentrumsbetreiber hat unsere Server nun über einen moderneren Router angebunden.
Im Augenblick sind die meisten Verbindungen wieder möglich, einige Dienste, die Datentransfer zwischen unserem Backend-Netz und dem Internet benötigen sind momentan nur eingeschränkt funktionsfähig. Dienste, die im normalen Kundennetz angebunden sind laufen regulär.
Die Behebung der Probleme des Backend-Netzes und die Ursachenanalyse sind für morgen Vormittag geplant.
[Update]
Mittlerweile hat sich die Situation stabilisiert. Alle Dienste laufen wieder. Der Rechenzentrumsbetreiber hat unsere Server nun über einen moderneren Router angebunden.
Neues SSL-Zertifikat für mail.gocept.net
Heute haben wir turnusgemäß ein neues SSL-Zertifikat für die Dienste
Es ist möglich, dass Ihr Mail-Client Sie beim ersten Zugriff dazu auffordert, das neue Zertifikat zu bestätigen. Weitere Nachfragen sollten nicht auftreten.
- SMTP (Mail-Versand)
- IMAP/POP3 (Mail-Empfang)
- HTTPS (Weboberfläche)
Es ist möglich, dass Ihr Mail-Client Sie beim ersten Zugriff dazu auffordert, das neue Zertifikat zu bestätigen. Weitere Nachfragen sollten nicht auftreten.
Ausfall der Rechenzentrums-Anbindung [2. Update]
Am heutigen Dienstag, dem 15. Oktober sind seit 8:55 keine Verbindungen ins Rechenzentrum möglich. Dadurch sind sämtliche Server nicht erreichbar. Wir arbeiten an dem Problem und werden Sie über Änderungen der Situation weiter auf dem Laufenden halten.
Update 09:50: Der Fehler ist vermutlich durch einen ARP-Adressen-Konflikt erzeugt worden und muss lokal im RZ behoben werden. Voraussichtliche Wiederherstellung der Konnektivität ist 11:00.
Update 16:00: Der Fehler wurde um 12:00 endgültig behoben.
Ursache war im Ursprung eine Fehlkonfiguration, die eine Netzwerkschleife und damit einen Paketsturm erzeugt hat. Zusätzlich gab es ein Fehlverhalten in der Switch-Hardware des Rechenzentrumsbetreibers, wodurch auch nach Beseitung des Paketsturms die Konnektivität nicht wieder hergestellt werden konnte und nach langwieriger Analyse erst durch vollständigen Reset des Switches wieder verfügbar war.
Die Fehlkonfiguration kam im Rahmen des Ausbaus unserer Kapazitäten zustande, wofür wir uns ausdrücklich entschuldigen.
Update 09:50: Der Fehler ist vermutlich durch einen ARP-Adressen-Konflikt erzeugt worden und muss lokal im RZ behoben werden. Voraussichtliche Wiederherstellung der Konnektivität ist 11:00.
Update 16:00: Der Fehler wurde um 12:00 endgültig behoben.
Ursache war im Ursprung eine Fehlkonfiguration, die eine Netzwerkschleife und damit einen Paketsturm erzeugt hat. Zusätzlich gab es ein Fehlverhalten in der Switch-Hardware des Rechenzentrumsbetreibers, wodurch auch nach Beseitung des Paketsturms die Konnektivität nicht wieder hergestellt werden konnte und nach langwieriger Analyse erst durch vollständigen Reset des Switches wieder verfügbar war.
Die Fehlkonfiguration kam im Rahmen des Ausbaus unserer Kapazitäten zustande, wofür wir uns ausdrücklich entschuldigen.
Ausfall der Rechenzentrums-Anbindung
Am heutigen Freitag, dem 6. Juni 2008, ist in der Zeit von 15:30-16:30 Uhr die Außenanbindung unseres Rechenzentrums zusammengebrochen. Das hat dazu geführt, dass sämtliche Server nicht erreichbar waren. Wir entschuldigen uns für die entstandenen Unannehmlichkeiten.
Ursache war laut Aussage des Rechenzentrumsbetreibers ein Fehler in den Routing-Tabellen. Das Problem lag damit außerhalb unseres Einflussbereichs.
Ursache war laut Aussage des Rechenzentrumsbetreibers ein Fehler in den Routing-Tabellen. Das Problem lag damit außerhalb unseres Einflussbereichs.
Downtime Mailserver am Donnerstag
Am Donnerstag, dem 17.04.2008, müssen wir den Mailserver in der Zeit zwischen 18 und 19 Uhr herunterfahren, um den Hauptspeicher zu erweitern. In der Zeit können keine Mails verschickt oder abgerufen werden. Es ist nicht zu erwarten, dass Mails verloren gehen. Die Mailzustellung wird sich jedoch verzögern.
Der Hintergrund ist, dass der Mailserver in der Vergangenheit sehr stark ausgelastet war. Durch die RAM-Erweiterung werden wir die Leistungsfähigkeit und Zuverlässigkeit erhöhen.
Der Hintergrund ist, dass der Mailserver in der Vergangenheit sehr stark ausgelastet war. Durch die RAM-Erweiterung werden wir die Leistungsfähigkeit und Zuverlässigkeit erhöhen.
Subscribe to:
Posts (Atom)