Statusmeldungen
Ausfall DHCP-Service zwischen 7:36 und 8:32 Uhr
19.09.2023 08:40 Uhr
Kategorie: Datennetze
Aufgrund des Ausfalls aller am Anycast-DHCP-Service partizipierenden Nodes kam es zwischen 7:36 Uhr und 8:32 Uhr nach Ausfall des letzten funktionierenden Nodes zum Komplettausfall des DHCP-Service. Damit funktionierten im genannten Zeitraum zahlreiche Dienste auf dem Campus nicht ordnungsgemäß.
Details zur Ursache und einen Plan zur Verbesserung der Resilienz des Dienstes geben wir noch bekannt.
Update (11:05 Uhr): Eine Race-Condition im Update-Prozess der DHCP-Service-Nodes unseres Anycast-DHCP-Clusters war die Ursache für die Abschaltung aller Nodes. Dies geschah über die Nacht verteilt nacheinander auf allen Nodes. Erst nach dem Abschalten des letzten Nodes heute früh um 7:36 Uhr stand der Dienst nicht mehr zur Verfügung.
Die Race-Condition existiert inzwischen nicht mehr, wir haben den Prozess entsprechend korrigiert.