Samenvatting | |
---|---|
Begin | 2017-04-12 07:22:00 |
Eind | 2017-04-12 09:05:00 |
Getroffen | Gebruikers van virtuele machines die draaien op de hosts vos of wolf |
Een unattended update van de virtuele hosting software (libvirt) en een daardoor getriggerde herstart van de netwerk-stack, zorgde ervoor dat de virtuele machines niet meer bereikbaar waren op het netwerk. Na een reboot van de virtuele hosts (vos en wolf), waren de virtuele machines weer bereikbaar. Er werd niet direct actie ondernomen, omdat de alarmeringsmailtjes ons, door het onbereikbaar zijn van de mailservers, niet konden bereiken. Om een dergelijke situatie te voorkomen, worden stappen ondernomen om de alarmering ook via alternatieve kanalen te routeren (sms, whatsapp, signal, etc). Daarnaast is de netwerk-configuratie van de virtuele machines aangepast, hopelijk is deze daardoor minder storingsgevoelig.
Getroffen diensten:
- Email: smtp1, smtp2, mx1 (mail servers)
- Web services: est2, redmine2 (webserver, redmine server van blackholecam.org)
- Windows gebruikers: ms3 (windows login server), bfacdc03, bfacdc04 (windows domain controllers)
- GitLab gebruikers: gitlab.science.ru.nl, gitlab.pep.cs.ru.nl (GitLab servers)