Kompleksowe monitorowanie infrastruktury
Zadanie: Zapewnić przejrzystość pracy sprzętu sieciowego i serwerów z bieżącym monitoringiem w Telegramie. Główny priorytet — dokładna rejestracja czasu przełączenia serwerowych UPS (zasilaczy awaryjnych) na zasilanie z baterii oraz ich powrotu na zasilanie z sieci elektrycznej, a także kontrola stanu sprzętu sieciowego. Miłym bonusem było dodanie jeszcze kontroli stopnia obciążenia korporacyjnej sieci WiFi.
Rozwiązanie (Stos: Zabbix, Ubuntu Server, Python, systemd, Telegram API, Smart-UPS 3000XL, Smart-UPS SRT 10000):
- Rozbudowano system monitoringu Zabbix do kontroli stanu serwerów i sprzętu sieciowego z konfiguracją niestandardowych triggerów i wysyłką alertów do Telegrama.
- Opracowano osobny skrypt Python do dokładnego śledzenia stanu serwerowych UPS.
- Jako dodatkową funkcjonalność do skryptu zintegrowano interakcję z API kontrolera UniFi do równoległego monitorowania statusu punktów dostępowych Wi-Fi.
- Skrypt uruchomiono na bazie Ubuntu Server jako usługa systemd dla gwarantowanej nieprzerwanej pracy w tle.
- Wszystkie powiadomienia zebrano w jednego bota Telegram dla maksymalnej wygody dyżurnego administratora.
Wynik: Stworzono jedną, odporną na awarie ekosystem monitoringu. Zapewniono natychmiastowe informowanie o braku zasilania w serwerowni oraz innego sprzętu na terenie przedsiębiorstwa, co jest krytycznie ważne w obecnych warunkach pracy w Ukrainie. Czas reakcji na incydenty z zasilaniem lub "dlaczego Wi-Fi działa źle" skrócił się dzięki powiadomieniom w komunikatorze i szybkiemu zrozumieniu, co się stało.
Rozwiązanie (Stos: Zabbix, Ubuntu Server, Python, systemd, Telegram API, Smart-UPS 3000XL, Smart-UPS SRT 10000):
- Rozbudowano system monitoringu Zabbix do kontroli stanu serwerów i sprzętu sieciowego z konfiguracją niestandardowych triggerów i wysyłką alertów do Telegrama.
- Opracowano osobny skrypt Python do dokładnego śledzenia stanu serwerowych UPS.
- Jako dodatkową funkcjonalność do skryptu zintegrowano interakcję z API kontrolera UniFi do równoległego monitorowania statusu punktów dostępowych Wi-Fi.
- Skrypt uruchomiono na bazie Ubuntu Server jako usługa systemd dla gwarantowanej nieprzerwanej pracy w tle.
- Wszystkie powiadomienia zebrano w jednego bota Telegram dla maksymalnej wygody dyżurnego administratora.
Wynik: Stworzono jedną, odporną na awarie ekosystem monitoringu. Zapewniono natychmiastowe informowanie o braku zasilania w serwerowni oraz innego sprzętu na terenie przedsiębiorstwa, co jest krytycznie ważne w obecnych warunkach pracy w Ukrainie. Czas reakcji na incydenty z zasilaniem lub "dlaczego Wi-Fi działa źle" skrócił się dzięki powiadomieniom w komunikatorze i szybkiemu zrozumieniu, co się stało.