Комплексный мониторинг инфраструктуры
Задача: Обеспечить прозрачность работы сетевого оборудования и серверов с оперативным мониторингом в Telegram. Главный приоритет — точная фиксация времени перехода серверных ИБП (источников бесперебойного питания) на питание от батарей и их возвращения на питание от электросети, а также контроль состояния сетевого оборудования. Приятным бонусом было добавлено еще контроль степени нагрузки корпоративной WiFi-сети.
Решение (Стек: Zabbix, Ubuntu Server, Python, systemd, Telegram API, Smart-UPS 3000XL, Smart-UPS SRT 10000):
- Развернута система мониторинга Zabbix для контроля состояния серверов и сетевого оборудования с настройкой кастомных триггеров и отправкой алертов в Telegram.
- Разработан отдельный Python-скрипт для точного отслеживания состояния серверных ИБП.
- В качестве дополнительного функционала к скрипту интегрировано взаимодействие с API контроллера UniFi для параллельного мониторинга статуса точек доступа Wi-Fi.
- Скрипт развернут на базе Ubuntu Server как systemd service для гарантированной бесперебойной работы в фоновом режиме.
- Все уведомления сведены в единого Telegram-бота для максимального удобства дежурного администратора.
Результат: Создана единая, отказоустойчивая экосистема мониторинга. Обеспечено мгновенное информирование о отключении электроэнергии в серверной комнате и другого оборудования на территории предприятия, что критически важно в текущих условиях работы в Украине. Время реакции на инциденты с питанием или "почему плохо работает Wi-Fi" сократилось благодаря пушам в мессенджер и быстрому пониманию, что произошло.
Решение (Стек: Zabbix, Ubuntu Server, Python, systemd, Telegram API, Smart-UPS 3000XL, Smart-UPS SRT 10000):
- Развернута система мониторинга Zabbix для контроля состояния серверов и сетевого оборудования с настройкой кастомных триггеров и отправкой алертов в Telegram.
- Разработан отдельный Python-скрипт для точного отслеживания состояния серверных ИБП.
- В качестве дополнительного функционала к скрипту интегрировано взаимодействие с API контроллера UniFi для параллельного мониторинга статуса точек доступа Wi-Fi.
- Скрипт развернут на базе Ubuntu Server как systemd service для гарантированной бесперебойной работы в фоновом режиме.
- Все уведомления сведены в единого Telegram-бота для максимального удобства дежурного администратора.
Результат: Создана единая, отказоустойчивая экосистема мониторинга. Обеспечено мгновенное информирование о отключении электроэнергии в серверной комнате и другого оборудования на территории предприятия, что критически важно в текущих условиях работы в Украине. Время реакции на инциденты с питанием или "почему плохо работает Wi-Fi" сократилось благодаря пушам в мессенджер и быстрому пониманию, что произошло.