Nagios Core
Nagios Core -- представляет собой бесплатное компьютерное программное приложение с открытым исходным кодом, которое контролирует системы, сети и инфраструктуру. Nagios предлагает услуги мониторинга и оповещения для серверов, коммутаторов, приложений и служб. Он предупреждает пользователей, когда что-то идет не так, и предупреждает их во второй раз, когда проблема решена.
Изначально Nagios был разработан для работы под Linux, но он также работает и на других вариантах Unix. Это бесплатное программное обеспечение, распространяемое по лицензии GNU General Public License версии 2, опубликованной Free Software Foundation.
Возможности
- Мониторинг сетевых служб (SMTP, POP3, HTTP, NNTP, ICMP, SNMP)
- Мониторинг состояния хостов (загрузка процессора, использование диска, системные логи) в большинстве сетевых операционных систем
- Поддержка удаленного мониторинга через шифрованные туннели SSH или SSL
- Простая архитектура модулей расширений (плагинов) позволяет, используя любой язык программирования по выбору (Shell, C++, Perl, Python, PHP, C# и др.) легко разрабатывать свои собственные способы проверки служб
- Параллельная проверка служб
- Возможность определять иерархии хостов сети с помощью «родительских» хостов, позволяет обнаруживать и различать вышедшие из строя хосты и те, которые недоступны
- Отправка уведомлений в случае возникновения проблем со службой или хостом (с помощью почты, пейджера, смс или любым другим способом, определенным пользователем через модуль системы)
- Возможность определять обработчики событий, произошедших со службами или хостами для проактивного решения проблем
- Автоматическая ротация лог-файлов
- Возможность организации совместной работы нескольких систем мониторинга с целью повышения надежности и создания распределенной системы мониторинга
- Включает в себя утилиту nagiostats, выводящую общий свод по всем хостам, за которыми ведется мониторинг
Использование Nagios Core на наших серверах
Для мониторинга систем, установлен Nagios Core. Используя агентов слежения, он отслеживает работу всех серверов системы, включая:
- Доступность сетевых услуг (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, FTP, SSH).
- Использование ресурсов (processor load, disk usage, system logs, количество активных пользователей).
- Доступность баз данных (в настоящее время -- MariaDB Server, в перспективе -- отслеживание и других услуг кластеров).
- Состояние сертификатов SSL. Для отслеживания сертификатов, несколько инструментов не подошли, показывали срок действия один на все домены. Выбор был остановлен на check_ssl_cert. Отслеживаемые домены были объеденины в host groups и единую сервисную группу. Результат удовлетворительный. Нужно будет подобавлять все нужные домены.