Мониторинг доступности

ℹ️ О мониторинге доступности

Система мониторинга доступности в INFRAX автоматически отслеживает доступность узлов сети с помощью ping-запросов, измеряет время отклика (RTT), определяет потерю пакетов и сохраняет историю для анализа проблем с доступностью.

Обзор системы

Мониторинг доступности — это базовая функция системы INFRAX, которая обеспечивает непрерывный контроль состояния узлов сети.

Возможности мониторинга доступности

  • Периодическая проверка доступности — автоматические ping-запросы к узлам сети
  • Измерение времени отклика (RTT) — контроль задержек сетевого соединения
  • Определение потери пакетов — выявление проблем с качеством канала
  • История данных — сохранение статистики для анализа
  • Визуализация — графики доступности и времени отклика
  • Автоматическое создание тикетов — оповещение о проблемах с доступностью

Ping-мониторинг

Система выполняет периодическую проверку доступности узлов сети с помощью ICMP ping-запросов.

Измеряемые параметры

Параметр Описание Единица измерения
Доступность Состояние узла (онлайн/офлайн) Логическое значение
Время отклика (RTT) Задержка сетевого соединения Миллисекунды (мс)
Потеря пакетов Процент потерянных пакетов при опросе Проценты (%)

Как работает проверка

  1. Система периодически отправляет ping-запросы к узлам сети
  2. При получении ответа фиксируется время отклика
  3. Если узел не отвечает, счетчик неудачных попыток увеличивается
  4. При превышении порога неудачных попыток узел помечается как недоступный
  5. Все данные сохраняются для построения истории доступности

Настройка мониторинга

Настройки мониторинга доступности находятся в модальном окне редактирования узла на вкладке Мониторинг.

Доступ к настройкам

  1. Откройте модальное окно узла (двойной клик или кнопка "Редактировать")
  2. Перейдите на вкладку Мониторинг
  3. Найдите карточку Мониторинг доступности

Параметры настройки

Создание инцидентов

Система может автоматически создавать тикеты при недоступности узла:

  • Создание тикетов при недоступности — включение/отключение автоматического создания тикетов
  • Автоматическое закрытие тикетов — закрытие тикета при восстановлении доступности

Количество неудачных попыток

Настройка порога для определения недоступности узла:

  • Диапазон значений: от 1 до 20 попыток
  • Чем больше значение, тем меньше ложных срабатываний при кратковременных сбоях
  • Рекомендуемое значение: 3-5 попыток
💡 Наследование настроек

Настройки мониторинга можно задать на уровне папки, и они автоматически применятся ко всем вложенным узлам. При необходимости любой узел может переопределить унаследованные значения.

Просмотр данных доступности

Данные о доступности узла можно просмотреть на вкладке Мониторинг в модальном окне узла.

Интерфейс просмотра

График доступности

График показывает историю ping-мониторинга:

  • Линия графика отображает время отклика (RTT)
  • Красные точки указывают на периоды недоступности узла
  • Розовые области показывают пропуски данных
  • Красные треугольники над точками обозначают периоды недоступности с детальной информацией

Выбор временного интервала

Система предоставляет предустановленные интервалы для просмотра:

Интервал Описание Рекомендуется для
1 час Последний час Текущий мониторинг
2 часа Последние 2 часа Недавние события
4 часа Последние 4 часа Анализ за смену
12 часов Последние 12 часов Анализ за рабочий день
Сутки Последние 24 часа Ежедневный анализ
Неделя Последние 7 дней Еженедельный анализ
Месяц Последние 30 дней Долгосрочная статистика
Задать... Произвольный период Специальный анализ

Управление просмотром

Доступные элементы управления:

  • Назад / Вперёд — навигация по временным интервалам
  • Обновить — перезагрузка данных за текущий интервал
  • Сбросить — возврат к интервалу "1 час" от текущего времени
  • Зум — клик по точке на графике увеличивает масштаб вокруг нее (период уменьшается вдвое)
⚠️ Оптимизация отображения

При большом количестве точек данных (более нескольких тысяч) система автоматически выполняет оптимизацию, оставляя только наиболее показательные точки. Это обеспечивает быструю загрузку и плавную работу графика.

Периоды недоступности

Для режима ping доступна детальная информация о периодах недоступности узла.

Информационный баннер

Под графиком отображается один из двух баннеров:

  • Зелёный баннер — "За выбранный период не зарегистрировано событий недоступности"
  • Красный баннер — "За выбранный период зарегистрировано N событий недоступности" с кнопкой Подробнее

Таблица периодов недоступности

При нажатии кнопки Подробнее график заменяется таблицей с детальной информацией:

Колонка Описание
Начало периода Дата и время начала недоступности
Конец периода Дата и время восстановления доступности
Длительность Общая продолжительность недоступности

Для возврата к графику нажмите кнопку Вернуться в баннере.

Дашборд мониторинга

Сводная информация о доступности узлов доступна на дашборде мониторинга, который включает виджеты с круговой диаграммой статуса узлов, списком недоступных узлов и топами по потере пакетов и времени отклика.

Подробнее о дашборде мониторинга читайте в разделе Дашборды мониторинга.

Рекомендации

Настройка порогов

Выбор количества неудачных попыток

  • Для критичных узлов — используйте меньшее значение (2-3 попытки) для быстрого оповещения
  • Для удалённых узлов — используйте большее значение (5-7 попыток) для снижения ложных срабатываний
  • Для нестабильных каналов — увеличьте порог до 10 попыток

Анализ данных

Регулярный мониторинг

  • Проверяйте дашборд мониторинга ежедневно для выявления проблем
  • Анализируйте периоды недоступности для поиска закономерностей
  • Обращайте внимание на узлы с высокой потерей пакетов
  • Используйте графики для определения пиковых нагрузок

Автоматизация реагирования

Настройка создания тикетов

  • Включите автоматическое создание тикетов для критичных узлов
  • Используйте автоматическое закрытие тикетов для снижения ручной работы
  • Настройте уведомления в Telegram для оперативного реагирования
✅ Лучшая практика

Регулярно анализируйте топ-10 узлов по потере пакетов и времени отклика. Высокие значения могут указывать на проблемы с сетевым оборудованием или перегрузку каналов связи, требующие внимания сетевых администраторов.