Дашборды мониторинга

ℹ️ О дашбордах мониторинга

Дашборд мониторинга — центральное место для контроля состояния всей IT-инфраструктуры. Он предоставляет наглядную визуализацию ключевых метрик производительности, позволяет быстро выявлять проблемные узлы и принимать оперативные решения.

Обзор дашборда

Дашборд мониторинга предоставляет структурированный обзор состояния всей IT-инфраструктуры на одном экране. Информация организована в виде виджетов, каждый из которых отвечает за конкретную категорию метрик.

Путь к дашборду

Для доступа к дашборду мониторинга перейдите в раздел меню Мониторинг.

Структура дашборда

Основные секции

  • Статус узлов — визуализация количества онлайн/офлайн узлов
  • Бизнес-сервисы — состояние бизнес-сервисов с индикацией здоровья
  • Системные ресурсы — топы узлов по загрузке ЦПУ, ОЗУ и дисков
  • Дисковая подсистема — метрики производительности дисков (IOPS, время отклика, скорость чтения/записи)
  • Сетевая активность — топы узлов по скорости передачи данных
  • Сетевое соединение — потери пакетов и время отклика
  • События мониторинга — недоступные узлы, устаревшие агенты, переопределенные настройки
✅ Автоматическое обновление

Данные на дашборде автоматически обновляются каждую минуту, обеспечивая актуальность информации в режиме реального времени.

Общее состояние инфраструктуры

Статус узлов

Виджет "Статус узлов" отображает круговую диаграмму с распределением узлов по состоянию доступности.

Статус Цвет Описание
Онлайн Зеленый Узлы доступны и отвечают на ping-запросы
Офлайн Красный Узлы недоступны или не отвечают на ping-запросы

Диаграмма показывает процентное соотношение узлов в каждом состоянии, что позволяет быстро оценить общее состояние инфраструктуры.

Бизнес-сервисы

Виджет "Бизнес-сервисы" отображает таблицу до 10 бизнес-сервисов с индикацией их состояния здоровья.

Определение здоровья сервиса

Здоровье бизнес-сервиса определяется автоматически на основе состояния входящих в него узлов:

  • Здоров (Healthy) — все узлы сервиса работают нормально, нет активных инцидентов мониторинга
  • Нездоров (Unhealthy) — на одном или нескольких узлах сервиса есть активные инциденты

При нажатии на название сервиса открывается модальное окно с детальной информацией о сервисе, списком узлов и связанными инцидентами.

💡 Создание бизнес-сервисов

Если бизнес-сервисы еще не созданы, виджет отображает подсказку с кнопкой для создания нового сервиса. Объединяйте связанные узлы в логические сервисы для удобного контроля их состояния.

Мониторинг системных ресурсов

Дашборд включает три виджета для мониторинга основных системных ресурсов, каждый из которых отображает топ-10 узлов с наибольшим использованием.

Топ-10 по загрузке ЦПУ

Виджет показывает узлы с наивысшей загрузкой процессора в процентах.

Отображаемая информация

  • Название узла — кликабельная ссылка для открытия детальной информации
  • Загрузка ЦПУ — прогресс-бар с процентом загрузки, автоматически меняющий цвет в зависимости от порогов

Топ-10 по загрузке ОЗУ

Виджет отображает узлы с наибольшим использованием оперативной памяти.

Отображаемая информация

  • Название узла — кликабельная ссылка
  • Загрузка ОЗУ — прогресс-бар с процентом использования памяти

Цветовая индикация ресурсов

Прогресс-бары автоматически меняют цвет в зависимости от настроенных порогов:

Уровень Цвет Условие
Норма Зеленый Значение ниже порога предупреждения
Предупреждение Оранжевый Значение между порогом предупреждения и критическим порогом
Критическое Красный Значение превышает критический порог
⚙️ Настройка порогов

Пороги предупреждения и критические пороги настраиваются в параметрах системы. По умолчанию используются рекомендуемые значения.

Производительность дисковой подсистемы

Секция "Производительность дисковой подсистемы" объединяет виджеты для детального мониторинга состояния дисков.

⚠️ Требование агентов

Метрики дисковой подсистемы доступны только для узлов с установленными агентами мониторинга. Без агентов эта секция не отображается.

Топ-10 по времени отклика диска

Показывает узлы и диски с наибольшим временем отклика (задержкой) дисковой подсистемы.

Отображаемая информация

  • Узел — название узла
  • Диск — имя диска или раздела
  • Время отклика — задержка в миллисекундах с цветовой индикацией

Топ-10 по скорости передачи с/на диск

Отображает узлы с максимальной суммарной скоростью передачи данных (чтение + запись) на дисковую подсистему.

Отображаемая информация

  • Узел — название узла
  • Диск — имя диска
  • Скорость передачи — значение в МБ/с

Топ-10 по IOPS диска

Показывает узлы с наибольшим количеством операций ввода-вывода в секунду (IOPS).

Отображаемая информация

  • Узел — название узла
  • Диск — имя диска
  • Операций/с — количество операций ввода-вывода

Топ-10 по занятому месту на диске

Отображает узлы с наибольшим процентом заполнения дискового пространства.

Отображаемая информация

  • Узел — название узла
  • Диск — прогресс-бар с процентом заполнения и цветовой индикацией

Топ-10 по скорости чтения с диска

Показывает узлы с максимальной скоростью чтения данных с диска.

Отображаемая информация

  • Узел — название узла
  • Диск — имя диска
  • Скорость чтения — значение в МБ/с

Топ-10 по скорости записи на диск

Отображает узлы с максимальной скоростью записи данных на диск.

Отображаемая информация

  • Узел — название узла
  • Диск — имя диска
  • Скорость записи — значение в МБ/с
🔍 Фильтрация устаревших метрик

Система автоматически исключает устаревшие метрики из топов. По умолчанию используются только данные не старше 10 минут, что предотвращает отображение показателей отключенных дисков или остановленных узлов.

Сетевая активность

Секция "Сетевая активность" предоставляет детальную информацию о загрузке сетевых интерфейсов.

Топ-10 по скорости сети (общая)

Показывает сетевые интерфейсы с наибольшей суммарной скоростью передачи данных (прием + отправка).

Отображаемая информация

  • Узел — название узла
  • Интерфейс — имя сетевого интерфейса
  • Скорость — суммарная скорость в Мбит/с с цветовой индикацией

Топ-10 по скорости сети (прием)

Отображает интерфейсы с максимальной скоростью приема (входящего трафика).

Отображаемая информация

  • Узел — название узла
  • Интерфейс — имя интерфейса
  • Прием — скорость приема в Мбит/с

Топ-10 по скорости сети (передача)

Показывает интерфейсы с максимальной скоростью отправки (исходящего трафика).

Отображаемая информация

  • Узел — название узла
  • Интерфейс — имя интерфейса
  • Передача — скорость отправки в Мбит/с
💡 Детализация по интерфейсам

Один узел может присутствовать в топе несколько раз, если у него несколько активных сетевых интерфейсов с высокой загрузкой. Это позволяет отслеживать загрузку каждого интерфейса отдельно.

Состояние сетевого соединения

Секция "Состояние сетевого соединения" отображает метрики качества связи с узлами на основе ping-мониторинга.

Топ-10 по потере пакетов

Показывает узлы с наибольшим процентом потери пакетов за выбранный период.

Отображаемая информация

  • Узел — название узла
  • Потери пакетов — процент потерянных пакетов с цветовой индикацией
Уровень потерь Цвет Значение
Норма Зеленый ≤ 5%
Предупреждение Оранжевый 5% - 20%
Критическое Красный > 20%

Топ-10 по времени отклика сети

Отображает узлы с наибольшим средним временем отклика (ping RTT) за выбранный период.

Отображаемая информация

  • Узел — название узла
  • Время отклика — среднее время отклика в миллисекундах с цветовой индикацией
Качество связи Цвет Время отклика
Отличное Зеленый ≤ 50 мс
Приемлемое Оранжевый 50 - 200 мс
Плохое Красный > 200 мс
ℹ️ Исключение недоступных узлов

Недоступные (офлайн) узлы автоматически исключаются из топов по потере пакетов и времени отклика, так как для них метрики не актуальны.

События и предупреждения

Секция "События мониторинга и настройки" содержит важные уведомления и информацию о проблемных узлах.

Недоступные узлы сети

Виджет отображает таблицу всех недоступных (офлайн) узлов.

Отображаемая информация

  • Узел — название узла с кликабельной ссылкой
  • Путь — расположение узла в иерархии
  • Последний отклик — время последнего успешного ping-ответа
  • Статус — бейдж "Недоступен"

Таблица поддерживает пагинацию при количестве записей более 10. Счетчик недоступных узлов отображается в заголовке виджета.

Узлы с устаревшими версиями агентов

Виджет показывает узлы, на которых установлены устаревшие версии агентов мониторинга.

Отображаемая информация

  • Узел — название узла
  • Текущая версия — дата сборки установленного агента
  • Последняя версия — дата сборки актуальной версии

Счетчик устаревших агентов отображается в заголовке виджета. При отсутствии устаревших агентов показывается сообщение "Все агенты актуальны".

✅ Автоматическое обновление

Используйте массовое обновление агентов через раздел управления агентами для поддержания всех агентов в актуальном состоянии.

Узлы с переопределенными параметрами триггеров

Виджет отображает узлы, для которых были изменены стандартные пороги срабатывания триггеров мониторинга.

Что отображается

Список узлов, у которых настроены индивидуальные пороги для:

  • Загрузки CPU (порог предупреждения или критический)
  • Использования RAM (порог предупреждения или критический)
  • Заполнения дисков (порог предупреждения или критический)

Это помогает отслеживать узлы с нестандартными настройками мониторинга, что важно при аудите конфигурации системы.

Выбор периода и обновление

Фильтр периода

В верхней части дашборда расположен выпадающий список для выбора периода отображения данных.

Период Длительность Применяется к
Сегодня 1 день Метрикам потери пакетов и времени отклика
Неделя 7 дней Метрикам потери пакетов и времени отклика
Месяц 30 дней Метрикам потери пакетов и времени отклика
Квартал 90 дней Метрикам потери пакетов и времени отклика
ℹ️ Влияние периода

Выбор периода влияет на расчет средних значений потери пакетов и времени отклика сети. Остальные метрики (CPU, RAM, диски, сеть) всегда показывают текущие значения.

Обновление данных

Дашборд предоставляет несколько способов обновления данных:

Способы обновления

  • Автоматическое обновление — происходит каждые 60 секунд без участия пользователя
  • Кнопка обновления — расположена в правом верхнем углу, позволяет обновить данные немедленно
  • При изменении периода — данные автоматически обновляются при выборе другого периода

Индикация загрузки

Во время загрузки данных каждый виджет отображает анимированный индикатор загрузки (спиннер), что помогает понять, что данные обновляются.

Рекомендации

Эффективное использование дашборда

Регулярный мониторинг

  • Держите дашборд открытым на дополнительном мониторе для постоянного контроля состояния инфраструктуры
  • Обращайте внимание на красные и оранжевые индикаторы — они сигнализируют о проблемах
  • Используйте бейджи на виджетах (недоступные узлы, устаревшие агенты) для быстрой оценки количества проблем

Анализ трендов

  • Изменяйте период просмотра для выявления долгосрочных проблем с сетью
  • Если узел постоянно присутствует в топе по загрузке ресурсов — это сигнал для масштабирования или оптимизации
  • Высокие потери пакетов за длительный период могут указывать на проблемы с сетевым оборудованием

Быстрая диагностика

  • Кликайте на названия узлов в таблицах для открытия детальной информации и графиков мониторинга
  • Начинайте диагностику с виджета недоступных узлов — проверьте связь и доступность
  • Обращайте внимание на виджеты дисковой подсистемы — высокий IOPS или время отклика могут указывать на проблемы с производительностью

Проактивное управление

Установка агентов

Если виджет показывает уведомление об установке агентов:

  1. Перейдите к управлению агентами через кнопку в уведомлении
  2. Установите агенты на критически важные серверы в первую очередь
  3. После установки агентов дашборд автоматически начнет отображать расширенные метрики

Обслуживание агентов

  • Регулярно проверяйте виджет устаревших агентов
  • Обновляйте агенты сразу после выхода новых версий для получения улучшений и исправлений
  • Используйте массовое обновление для экономии времени

Настройка бизнес-сервисов

  • Создавайте бизнес-сервисы для группировки связанных узлов (например, веб-сервер + база данных + кеш)
  • Отслеживайте здоровье критических сервисов через виджет бизнес-сервисов
  • При возникновении проблем с сервисом быстро переходите к детальной информации о всех входящих узлах

Оптимизация производительности

Работа с большими инфраструктурами

  • Дашборд оптимизирован для работы с сотнями узлов благодаря топам и фильтрации
  • Используйте фильтрацию устаревших метрик для исключения неактуальных данных
  • Автоматическое обновление каждую минуту сбалансировано для минимизации нагрузки на сервер
✅ Совет

Используйте дашборд мониторинга как отправную точку для диагностики проблем. Выявив проблемный узел в топе, переходите к детальной информации и графикам для глубокого анализа.