Zabbix Мониторинг Raid 5,9/10 7382 votes

Для установки агента выполните # apt-get install zabbix-agent C. Настройка конфига Zabbix # nano /etc/zabbix/zabbixagentd.conf UserParameter=mdadm.status,egrep -c '. ' /proc/mdstatPidFile=/var/run/zabbix/zabbixagentd.pid LogFile=/var/log/zabbix-agent/zabbixagentd.log LogFileSize=0 Server=192.168.3.10 ServerActive=192.168.3.10 Hostname=zabbix.domain.ru D.

Стартуем Zabbix Запускаем агент и добавляем в автозагрузку: # systemctl start zabbix-agent # systemctl enable zabbix-agent Проверим работу этого параметра выделенного желтым цветом # zabbixagentd -t mdadm.status mdadm.status t 0.

Встроенный мониторинг Proxmox Proxmox имеет ограниченные возможности мониторинга, встроенные в GUI; однако, он действительно испытывает недостаток в обширном и надёжном мониторинге, который обычно присутствует в законченном решении мониторинга. Proxmox поставляется со встроенными графиками на основании RRD для отображения истории применения ресурсов и производительности данных сроком до 1 года.

Есть зоопарк серверов, надо сделать так чтобы при малейшем вздохе со стороны винтов в raid. Zabbix raid monitoring. Возникла потребность мониторить состояние хардварного рейда. Мониторинг контроллеров от Intel с помощью Zabbix. Продолжая тему мониторинга контроллеров, опишу процесс настройки мониторинга для контроллеров Intel. Для работы с этими контроллерами используется весьма функциональная утилита megacli, которая позволяет творить более серъезные вещи чем просто мониторинг. Алгоритм прежний: Устанавливаем необходимое ПО; Пишем скрипт сбора данных; Правим конфигурацию агента zabbix; Импортируем шаблон. Постановка задачи. Есть заббикс, есть сервер с sata-дисками внутри без raid-контроллера.

Применяя этот инструмент, мы можем анализировать тенденции производительности ресурса за некий период времени. Все данные о потреблении и производительности находятся в меню с закладками Summary как для узлов Proxmox, так и для виртуальных машин. Мы можем просматривать данные на основе почасового, ежедневного, еженедельного или за год периодов. Следующий снимок экрана отображает страницу Summary узла pm4-1 с ниспадающим списком для выбора периода данных. Совет Мы можем сортировать этот список по Type, Description, Disk usage, Memory usage, CPU usage и Uptime, кликнув по заголовку соответствующей колонки.

В этом списке отсутствуют исторические данные. Он отображает потребление ресурсов только в реальном масштабе времени. Мы можем усилиться данными S.M.A.R.T. Для дисковых устройств, чтобы получать автоматические электронные сообщения от вашего узла Proxmox, когда присутствуют существенные проблемы, происходящие на любом дисковом устройстве в этом узле.

Для этого нам необходимо установить инструментарий мониторинга Smart при помощи следующей команды: # apt-get install smartmontools. В случае, если возникла существенная проблема с любым дисковым устройством в вашем узле Proxmox, будет отослано автоматическое электронное сообщение с именем того узла, где возникла проблема и природой данного отказа или проблемой для данного дискового устройства. Электронное почтовое сообщение также отобразит детализацию самого данного устройства, такую как серийный номер и идентификатор дискового устройства.

Следующий снимок экрана отображает пример некоего электронного почтового сообщения, полученного от узла pm4-1 с ошибкой сектора для устройства /dev/sda с серийным номером V1FA516P: This message was generated by the smartd daemon running on: host name: pm4-1 DNS domain: domain.com The following warning/error was logged by the smartd daemon: Device: /dev/sda SAT, 8 Offline uncorrectable sectors Device info: ST2000DM001-1CH164, S/N:V1FA516P, WWN:5-00e51c, FW:CC26, 2.00 TB For details see host's SYSLOG. You can also use the smartctl utility for further investigation. The original message about this issue was sent at Sat Feb 13 09: MST Another message will be sent in 24 hours if the problem persists. Если та же самая ошибка продолжит возникать, данный узел Proxmox будет отсылать данное электронное сообщение каждые 24 часа. Основываясь на содержащейся в данном электронном сообщении информации мы можем установить данное устройство и заменить его в случае такой необходимости. Как мы можем видеть, Proxmox действительно не имеет надёжной системы мониторинга и очень вероятно, не будет иметь её когда- либо. Его мощность заключается в том, что он является великолепным гипервизором, а не системой мониторинга.

Тем не менее, мы легко можем заполнить этот пробел при помощи системы мониторинга стороннего производителя, например, Zabbix. Настройка Zabbix После того, как сервер Zabbix установлен и работает, мы должны настроить адрес электронной почты с тем, чтобы мы автоматически получали сообщения в электронном виде всякий раз, когда возникают проблемы. Zabbix 3.0 имеет возможность отправлять электронную почту через SMTP. Мы можем настроить его переместившись в меню Administation Media types и изменив свою информацию SMTP в Bold.

После того как настройка электронной почты завершена, самое время добавить какие- нибудь хосты или устройства для нчала мониторинга. Перейдите в Configuration Hosts и кликните по Create Host.

Наберите в Hostname и Visible имя. Имя хоста должно соответствовать имени хоста, введённому в файле настройки агента Zabbix данного хоста. Отображаемое (Visible) имя может быть любым. Выберите соответствующую Group. Так как мы добавляем узел хоста Proxmox, нам нужно выбрать Hypervisors as Group. Если мы добавляем хост с установленным агентом, наберите IP адрес этого хоста в блоке Agent interfaces.

По умолчанию агент прослушивает порт 10050. Если мы используем другой порт, наберите этот порт здесь. Убедитесь, что вы открыли этот порт в своём межсетевом экране если этот хост находится под защитой какого- либо межсетевого экрана. Следующий снимок экрана отображает страницу настройки host после добавления необходимой информации. Кликните на закладку Templates для добавления шаблона в наш хост. В Zabbix шаблоны являются предварительно настроенными группами проверок.

Наберите имя шаблона в текстовом блоке Link new templates или выберите его кликнув по кнопке Select. Данный текстовый блок является блоком со встроенным автоматическим поиском, поэтому имя не обязательно должно быть точным именем искомого шаблона. Для примера мы ввели Linux, что предлагает нам два возможных шаблона.

Мы собираемся выбрать Template OS Linux, что отображено на снимке экрана ниже. Кликните на Add для назначения нужного шаблона данному хосту. Кликните на Host inventory, а затем выберите Automatic чтобы агент Zabbix мог поместить соответствующую информацию о данном хосте, такую как производитель хоста, серийный номер, установленная ОС и тому подобное. Мы также можем ввести данные вручную, такие как Долгота, Широта, Оборудование и Программные средства, установленные на данном узле. Это полезно для построения инвентарного списка. Кликните на Save для завершения добавления данного хоста. Следующие шаги необходимо выполнить для настройки вашего агента Zabbix на хосте.

Откройте файл настройки вашего агента Zabbix в /etc/zabbix/zabbixagentd.conf хоста. Сделайте изменения в следующих строках параметров: Server=172.16.0.172 //IP сервера Zabbix ServerActive=172.16.0.171:10051 //IPServer:ServerPort Hostname=pm4-2 //должен быть тем же, что и Hostname набранный в Zabbix Server для данного хоста Сохраните изменения и выйдите из редактора. Выполните следующую команду для перезапуска данного агента Zabbix на вашем хосте: # service zabbix-agent restart В пределах минуты или около того после добавления вашего хоста, настроенный сервер Zabbix начнёт выполнять автоматические проверки и обнаружит, что ваш хост теперь имеет внутри себя работающего агента. Следующий экранный снимок показывает список хостов в настроенном сервере Zabbix после добавления нашего хоста и настройки его агента. Из данного списка мы также можем обнаружить, что наш шаблон добавил 32 элемента, 15 триггеров и 5 графиков к нашему хосту. Элементами ( Items) является то, что будет проверяться Zabbix, а триггеры ( Triggers) это то, что инициирует определённые действия такие, как отсылка автоматических оповещений для любого события.

Каждый шаблон имеет два элемента обнаружения, которые автоматически собирают информацию установленных и настроенных дисковых устройств и разделов в данном узле. Следующий снимок экрана отображает страницу Triggers для нашего хоста pm4-2.

Отображение данных с применением графиков Zabbix приходит вместе с исключительными графическими возможностями в самой поставке без всякой установки вручную. Как только данные поступают из ресурса, утилиты построения графиков начинают построение графиков применяя исходные данные. Практически все ваши встроенные шаблоны в Zabbix имеют некоторые предварительно определённые элементы построения графиков.

Мы можем получить графики наблюдаемых элементов переместившись в Monitoring Graphs в GUI Zabbix. Следующий снимок показывает график CPU load в промежутке 15 минут для выбранного хоста pm4-2 в нашем примере кластера. На предыдущем снимке экрана мы можем увидеть, что существует пять уже созданных графиков элементов. Мы собираемся добавить новый элемент в CPU iowait time. Кликните по кнопке Create Graph для открытия новой страницы графика элемента. Введите легко понимаемое имя для создаваемого графика элемента.

Мы собираемся назвать его CPU IOWait Time. В расположенном блоке Items кликните на Add для открытия перечня доступных элементов для выбора из него. Для данного примера мы собираемся выбрать CPU iowait time. Мы можем настроить цвет и тип настраиваемого графика. Кликните по кнопке Add, когда вы удовлетворены своими настройками.

Zabbix Мониторинг Raid

Следующий снимок экрана отображает вашу страницу создания графика для нашего примера CPU iowait time. Настройка оповещений о состоянии диска В разделе, который обсуждался ранее в данной главе, мы увидели, что можем усилить S.M.A.R.T. Автоматическим получением электронных сообщений в случае, когда возникают какие- либо проблемы с дисковыми устройствами. В этом разделе мы собираемся выполнить то же самое, но средствами Zabbix с расширенной функциональностью, например, графиками. Великолепным применением графика для дисковых устройств является мониторинг данных по температуре. Высокая температура является плохим признаком для шпиндельных дисков. Применяя график Zabbix, мы можем наблюдать за точной тенденцией температурного режима в кластере хранения вплоть до отдельного диска и предпринимать соответствующие действия.

Zabbix мониторинг raiders of the lost ark

Zabbix также может отправлять автоматические электронные сообщения при возникновении какой- либо проблемы с любым из наблюдаемых дисков, например, обусловленные плохим сектором ошибки чтения или записи или любые другие события S.M.A.R.T. На сегодняшний день почти все HDD или SDD имеют возможности S.M.A.R.T., которая может собирать различные существенные для жизнеспособности вашего дискового устройства данные. Используя инструменты мониторинга S.M.A.R.T. Мы можем избегать предварительного отказа диска путём определения потенциальных проблем на ранней стадии. Мы можем настроить все узлы Proxmox на отправку сообщений электронной почты при обнаружении любой проблемы на любом из подключённых устройств.

Замечание Отметим, что если устройства подсоединяются через RAID контроллеры и настраиваются в виде какого- либо массива RAID, тогда ваши инструменты S.M.A.R.T. Не будут способны получать данные о состоянии жизнеспособности данных устройств. Установка средств мониторинга SMART Нам необходимо установить smartmontools в нашем хранилище с помощью следующей команды: #apt-get install smartmontools Запросите список всех подключённых дисков при помощи такой команды: #apt-get install smartmontools# fdisk -l Убедитесь, что все подключённые диски имеют функцию S.M.A.R.T. И она включена выполнив приведённую ниже команду: #smartctl –a /dev/sdX Если диск имеет функцию S.M.A.R.T.

И она разрешена, появится нечто подобное показанному на снимке экрана ниже: smartctl 6.4 2014-10-07 r4002 x8664-linux-4.2.8-1-pve (local build) Copyright (C) 2002-2014, Bruce Allen, Christian Franke, www.smartmontools.org ATA device successfully opened Use 'smartctl -a' (or '-x') to print SMART (and more) information Если же данная функция, но по какой- либо причине запрещена, мы можем включить её при помощи следующей команды: #smartctl –s on –a /dev/sdX Настройка агента Zabbix Добавление мониторинга дискового устройства в Zabbix является двухступенчатым процессом. На первом шаге нам нужно добавить аргументы в файл настройки нашего агента Zabbix, а уже после этого добавлять элементы устройств в наш сервер Zabbix для каждого хоста. Такие специальные аргументы называются параметрами пользователя.

Они работают аналогично сценариям (script) в которых мы можем определять команды, предназначенные для выполнения на хосте, после чего агент Zabbix возвращает данные на ваш сервер Zabbix. В данном примере мы собираемся добавить пользовательские параметры для отсылки данных о серийном номере и температуре устройства. Следующие две строки необходимо добавить в конец файла настройки агента в /etc/zabbix/zabbixagentd.conf: UserParameter=hdd.temp.,smartctl -A /dev/$1 grep -E -i '^.($2)' cut -c88-98 UserParameter=hdd.serial.,smartctl -i /dev/$1 grep 'Serial Number' cut -c19- После добавления этих строк нам необходимо осуществить перезапуск агента Zubbix при помощи следующей команды: # service zabbixagentd restart Создание элемента Zabbix в GUI После того как добавлены параметры пользователя, нам нужно создать в сервере Zabbix новые элементы для нашего хоста. Для начала мы добавим элемент для сбора данных температуры для наших устройств. Перейдите в Configuration Hosts Items, а затем кликните на Create item для открытия новой страницы элемента. Следующий снимок экрана показывает эту страницу с необходимыми настройками. Имя элемента может быть любой текстовой строкой.

Поскольку мы извлекаем данные через параметры пользователя своего агента Zabbix, нам необходимо выбрать тип нашего агента. Блок Key является здесь наиболее важным, поскольку это то место, в котором определяется какие данные мы извлекаем. Введённый нами ключ, как это показано на предыдущем снимке экрана, сообщает Zabix о необходимости извлекать температуру устройства для нашего устройства sda. Численное значение 194 в поле ключа используется для обозначения информации о температуре. Каждый атрибут монитора S.M.A.R.T. Имеет уникальный численный идентификатор. Например, если мы хотим собирать данные о неверных счётчиках секторов, код должен быть 197.

Zabbix Мониторинг Raid

Для просмотра полного списка кодов атрибутов монитора S.M.A.R.T. Перейдите по ссылке. Тип информации является ниспадающим списком, применяемым для природы собираемых данных. Поскольку температура является численным значением, мы выбираем тип Numeric. Для увеличения точности собираемой температуры нам необходимо выбрать Decimal в качестве Data type.

Интервал Update является текстовым блоком для ввода секунд, что требует особенного внимания. Именно этот интервал Zabbix будет выдерживать для проверки каждого элемента. По умолчанию Zabbix применяет интервал в 30 секунд. При добавлении проверок с большими объёмами, такими как данные дисковых устройств, чем больше дисковых устройств присутствует в некоем узле, тем больше возрастает объём данных проверок, причём экспоненциально. Для примера, если мы хотим собирать данные устройств для какого- либо узла Ceph с 12 устройствами, Zabbix будет выполнять проверку каждые 30 секунд для всех 12 устройств и это наберёт до сотен проверок за час. Для уменьшения узкого места объёма проверок мы можем установить их на больший интервал. В нашем примере мы используем 2 минуты или 120 секунд для проверки устройств.

Кликните на Add для завершения создания данного элемента. Замечание Отметим, что нам необходимо создавать отдельные новые элементы для каждого устройства, которое нуждается в мониторинге. Изменяйте необходимый идентификатор устройства для каждого элемента, например, sda, sdb, sdc и так далее. Создание спускового устройства в GUI После создания элемента нам необходимо создать спусковое устройство (trigger) с тем, чтобы Zabbix мог отправлять автоматические уведомления электронной почтой если температура выходит за пороговые значения. Для создания спускового устройства перейдите в Configuration Hosts Trigger и кликните по кнопке Create trigger. Следующий снимок экрана отображает страницу создания нового спускового устройства с необходимой введённой информацией.

Zabbix Мониторинг Raiders Of The Lost Ark

OID OID (идентификаторы объекта, Object Identifiers), являются объектами, которые ваш SNMP опрашивает для сбора информации с устройства. Объект может быть неким состоянием сетевого интерфейса, использованием дискового хранилища, именем устройства и тому подобным. Такие идентификаторы объектов в высшей степени структурированы древовидным иерархическим образом. Каждый OID имеет особенную нумерацию. Например, OID нашего объекта, который собирает имена устройств равен 1.3.6.1.2.1.1.5.0. OID всегда имеют численные значения.

OID можно сравнить с адресами IP, в которых численные значения используются для идентификации устройства в сетевой среде. Каждая точка в OID представляет собой сегментацию сетевого элемента. Мы можем представлять себе OID как адрес местоположения. SNMP version 1: Это самая старая версия SNMP, которая поддерживает только 32- битные счётчики и совсем не имеет никаких средств безопасности. В данном SNMP строка сообщества отсылается как простой текст. SNMP version 2: Она имеет все те же функции, что и версия 1 с добавлением функция поддержки 64- битных счётчиков. Большинство современных устройств поддерживает версию 2.

SNMP version 3: Она имеет всю функциональность версий 1 и 2 с добавлением преимуществ безопасности. К счётчикам добавлены и шифрование, и аутентификация. Если безопасность является наиболее значимой, необходимо использовать именно эту версию. По умолчанию SNMP не установлена в Proxmox. Следующие шаги показывают как установить SNMP в Proxmox и как её настроить: Выполните следующую команду для установки SNMP на узлах Proxmox: # apt-get install snmpd snmp Добавьте следующий репозиторий в /etc/apt/sources.list на вашем узле Proxmox.

Zabbix Мониторинг Raiders

Это используется для добавления репозитория в установку MIB SNMP: deb main non-free Выполните следующие команды для установки MIB SNMP: # apt-get update # apt-get install snmp-mibs-downloader При помощи текстового редактора откройте файл настройки вашего SNMP /etc/snmp/snmpd.conf. Убедитесь что следующая строка лишена признаков комментария. Мы можем определить адрес IP нашего узла.

Zabbix Мониторинг Raid Windows

SNMP прослушивает порт 161. В случае необходимости измените его здесь: agentAddress udp:127.0.0.1:161 Добавьте следующую строку в файл настройки вашего SNMP: rocommunity В нашем примере мы добавили следующую строку: rocommunity SecretSNMP 172.16.0.0/24 Сохраните этот файл и перезапустите SNMP, применив следующую команду: #service snmpd restart. По умолчанию устройства SNMP прослушивают порт 161. Zabbix поставляется с предварительно построенными шаблонами SNMP, которые могут собирать значительные объёмы данных для устройств, в которых установка агента Zabbix невозможна или нежелательна. Обычным примером подобного устройства SNMP является сетевой коммутатор. Zabbix имеет исключительную поддержку для мониторинга коммутаторов при помощи шаблонов SNMP. В нашем примере мы добавим 48 портовый коммутатор Netgear с применением интерфейса SNMP.

Перейдите в Configuration Hosts и кликните по кнопке Create host для открытия новой страницы создания хоста. В рамках применения интерфейса SNMP на странице создания хоста, мы должны выбрать шаблон устройства SNMP и набрать строку SNMP v2 Community в Macros, как это показано на следующем снимке.

This entry was posted on 08.07.2019.