Как подружить zabbix и диски S.M.A.R.T. — инструкция!

Оказалось, что во всём вашем интернете нет нормальной инструкции как правильно проверять состояние S.M.A.R.T. дисков при помощи zabbix. А дело того стоит, потому что диски умные и могут работать ещё долго после появления первых «звоночков». И вот про эти звоночки узнать можно подробнее. В принципе нет сложности вытянуть хоть весь хоровод параметров в zabbix, но для начала я ограничился двумя: температурой (это мне скорее не за дисками, а за кондишенами в комнате наблюдать) и состоянием теста: PASSED или FAILЕD. Делается это всё более, чем просто. И я про это вам сейчас расскажу.

1) Для начала почитать статью, какую я почитал для понимания технологии smart.
2) Установить программу работы со smart дисками apt-get install smartmontools
3) Настроить работу пользовательских параметров агента zabbix. Как правило там надо в visudo добавить строку «zabbix ALL=NOPASSWD: ALL», а в /etc/zabbix/zabbix_agentd.conf добавить строки

UserParameter=my.smart.temp[*],sudo smartctl -A /dev/sd$1 | grep «Tempe» | awk ‘{print $$10}’
UserParameter=my.smart.disk[*],sudo smartctl -H /dev/sd$1 | grep «test result» | awk -F «: » ‘{print $$2}’

Разумеется, сервис надо перезапустить /etc/init.d/zabbix-agent restat
4) Настроить в zabbix элементы данных как на картинках:

В данном случае элементы данных для разных дисков отличаются только в строке «Ключ» буквой в квадратных скобках. Например, для /dev/sdb надо писать ключ my.smart.disk[b]. Вроде бы и всё.

У меня было желание попробовать делать более взвешенную оценку состояния диска, но я посмотреть на смарт таблицу, на три колонки, которые обозначают текущее, худшее и пороговое значение и понял, что буду долго что-то считать при помощи awk и всё равно получу то же, что и этот тест состояния. Есть рецепт как настроить вытягивание любого параметра, но я всё равно не буду знать какой к этому нарисовать триггер 🙂 И там есть ошибка: температуру он вытягивает не из 10 колонки, где в цельсиях, а из 4, где она у меня на одной группе дисков в градусах, а на другой в условных баллах от 100 до 1. Чем ниже — тем хуже.

Добавить комментарий

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.