Translation(s): - Русский
Мониторинг состояния жёсткого диска
Этот раздел поможет установить и настроить мониторинг состояния жёсткого диска с оповещениями на электронную почту.
Активная разработка страницы завершена
Contents
Установка
Устанавливаем набор утилит для мониторинга жёстких дисков - smartmontools
# apt-get update # apt-get install smartmontools
На данный момент, для Debian Jessie, в репозитории Backports, доступна более новая версия. Если данный репозиторий подключен, то утилиту можно поставить так:
# apt-get update # apt-get install -t jessie-backports smartmontools
Разовый просмотр состояния диска
Смотрим какие диски есть в системе:
# smartctl --scan /dev/sda -d scsi # /dev/sda, SCSI device /dev/sdb -d scsi # /dev/sdb, SCSI device
Посмотреть более подробную информацию о каком либо диске:
# smartctl -i /dev/sda
Далее смотрим информацию о его здоровье. Если у Вас не PASSED, то диск следует заменить.
# smartctl -H /dev/sda
Теперь о здоровье подробно:
# smartctl -A /dev/sda
У многих производителей своё индивидуальное понимание атрибутов диска, поэтому не стоит ориентироваться на RAW_VALUE (кроме значения температуры). Например у Seagate, Raw Read Error Rate очень большое и это нормально. У WD равно 0 и это тоже нормально.
Для более детально понимания вопроса, обратитесь на профильные форумы или к официальной документации производителя диска.
Ключевое значение имеет содержимое 3-х столбцов:
- VALUE - текущее значение параметра
- WORST - наихудшее значение, которого когда-либо достигало значение Value
- THRESH - значение, которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим.
Например, с ростом температуры RAW значение будет расти, а VALUE будет уменьшаться и упав до THRES, диск скорее всего скоро "умрёт" от жары.
Подготовка почтовой подсистемы
Один из вариантов оповещения - электронная почта.
По умолчанию, в ОС Debian устанавливается exim. Его и настроим. Тут описан самый простой способ, когда со стороны SMTP-сервера нету специфических настроек. Пример настройки exim и gmail описан тут - GmailAndExim4.
Редактируем файл /etc/exim4/update-exim4.conf.conf и меняем значения опций dc_eximconfig_configtype='' на smarthost, и в dc_smarthost='' указываем SMTP-сервер.
nano /etc/exim4/update-exim4.conf.conf dc_eximconfig_configtype='smarthost' dc_other_hostnames='hostname.local' dc_local_interfaces='127.0.0.1 ; ::1' dc_readhost='' dc_relay_domains='' dc_minimaldns='false' dc_relay_nets='' dc_smarthost='smtp.example.org:25' CFILEMODE='644' dc_use_split_config='false' dc_hide_mailname='' dc_mailname_in_oh='true' dc_localdelivery='mail_spool'
В файле /etc/exim4/passwd.client указываем имя и пароль от почты.
smtp.example.org:login:password
Далее обновляем конфигурацию exim4:
# update-exim4.conf
Проверяем:
$ echo "Test mess" | mail -s Test user@example.ru
На почту должно придти письмо.
Настройка мониторинга
Включаем мониторинг, раскомментируем строчку
nano /etc/default/smartmontools start_smartd=yes
Настраиваем мониторинг. Комментируем строку с DEVICESCAN
nano /etc/smartd.conf #DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sda -a -s (S/../../(2|4)/01|L/../../6/01) -m user@example.ru -M test # diminishing
- -a - включение большинства возможностей мониторинга: проверка "здоровья" диска, отслеживание изменений всех атрибутов, отслеживание неудачных тестов диагностики;
- -s - По вторникам и четвергам в час ночи проводить краткий тест, а по субботам тоже в час ночи - долгий тест
- -m - почтовый адрес получателя
- -М test - отправить сразу тестовое письмо.
- -M diminishing - постоянно напоминать об ошибке
Перезапускаем службу, если она была запущена:
systemctl status smartd.service
Если всё нормально, то на почту должно прийти тестовое письмо от smartd. Если тестовое письмо пришло, то меняем в опции -M test на diminishing.