Translation(s): - Русский
Мониторинг состояния жёсткого диска
Этот раздел поможет наглядно установить и настроить мониторинг состояния жёсткого диска с оповещениями на электронную почту.
Активная разработка страницы завершена
Если есть что добавить, дополняйте разделы новой информацией. Наши опечатки и ошибки в статье можно править смело, нет необходимости сообщать об этом на почту, просьба соблюдать стилевое оформление этой страницы и использовать разделители разделов (серые линии различной толщины).
Contents
Разовый просмотр состояния диска
Устанавливаем smartmontools - набор утилит для мониторинга жёстких дисков
# aptitude install smartmontools
Иногда лучше так:
echo "deb http://backports.debian.org/debian-backports squeeze-backports main" >> /etc/apt/sources.list aptitude update aptitude -t squeeze-backports install smartmontools
Смотрим какие диски есть в системе
smartctl --scan
Выбираем любой и смотрим подробную информацию о нём
smartctl -i /dev/sdam
Далее смотрим информацию о его здоровье. Если у Вас не PASSED, то диск следует заменить.
smartctl -h /dev/sdam
Теперь о здоровье подробно:
smartctl -A /dev/sdam
У многих производителей своё индивидуальное понимание атрибутов диска, поэтому не стоит ориентироваться на RAW_VALUE (кроме значения температуры). Например у Seagate, Raw Read Error Rate очень большое и это нормально. У WD равно 0 и это тоже нормально.
Ключевое значение имеет содержимое 3-х столбцов:
- VALUE - текущее значение параметра
- WORST - наихудшее значение, которого когда-либо достигало значение Value
- THRESH - значение, которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим.
Например с ростом температуры RAW значение будет расти, а VALUE будет уменьшаться и упав до THRES, диск скорее всего скоро умрёт от жары.
Подготовка почтовой подсистемы
Чтобы система могла вовремя сообщить о возможных проблемах необходимо настроить единственный mainstream способ оповещения в smartmontools - электронную почту
aptitude install ssmtp bsd-maix
Настраиваем пересылку почты, пример для gmail
nano /etc/ssmtp/ssmtp.conf FromLineOverride=YES root=login@gmail.com mailhub=smtp.gmail.com:587 AuthUser=login AuthPass=password UseSTARTTLS=YES
Далее отправляем тестовое письмо сами себе
sendmail login@gmail.com
после ввода команды пишем любой текст, с помощью Enter можно переходить на следующую строку. Чтобы отправить письмо жмём Ctrl+D
Если письмо дошло, то имеет смысл продолжать дальше.
Настройка мониторинга
Включаем мониторинг, раскомментируем строчку
nano /etc/default/smartmontools start_smartd=yes
Настраиваем мониторинг
nano /etc/smartd.conf #DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner /dev/sda -a -s (S/../../(2|4)/01|L/../../6/01) -m login@gmail.com -M test # diminishing
- -a - включение большинства возможностей мониторинга: проверка "здоровья" диска, отслеживание изменений всех атрибутов, отслеживание неудачных тестов диагностики;
- -s - По вторникам и четвергам в час ночи проводить краткий тест, а по субботам тоже в час ночи - долгий тест
- -m - почтовый адрес получателя
- -М test - отправить сразу тестовое письмо.
- -M diminishing - постоянно напоминать об ошибке
Запускаем мониторинг.
/etc/init.d/smartmontools start
В случае с backports так:
/etc/init.d/smartd start
Далее внимательно читаем syslog и проверяем почту
tail -20 /var/log/syslog
Если всё ok то в опции -M заменяем test на diminishing

