Differences between revisions 4 and 5
Revision 4 as of 2014-04-13 14:19:03
Size: 6011
Editor: ?oermolaev
Comment: замена smartctl -h /dev/sdam на smartctl -H /dev/sdam
Revision 5 as of 2014-04-13 14:31:51
Size: 6012
Editor: ?oermolaev
Comment: замена bsd-maix на bsd-mailx
Deletions are marked like this. Additions are marked like this.
Line 56: Line 56:
aptitude install ssmtp bsd-maix aptitude install ssmtp bsd-mailx

http://www.debian.org/logos/openlogo-nd-50.png http://www.debian.org/Pics/debian.png

Translation(s): - Русский


Мониторинг состояния жёсткого диска


Этот раздел поможет наглядно установить и настроить мониторинг состояния жёсткого диска с оповещениями на электронную почту.


Активная разработка страницы завершена


Если есть что добавить, дополняйте разделы новой информацией. Наши опечатки и ошибки в статье можно править смело, нет необходимости сообщать об этом на почту, просьба соблюдать стилевое оформление этой страницы и использовать разделители разделов (серые линии различной толщины).



Разовый просмотр состояния диска


Устанавливаем smartmontools - набор утилит для мониторинга жёстких дисков

# aptitude install smartmontools

Иногда лучше так:

echo "deb http://backports.debian.org/debian-backports squeeze-backports main" >> /etc/apt/sources.list
aptitude update
aptitude -t squeeze-backports install smartmontools

Смотрим какие диски есть в системе

smartctl --scan

Выбираем любой и смотрим подробную информацию о нём

smartctl -i /dev/sdam

Далее смотрим информацию о его здоровье. Если у Вас не PASSED, то диск следует заменить.

smartctl -H /dev/sdam

Теперь о здоровье подробно:

smartctl -A /dev/sdam

У многих производителей своё индивидуальное понимание атрибутов диска, поэтому не стоит ориентироваться на RAW_VALUE (кроме значения температуры). Например у Seagate, Raw Read Error Rate очень большое и это нормально. У WD равно 0 и это тоже нормально.

Ключевое значение имеет содержимое 3-х столбцов:

  • VALUE - текущее значение параметра
  • WORST - наихудшее значение, которого когда-либо достигало значение Value
  • THRESH - значение, которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим.

Например с ростом температуры RAW значение будет расти, а VALUE будет уменьшаться и упав до THRES, диск скорее всего скоро умрёт от жары.


Подготовка почтовой подсистемы


Чтобы система могла вовремя сообщить о возможных проблемах необходимо настроить единственный mainstream способ оповещения в smartmontools - электронную почту

aptitude install ssmtp bsd-mailx

Настраиваем пересылку почты, пример для gmail

nano /etc/ssmtp/ssmtp.conf

FromLineOverride=YES
root=login@gmail.com
mailhub=smtp.gmail.com:587
AuthUser=login
AuthPass=password
UseSTARTTLS=YES

Далее отправляем тестовое письмо сами себе

sendmail login@gmail.com

после ввода команды пишем любой текст, с помощью Enter можно переходить на следующую строку. Чтобы отправить письмо жмём Ctrl+D

Если письмо дошло, то имеет смысл продолжать дальше.


Настройка мониторинга


Включаем мониторинг, раскомментируем строчку

nano /etc/default/smartmontools

start_smartd=yes

Настраиваем мониторинг

nano /etc/smartd.conf
#DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sda -a -s (S/../../(2|4)/01|L/../../6/01) -m login@gmail.com -M test
# diminishing
  • -a - включение большинства возможностей мониторинга: проверка "здоровья" диска, отслеживание изменений всех атрибутов, отслеживание неудачных тестов диагностики;
  • -s - По вторникам и четвергам в час ночи проводить краткий тест, а по субботам тоже в час ночи - долгий тест
  • -m - почтовый адрес получателя
  • -М test - отправить сразу тестовое письмо.
  • -M diminishing - постоянно напоминать об ошибке

Запускаем мониторинг.

/etc/init.d/smartmontools start

В случае с backports так:

/etc/init.d/smartd start

Далее внимательно читаем syslog и проверяем почту

tail -20 /var/log/syslog

Если всё ok то в опции -M заменяем test на diminishing