Differences between revisions 6 and 7
Revision 6 as of 2016-05-24 10:24:53
Size: 6591
Editor: yrii
Comment:
Revision 7 as of 2016-05-24 10:29:57
Size: 6616
Editor: yrii
Comment:
Deletions are marked like this. Additions are marked like this.
Line 119: Line 119:
Если всё нормально, то на почту должно придти тестовое письмо от smartd.
Если он пришло, то меняем в опции -M '''test''' на '''diminishing'''.
Если всё нормально, то на почту должно прийти тестовое письмо от smartd.
Если тестовое письмо пришло, то меняем в опции -M '''test''' на '''diminishing'''.

http://www.debian.org/logos/openlogo-nd-50.png http://www.debian.org/Pics/debian.png

Translation(s): - Русский


Мониторинг состояния жёсткого диска


Этот раздел поможет установить и настроить мониторинг состояния жёсткого диска с оповещениями на электронную почту.


Активная разработка страницы завершена



Установка


Устанавливаем набор утилит для мониторинга жёстких дисков - smartmontools

# apt-get update
# apt-get install smartmontools

На данный момент, для Debian Jessie, в репозитории Backports, доступна более новая версия. Если данный репозиторий подключен, то утилиту можно поставить так:

# apt-get update
# apt-get install -t jessie-backports smartmontools


Разовый просмотр состояния диска


Смотрим какие диски есть в системе:

# smartctl --scan
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/sdb -d scsi # /dev/sdb, SCSI device

Посмотреть более подробную информацию о каком либо диске:

# smartctl -i /dev/sda

Далее смотрим информацию о его здоровье. Если у Вас не PASSED, то диск следует заменить.

# smartctl -H /dev/sda

Теперь о здоровье подробно:

# smartctl -A /dev/sda

У многих производителей своё индивидуальное понимание атрибутов диска, поэтому не стоит ориентироваться на RAW_VALUE (кроме значения температуры). Например у Seagate, Raw Read Error Rate очень большое и это нормально. У WD равно 0 и это тоже нормально.
Для более детально понимания вопроса, обратитесь на профильные форумы или к официальной документации производителя диска.

Ключевое значение имеет содержимое 3-х столбцов:

  • VALUE - текущее значение параметра
  • WORST - наихудшее значение, которого когда-либо достигало значение Value
  • THRESH - значение, которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим.

Например, с ростом температуры RAW значение будет расти, а VALUE будет уменьшаться и упав до THRES, диск скорее всего скоро "умрёт" от жары.


Подготовка почтовой подсистемы


Один из вариантов оповещения - электронная почта.
По умолчанию, в ОС Debian устанавливается exim. Его и настроим. Тут описан самый простой способ, когда со стороны SMTP-сервера нету специфических настроек. Пример настройки exim и gmail описан тут - GmailAndExim4.
Редактируем файл /etc/exim4/update-exim4.conf.conf и меняем значения опций dc_eximconfig_configtype='' на smarthost, и в dc_smarthost='' указываем SMTP-сервер.

nano /etc/exim4/update-exim4.conf.conf

dc_eximconfig_configtype='smarthost'
dc_other_hostnames='hostname.local'
dc_local_interfaces='127.0.0.1 ; ::1'
dc_readhost=''
dc_relay_domains=''
dc_minimaldns='false'
dc_relay_nets=''
dc_smarthost='smtp.example.org:25'
CFILEMODE='644'
dc_use_split_config='false'
dc_hide_mailname=''
dc_mailname_in_oh='true'
dc_localdelivery='mail_spool'

В файле /etc/exim4/passwd.client указываем имя и пароль от почты.

smtp.example.org:login:password

Далее обновляем конфигурацию exim4:

# update-exim4.conf

Проверяем:

$ echo "Test mess" | mail -s Test user@example.ru

На почту должно придти письмо.


Настройка мониторинга


Включаем мониторинг, раскомментируем строчку

nano /etc/default/smartmontools

start_smartd=yes

Настраиваем мониторинг. Комментируем строку с DEVICESCAN

nano /etc/smartd.conf
#DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
/dev/sda -a -s (S/../../(2|4)/01|L/../../6/01) -m user@example.ru -M test
# diminishing
  • -a - включение большинства возможностей мониторинга: проверка "здоровья" диска, отслеживание изменений всех атрибутов, отслеживание неудачных тестов диагностики;
  • -s - По вторникам и четвергам в час ночи проводить краткий тест, а по субботам тоже в час ночи - долгий тест
  • -m - почтовый адрес получателя
  • -М test - отправить сразу тестовое письмо.
  • -M diminishing - постоянно напоминать об ошибке

Перезапускаем службу, если она была запущена:

systemctl status smartd.service

Если всё нормально, то на почту должно прийти тестовое письмо от smartd. Если тестовое письмо пришло, то меняем в опции -M test на diminishing.