Как определить неисправный диск в Synology

Всем привет!!!

Давайте я попробую помочь вам понять исправен ваш диск в Synology NAS или его нужно менять.

Эта статья лично мое мнения, как я оцениваю состояние дисков и не претендует на официальное руководство.

Для начала

Первое, что нужно сделать это открыть информацию о состоянии диска в диспетчере хранения. Тут отображается основная, но далеко не вся информация.

Но даже если на этой странице есть ошибки, то это еще не говорит о неисправности диска и Synology может не помечать такой диск как неисправный.

Проверка SMART

Поэтому нужно посмотреть состояние SMART диска. Для этого откройте соответствующую вкладку и в самом низу сведения атрибутов

Подробно про SMART и что это такое я рассказал в моей статье: Synology NAS тест SMART

Если у вас есть подозрения на неисправность диска начать нужно с тестов SMART. У меня есть отдельная статья с инструкцией. Запускаете быстрый тест, который длится не долго. Такой тест я рекомендую делать каждый месяц по расписанию. Если быстрый прошел успешно, то запускайте расширенный тест. Этот тест будет идти долго. Такой тест я рекомендую запускать по расписанию раз в три или шесть месяцев в зависимости от нагрузки на устройство. Если оно сильно нагружено, то лучше часто не запускать такой тест.

Пока выполняется расширенный тест и после его выполнения нужно смотреть атрибуты SMART. У разных производителей дисков данные в SMART могут отличаться.

Ниже я привел данные SMART с дисков WD

А вот тут данные SMART с дисков Seagate. Сразу хочу отметить эти диски, Зачастую они так и сыпят ошибками в SMART в различных параметрах, но при этом диск рабочий. Именно поэтому я не рекомендую покупать такие диски этого производителя, они ведут себя странно, но при этом они такие же надежные, как и другие.

На что же нужно обращать тут внимание. На самом деле важными показателями является всего несколько пунктов

Атрибут SMARTОписание
5Reallocated Sectors Count
187Reported Uncorrectable Errors
188Command Timeout
197Current Pending Sector Count
198Uncorrectable Sector Count

Атрибуты 187 и 188 есть только у дисков Seagate, поэтому если у вас Toshiba или WD, то не переживайте, это нормально.

Атрибут 5 считаю самым важным показателем. Этот счетчик растет, когда на диске обнаруживаются поврежденные сектора. Эти сектора помечаются неисправными и переносятся в специальную область диска зарезервированную для таких секторов. Надо понимать, что эта область не безгранична и она рано или поздно закончится.

Но даже если вы увидите не нулевое значение атрибута 5, это еще не говорит об плохом состоянии диска. Возможно какое-то количество секторов на диске неисправно, но другие могут быть в норме.

Проверьте график количества поврежденных секторов. Отслеживайте, увеличивается ли количество поврежденных секторов.

  1. Перейдите в Диспетчер хранения > HDD/SSD.
  2. Выберите диск с подозрением на сбой.
  3. Нажмите Информация о состоянии и перейдите в раздел Журнал > Ключевая информация о дисках.
  4. Проверьте график количества поврежденных секторов.
    • Если число увеличивается, в будущем может произойти сбой диска. Рекомендуется заменить диск, чтобы избежать возможной потери данных.
    • Если счетчик стабильный, возможно, поврежденные секторы исправлены. Продолжить мониторинг диска.

Идем дальше по атрибутам. Если количество ошибок в атрибутах 187, 188, 197, 198 небольшое или только у одного из атрибутов, то волноваться еще рано. Но если количество ошибок большое, то скорее всего диск начинает умирать. А если ошибки имеются сразу в нескольких таких атрибутах одновременно, то вероятность неисправного диска вырастает в разы. Я бы точно менял такой диск.

Мониторинг нагрузки

Тут нужно отметить еще один факт о SMART на дисках. Все эти атрибуты дело хорошее, но они записываются только если будут найдены. Если ошибка не найдена, то не обязательно, что ее нет, она вполне может быть.

Поэтому я рекомендую сделать следующее. Откройте мониторинг ресурсов, перейдите на вкладку диски и нажмите настраиваемый просмотр. В этом окне интересует один параметр “Использование %”. Начните сначала записывать на диски данные, а затем считывать. У всех дисков в одном пуле этот параметр должен быть примерно одинаковым. Если вы увидите, что все диски загружены на 40%, а один какой-то на 90% или даже 100%, то этот диск неисправен и его нужно заменить.

Бывает, что новые данные записываются и считываются хорошо, а при чтении старых данных возникают проблемы. Поэтому имеет смысл скопировать старые данные и проверить.

Хочу отметить, что из-за загрузки на 100% одного диска вся система DSM на NAS может намертво зависать. Если ваш NAS периодически зависает, то это как раз может быть из-за всего одного неисправного диска.

Тест производительности

Тест производительности, может так же навести вас на неисправный диск. Но такие тесты нужно проводить ну хотя бы раз в год, а затем сравнивать показатели с предыдущими значениями. Данный тест не быстрый, поэтому на их выполнение нужно время, а так же лучше проводить их в ночное время, когда нагрузка наименьшая.

Если будет выявлено, что ранее диск был намного производительнее, то стоит задуматься о таком диске. Но не торопитесь, возможно во время теста была какая-то другая нагрузка, ну например, кто-то начал записывать данные, лучше повторите тест еще раз.

Температура дисков

Так же стоит обратить внимание на температуру дисков. У одинаковых дисков она должна быть одинаковая, если они установлены в одном и том же корпусе. Так вот например у моего первого диска температура меньше чем у второго и третьего, но при этом нагрузка на диск в % всегда выше. Этот диск вызывает у меня подозрения, но он уже 2 года работает исправно и пока я просто наблюдаю за ним.

Так как зашла речь про температуру, то давайте разберемся какая температура считается нормальной, так как тут, как и везде есть свои нюансы. Например, у разных производителей для разных типов дисков нормальная температура разная и всегда смотрите спецификации дисков прежде чем делать выводы о температуре.

WD Gold Enterprise Class SATA HDD

Спецификации это хорошо и правильно. Но я придерживаюсь таких правил:

  • Нормальная температура – от 30 до 50 °C
  • Не нормальная температура от 50 °C и выше

Согласен, что в некоторых условиях и 55°C будет нормой, но тут все зависит от обстоятельств и желательно снижать температуру, если диски работает в таких условиях.

Исправление ошибок данных

Не забывайте, что не только диски могут быть неисправны, но и сама файловая система. Для этого нужно периодически запускать исправление ошибок данных. Я запускаю его каждые три месяца в ночное время, так как это вызывает большую нагрузку на файловую систему.

История использования дисков

Любой диск, который был установлен в DSM будет навсегда запомнен, все его параметры хранятся в истории. Так, если вы произведете тест производительности, а затем извлекаете диск и через год или два снова вставите диск в DSM, то история теста производительности останется и можно будет воспользоваться предыдущими значениями.

С одной стороны, это очень удобно. Но представим, что диск был помечен как неисправный ошибочно, да да, такое бывает. Для этого нужна знать, где находятся база этой информации.

"/var/log/smart_extend_log"
"/var/log/smart_quick_log"
"/var/log/synolog/.SYNODISKDB"
"/var/log/synolog/.SYNODISKTESTDB"
"/var/log/synolog/.SYNODISKHEALTHDB"
/var/log/disk_overview.xml
/var/lib/drive/disk_overview.xml

Видео

Материалы для статьи я брал из этих источников:

Подписаться
Уведомить о
guest
2 Комментарий
Старые
Новые
Межтекстовые Отзывы
Посмотреть все комментарии