Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Накопители (SSD, HDD, USB Flash) (http://forum.oszone.net/forumdisplay.php?f=53)
-   -   [RAID1] SMART, Rebilding и др.проблемы (http://forum.oszone.net/showthread.php?t=209714)

Flammable 23-06-2011 13:38 1700238

[RAID1] SMART, Rebilding и др.проблемы
 
Добрый день! Имеется RAID1 массив из двух WD1002FAEX. Проблема в том, что те утилиты, которыми я раньше мониторил SMART (был установлен один диск), теперь не обнаруживают ни одного диска. Подскажите, может есть специальный софт для таких случаев? Полный конфиг системы в профиле.
Спасибо.

Ment69 23-06-2011 13:53 1700247

Цитата:

Материнская плата: MSI P45D3 Platinum
я так понимаю райд поднят на интелевом чипсете, следовательно нужна утилита от Intel Intel® Rapid Storage Technology

Она мониторит состояние дисков

Flammable 23-06-2011 16:34 1700329

Скачал, установил. Показывает только статус диска работает/посыпался :)
Узнал, что один диск по неизвестным причинам отвалился. В утилите конфигурации raid (запускается после загрузки bios) статус массива Rebuild. Отключил один диск, статус failed. Система не грузится. Отключил raid контроллер, загрузился со здорового диска. Отвалившийся диск сразу определился как нераспределенный. Acronis Disk Director тоже не находит на нем разделов.
Заглянул в SMART, там такая картина (цвет сохранен):

читать дальше »
Model: WDC WD1002FAEX-00Z3A0
Firmware: 05.01D05
Serial: WD-WCATR3636675
LBA: 1953525168

Report By: HDDScan for Windows version 3.1
Report Date: 23.06.2011 16:06:23


Num Attribute Name Value Worst Raw(hex) Threshold

001 Raw Read Error Rate 200 200 00000000-0000 051

003 Spin Up Time 172 172 00000000-111F 021

004 Start/Stop Count 100 100 00000000-0031 000

005 Reallocation Sector Count 200 200 00000000-0000 140

007 Seek Error Rate 200 200 00000000-0000 000

009 PowerOn Hours Count 097 097 00000000-0ADA 000

010 Spin Retry Count 100 253 00000000-0000 000

011 Recalibration Retries 100 253 00000000-0000 000

012 Device Power Cycle Count 100 100 00000000-002F 000

192 Power-off retract count 200 200 00000000-002B 000

193 Load/unload cycle count 200 200 00000000-0005 000

194 HDA Temperature 114 094 33 C 000

196 Reallocation Event Count 200 200 00000000-0000 000

197 Current Pending Sector Count 200 200 00000000-0001 000

198 Uncorrectable Sector Count 200 200 00000000-0001 000


199 UltraDMA CRC Error Count 200 200 00000000-0000 000

200 Write Error Rate 200 200 00000000-0001 000


Со второго диска отчет такой:

читать дальше »
Model: WDC WD1002FAEX-00Z3A0
Firmware: 05.01D05
Serial: WD-WCATR3637103
LBA: 1953525168

Report By: HDDScan for Windows version 3.1
Report Date: 23.06.2011 16:06:12


Num Attribute Name Value Worst Raw(hex) Threshold

001 Raw Read Error Rate 200 200 00000000-0000 051

003 Spin Up Time 175 174 00000000-1081 021

004 Start/Stop Count 100 100 00000000-0040 000

005 Reallocation Sector Count 200 200 00000000-0000 140

007 Seek Error Rate 100 253 00000000-0000 000

009 PowerOn Hours Count 095 095 00000000-0E9D 000

010 Spin Retry Count 100 253 00000000-0000 000

011 Recalibration Retries 100 253 00000000-0000 000

012 Device Power Cycle Count 100 100 00000000-0030 000

192 Power-off retract count 200 200 00000000-001E 000

193 Load/unload cycle count 200 200 00000000-0021 000

194 HDA Temperature 114 099 33 C 000

196 Reallocation Event Count 200 200 00000000-0000 000

197 Current Pending Sector Count 200 200 00000000-0000 000

198 Uncorrectable Sector Count 200 200 00000000-0000 000

199 UltraDMA CRC Error Count 200 200 00000000-0000 000

200 Write Error Rate 200 200 00000000-0000 000


Из-за чего мог отвалиться первый диск, чего ожидать дальше?
И еще вопрос: как определить по SMART максимальную температуру, при которой работал диск?

Tau_0 23-06-2011 17:25 1700352

Цитата:

Цитата Flammable
Из-за чего мог отвалиться первый диск, чего ожидать дальше?
И еще вопрос: как определить по SMART максимальную температуру, при которой работал диск? »

Вот из-за температуры и мог на харде пендинг появиться....
Цитата:

197 Current Pending Sector Count 200 200 00000000-0001 000
Изведите его --- есть сто спосбов..., и массив восстановите.

Для первого --- Serial: WD-WCATR3636675
Цитата:

194 HDA Temperature 114 094 33 C 000
T_Нормализованная_текущая = 114
T_Нормализаванная_худшая = 094
T_Текущая_С = 33 C

Тогда,
T_Худшая = T_Текущая_С + (T_Нормализованная_текущая - T_Нормализаванная_худшая ) = 33 + ( 114 – 094 ) = 33 + 20 = 53 C

Много --- должно быть не более 45 C
Вот исследования компании Storelab.ru.
Сравнение надежности жестких дисков основных производителей
http://www.overclockers.ru/lab/37513...voditelej.html
Цитата:

Для дисков WD характерен выход из строя блока магнитных головок (БМГ). Это происходит при перегреве (головки WD капризны при температуре выше 45 градусов Цельсия),…
Для второго --- Serial: WD-WCATR3637103
Цитата:

194 HDA Temperature 114 099 33 C 000
T_Худшая = 33 + ( 114 – 099 ) = 33 + 15 = 48 C

Тоже многовато.

ЗЫ Формула для пересчёта температур у хардов 1 TB WDC (FALS, FAEX, FBYS) мною проверена лично для диапазона 25 --- 48 C (составлены таблицы). Можете перепроверить --- мониторить (например, CrystalDiskInfo) текущую в градусах Целсия и нормализованную. Я выше 48 С харды не грел --- пожалел. А на этом интервале зависимость линейна, и проэкстраполировать её на диапазон 48-- 60 C (выше 60 C автоматика отключит хард) имнею основания...

Flammable 23-06-2011 17:54 1700373

Цитата:

Цитата Tau_0
Изведите его --- есть сто спосбов..., и массив восстановите. »

Каким софтом лучше извести?

Tau_0 23-06-2011 18:36 1700393

Цитата:

Цитата Flammable
Каким софтом лучше извести? »

Скорее всего у Вас просто soft-bad…???...
Я бы сделал так:

1. Взял Victoria for DOS и просканировал ею поверхность всего харда, чтобы поймать сбойный блок секторов --- целых 256 секторов попадут по подозрение… Сканирование займёт часа 2.5 --- 3.

2. Напустил на вычисленный блок DMDE - DM Disk Editor and Data Recovery Softwarehttp://dmde.ru/download.html,
чтобы скопировать блок (а можно и больше…) в надёжное место.
При этом DMDE укажет точно LBA проблемного сектора, и попросит заменить его в копии нулями. Записываете этот LBA на лист бумаги.

3. Далее можно:

a) Взять MHDD и точно затереть единственный сектор нулями --- StartLBA = EndLBA. Victoria for DOS для этого хуже --- нельзя затереть один сектор (можно только два) --- баг разработчика. Хотя можно сделать викторией remap всего блока --- тогда и DMDE не нужен... Может так и лучше…

b) Можно просто вернуть копию назад --- главное LBA адресами не промахнуться… В копии сектор в блоке уже затёрт.

Может другие предложат Вам более простые варианты. Пробуйте -- у Вас RAID1 --- ничего страшного…

Flammable 24-06-2011 22:52 1701076

RAID1 - статус Rebilding
 
В предыдущей теме я писал о том, что один диск из RAID1 массива отключился сам по себе, в Intel Matrix Storage Manager (доступен сразу после загрузки bios) видны оба диска и стоит статус Rebilding. Intel Rapid Storage Manager показывает, что второй диск отсутствует. Здесь прочитал о том, что для восстановления RAID1 нужен Intel Matrix Storage Manager для Windows.
Скачал (IATA89CD.exe), при установке получаю сообщение "Ваша система не удовлетворяет минимальным требованиям", и на этом все заканчивается. В чем проблема?

IgNat 24-06-2011 23:46 1701103

Flammable, т.е. при каждой вновь появившейся проблеме будете создавать новую тему? ;) Т.к. проблемы выявляются в силу выполнения предыдущих рекомендаций - продолжайте обсуждение в данной теме!

Flammable 25-06-2011 00:07 1701111

Все-таки тема уже совсем другая - мониторинг SMART в массиве отличается от восстановления массива. Ну, продолжаем тут. Жду рекомендаций по решению проблемы:)

Tau_0 25-06-2011 00:54 1701130

Цитата:

Цитата Flammable
Жду рекомендаций по решению проблемы »

Логика проста, если сбой на рейде ===> быстро меняете сбойный хард на новый и средствами восстановления RAID восстанавливаете рейд.

Нет нового харда ===> трёте (на стороне) нулями старый до нуля, и подсовываете его в рейд.

Я предлагал промежуточный вариант --- побороться и обмануть систему…

Старый хард заклеймён и опущен --- просто так система его не пропустит уже на этапе POST BIOS --- интересно где (на самом харде, или во флеш RAID контролера) …???...

Давно я собирался это выяснить, да руки не дошли….

Flammable 25-06-2011 09:44 1701203

Цитата:

Цитата Tau_0
Старый хард заклеймён и опущен --- просто так система его не пропустит уже на этапе POST BIOS --- интересно где (на самом харде, или во флеш RAID контролера) …???... »

Как же это не пропустит, если пропускает со статусом Rebuilding? По ссылке пишут, что в этом случае нужно вручную запустить перестройку массива. Но установить необходимый для этого софт (Intel Matrix Storage Manager) у меня не получается.

Ment69 25-06-2011 14:53 1701356

Цитата:

Цитата Flammable
Но установить необходимый для этого софт (Intel Matrix Storage Manager) у меня не получается. »

Потому что Intel Matrix Storage Manager и Intel® Rapid Storage Technology - одно и то же!

Tau_0 25-06-2011 15:01 1701360

Цитата:

Цитата Flammable
Как же это не пропустит, если пропускает со статусом Rebuilding? »

Пролущенный хард виден --- в чём тогда проблема…???... --- обращайтесь....

Flammable 25-06-2011 16:44 1701413

Цитата:

Цитата Ment69
Потому что Intel Matrix Storage Manager и Intel® Rapid Storage Technology - одно и то же! »

Далеко не одно и то же. В мануале к плате описано управление массивом с помощью Matrix Storage Manager. Rapid Storage Technology выглядит совсем по-другому и показывает лишь состояние массива.

Цитата:

Цитата Tau_0
Пролущенный хард виден --- в чём тогда проблема…???... --- обращайтесь.... »

Ну нет в Rapid Storage Technology кнопки "Rebuild".

IgNat 26-06-2011 03:12 1701654

Цитата:

Цитата Flammable
установить необходимый для этого софт (Intel Matrix Storage Manager) у меня не получается. »

- перед установкой удалили Intel® Rapid Storage Technology?

Ment69 26-06-2011 15:52 1701805

Цитата:

Цитата Flammable
Далеко не одно и то же. »

Windows 95 и Windows 7 тоже не похожи, идите на сайт Intel и спросите почему одну и ту же технологию, они по разному называют.

Flammable 26-06-2011 23:01 1701984

Цитата:

Цитата IgNat
перед установкой удалили Intel® Rapid Storage Technology? »

Надо удалить? Попробую.


Время: 09:51.

Время: 09:51.
© OSzone.net 2001-