Войти

Показать полную графическую версию : Проблема с Raid 1


UncleBenz00
21-12-2009, 11:35
На материнской карте rs482-m754 был иcпользован Raid 1. после отключения питания, при загрзуке, стало появляться сообщения что raid массив имеет critical status и что надо зайти в raid утилиту и восттановить массив. зашел, нажал rebuld raid array, но после ребилда данные откатились на 2 недели назад, можно ли как-то вернуть данные на сегодняшний момент?

Notsaint
08-03-2010, 15:51
Добрый день.

Установлен IBM xSeries 346. Внутри - 3 диска по 70гиг (IBM 90P1309) и два по 140 (IBM 90P1310).

Насколько я вижу (т.к. досталось это хозяйство в наследство) 3 по 70 собраны в Raid 5, а два по 140 - в Raid 1.

Не так давно на одном из 70 начала гореть оранжевая лампочка, что по цветовой идентификации распознается как DASD (A hard disk drive rror has occured) с предложением исправить ошибку как "Check the LEDs on the hard disk drives and replace the indicated drive"

Сначала лампочка помигивала, а сейчас уже горит ровным цветом :(. Соответственно при перезагрузке компьютера я вижу две очень непряитные для меня строчки:

1. Logical drive is critical
2. Defunct drive

Сервер работает, что не может не радовать потому как это - главный домен-контроллер. Новые диски (а я заказал весь комплект: 3 по 70 и два по 140) в дороге. Но дорога длинная...

Утилита, идущая в комплекте, ServeRAID Manager, выдает такую картинку:

http://i015.radikal.ru/1003/bb/3b9ff44df958t.jpg (http://radikal.ru/F/i015.radikal.ru/1003/bb/3b9ff44df958.jpg.html)

Собственно, проблемный диск как бы виден. При вызове контекстного меню на нем мне предлагается Rebuild. Теперь собственно вопросы.

1. Могу ли я провести этот "ребилдинг" в нормальном рабочем состоянии, т.е. из-под Windows, домен-контроллер работает,и в это самый момент я провожу операцию. Или же лучше приостановить работу?

2. Попадался на глаза пост, что во время проведения "ребилдинга" данные восстановились, но с откатом на две недели назад. Меня такой вариант не очень устраивает

3. Да и вообще - насколько опасна эта операция?

vadblm
08-03-2010, 16:11
1. Могу ли я провести этот "ребилдинг" в нормальном рабочем состоянии, т.е. из-под Windows, домен-контроллер работает,и в это самый момент я провожу операцию. Или же лучше приостановить работу? »
Можно, в этом и главный смысл RAID. Но лучше выбрать для ребилда время минимальной активности, скажем по окончании рабочего дня.
Поскольку развалился у вас RAID1, на котором видимо система, ребилд пройдёт довольно быстро.
3. Да и вообще - насколько опасна эта операция? »
При нормальном состоянии остального железа и, что очень важно, надёжном электропитании, при RAID1 - абсолютно безопасна. C RAID5 несколько сложнее, при выходе диска из строя, нагрузка на остальные возрастает в разы, что может спровоцировать печальный конец ещё одного или нескольких дисков, после чего массиву хана. Потому при использовании RAID5 весьма желательно держать hot-spare диск.

К счастью для вас, это не ваш случай. Но всячески рекомендую завести hot-spare и настроить мониторинг об незамедлительном уведомлении по почте или чем вам удобнее. И проверьте SMART остальных дисков.

Notsaint
08-03-2010, 16:35
Блин, я забыл записать, что это действительно HOT SWAP.

И еще: я ошибся к написании дисков: у меня 2х70 + 1х140 стоят в 5, и 2х140 - в 1


Но я не думаю, что на 1 система?..

vadblm
08-03-2010, 16:43
hot swap и hot spare разные вещи, первое это технология горячей замены дисков без остановки машины, а второе диск, сидящий себе в корзинке с подключённым питанием, но не используемый до того времени, когда сгорит один из дисков в массиве. Тогда он автоматически встаёт на замену погибшего товарища, автоматически начинается ребилд.

И еще: я ошибся к написании дисков: у меня 2х70 + 1х140 стоят в 5, и 2х140 - в 1
Но я не думаю, что на 1 система?.. »
Ох. Ну раз вы не можете разобраться где у вас там что, то мне куда уж :)

Notsaint
09-03-2010, 08:11
вы не можете разобраться »

Виноват, но для человека как :cool: я, 4 раз смотревшего на Райд, все-таки... :).

Итак, Вы, как профессионал, оказались правы.

2х70 представляют собой райд 1, на котором находится система (у меня отображается как диск С);
3х140 представляют собой райд 5, которой указывает на дополнительный массив (отображается как диск Д).

Теперь еще: я вытащил эту ошибочную 70, подождал немного (ну осмотрел его кончено) и вставил опять в его родное гнездо. Он замигал и надолго. Включив программу SERVERaid, я увидел, что тот диск проходит перестройку (rebuilding) сам! Видимо так установлено в самой программе. Однако по окончании перестройки - опять та же картина. К сожалению, я не успел заглянуть в лог перестройки. Попробую сегодня

vadblm
09-03-2010, 08:17
Включив программу SERVERaid, я увидел, что тот диск проходит перестройку (rebuilding) сам! Видимо так установлено в самой программе. »
Ну всё верно, так и должно было быть. Только вот зачем вы вставили убитый диск обратно - непонятно ;) Вставили бы новый и на этом ваши труды закончились.

Notsaint
09-03-2010, 08:44
на этом ваши труды закончились »

Так не дошел еще пока :(

vadblm
09-03-2010, 08:49
Всмысле новый диск ещё у вас не на руках? Ну для RAID1 это ничего, можно подождать. А вот если б сдох диск в RAID5, был бы очень серьёзный повод для беспокойства, я уже выше писал почему.

Notsaint
09-03-2010, 09:51
Все равно - повод для беспокойства есть всегда.

В общем я посмотрел лог (если его можно так назвать) перестройки. Процесс проходит нормально, 100%, диск переходит в нормальное состояние ... на 30 минут. Потом опять все снова

http://i038.radikal.ru/1003/3a/a756917d6121t.jpg (http://radikal.ru/F/i038.radikal.ru/1003/3a/a756917d6121.jpg.html)

Значит вставка нового решит все проблемы?.. Будем ждать тогда

vadblm
09-03-2010, 09:59
Можете в ожидании посмотреть, за что контроллер выкинул диск. Показания SMART тобишь. И у остальных это тоже будет нелишне.

Notsaint
09-03-2010, 11:17
Показания SMART тобишь »

Ваш совет - чем лучше проверить с учетом того, что это рейд?

vadblm
09-03-2010, 11:23
А родная утилита менеджмента разве не умеет? Я, к сожалению, не имел дела c ServeRAID 7k на виндовс.

Notsaint
09-03-2010, 11:38
Нет, родная утилита из-под Windows не умеетю А перезагружать... чревато

vadblm
09-03-2010, 11:44
Да перезагрузка не поможет, устройства на вашем контроллере за семью печатями, гг. Как я не люблю проприетарные железки с их вые-онами...

Notsaint
09-03-2010, 11:52
В принципе я доволен. Но вот эта ситуация...

Виктория - не видит, HDDScan - не видит тоже...

vadblm
09-03-2010, 12:07
Виктория - не видит, HDDScan - не видит тоже... »
и smartctl (http://sourceforge.net/apps/trac/smartmontools/wiki) тоже не увидит. Выше сказано, почему.

Ment69
09-03-2010, 13:49
Notsaint, Мой вам совет, учитывая я вытащил эту ошибочную 70, подождал немного (ну осмотрел его кончено) и вставил опять в его родное гнездо. » дождитесь HDD для замены.

Попадался на глаза пост, что во время проведения "ребилдинга" данные восстановились, но с откатом на две недели назад. Меня такой вариант не очень устраивает » Не путайте софтовый райд с вашим случаем!

Проверить HDD вы можете в утилите вашего райд-контроллера, там наверняка есть утилита для проверки дисков, только предупреждаю проверка вашего диска займет очень много времени.




© OSzone.net 2001-2012