Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Накопители (SSD, HDD, USB Flash) (http://forum.oszone.net/forumdisplay.php?f=53)
-   -   Проблема с Raid 1 (http://forum.oszone.net/showthread.php?t=160978)

UncleBenz00 21-12-2009 11:35 1300593

Проблема с Raid 1
 
На материнской карте rs482-m754 был иcпользован Raid 1. после отключения питания, при загрзуке, стало появляться сообщения что raid массив имеет critical status и что надо зайти в raid утилиту и восттановить массив. зашел, нажал rebuld raid array, но после ребилда данные откатились на 2 недели назад, можно ли как-то вернуть данные на сегодняшний момент?

Notsaint 08-03-2010 15:51 1363622

Добрый день.

Установлен IBM xSeries 346. Внутри - 3 диска по 70гиг (IBM 90P1309) и два по 140 (IBM 90P1310).

Насколько я вижу (т.к. досталось это хозяйство в наследство) 3 по 70 собраны в Raid 5, а два по 140 - в Raid 1.

Не так давно на одном из 70 начала гореть оранжевая лампочка, что по цветовой идентификации распознается как DASD (A hard disk drive rror has occured) с предложением исправить ошибку как "Check the LEDs on the hard disk drives and replace the indicated drive"

Сначала лампочка помигивала, а сейчас уже горит ровным цветом :(. Соответственно при перезагрузке компьютера я вижу две очень непряитные для меня строчки:

1. Logical drive is critical
2. Defunct drive

Сервер работает, что не может не радовать потому как это - главный домен-контроллер. Новые диски (а я заказал весь комплект: 3 по 70 и два по 140) в дороге. Но дорога длинная...

Утилита, идущая в комплекте, ServeRAID Manager, выдает такую картинку:



Собственно, проблемный диск как бы виден. При вызове контекстного меню на нем мне предлагается Rebuild. Теперь собственно вопросы.

1. Могу ли я провести этот "ребилдинг" в нормальном рабочем состоянии, т.е. из-под Windows, домен-контроллер работает,и в это самый момент я провожу операцию. Или же лучше приостановить работу?

2. Попадался на глаза пост, что во время проведения "ребилдинга" данные восстановились, но с откатом на две недели назад. Меня такой вариант не очень устраивает

3. Да и вообще - насколько опасна эта операция?

vadblm 08-03-2010 16:11 1363630

Цитата:

Цитата Notsaint
1. Могу ли я провести этот "ребилдинг" в нормальном рабочем состоянии, т.е. из-под Windows, домен-контроллер работает,и в это самый момент я провожу операцию. Или же лучше приостановить работу? »

Можно, в этом и главный смысл RAID. Но лучше выбрать для ребилда время минимальной активности, скажем по окончании рабочего дня.
Поскольку развалился у вас RAID1, на котором видимо система, ребилд пройдёт довольно быстро.
Цитата:

Цитата Notsaint
3. Да и вообще - насколько опасна эта операция? »

При нормальном состоянии остального железа и, что очень важно, надёжном электропитании, при RAID1 - абсолютно безопасна. C RAID5 несколько сложнее, при выходе диска из строя, нагрузка на остальные возрастает в разы, что может спровоцировать печальный конец ещё одного или нескольких дисков, после чего массиву хана. Потому при использовании RAID5 весьма желательно держать hot-spare диск.

К счастью для вас, это не ваш случай. Но всячески рекомендую завести hot-spare и настроить мониторинг об незамедлительном уведомлении по почте или чем вам удобнее. И проверьте SMART остальных дисков.

Notsaint 08-03-2010 16:35 1363648

Блин, я забыл записать, что это действительно HOT SWAP.

И еще: я ошибся к написании дисков: у меня 2х70 + 1х140 стоят в 5, и 2х140 - в 1


Но я не думаю, что на 1 система?..

vadblm 08-03-2010 16:43 1363655

hot swap и hot spare разные вещи, первое это технология горячей замены дисков без остановки машины, а второе диск, сидящий себе в корзинке с подключённым питанием, но не используемый до того времени, когда сгорит один из дисков в массиве. Тогда он автоматически встаёт на замену погибшего товарища, автоматически начинается ребилд.

Цитата:

Цитата Notsaint
И еще: я ошибся к написании дисков: у меня 2х70 + 1х140 стоят в 5, и 2х140 - в 1
Но я не думаю, что на 1 система?.. »

Ох. Ну раз вы не можете разобраться где у вас там что, то мне куда уж :)

Notsaint 09-03-2010 08:11 1364038

Цитата:

Цитата vadblm
вы не можете разобраться »

Виноват, но для человека как :cool: я, 4 раз смотревшего на Райд, все-таки... :).

Итак, Вы, как профессионал, оказались правы.

2х70 представляют собой райд 1, на котором находится система (у меня отображается как диск С);
3х140 представляют собой райд 5, которой указывает на дополнительный массив (отображается как диск Д).

Теперь еще: я вытащил эту ошибочную 70, подождал немного (ну осмотрел его кончено) и вставил опять в его родное гнездо. Он замигал и надолго. Включив программу SERVERaid, я увидел, что тот диск проходит перестройку (rebuilding) сам! Видимо так установлено в самой программе. Однако по окончании перестройки - опять та же картина. К сожалению, я не успел заглянуть в лог перестройки. Попробую сегодня

vadblm 09-03-2010 08:17 1364042

Цитата:

Цитата Notsaint
Включив программу SERVERaid, я увидел, что тот диск проходит перестройку (rebuilding) сам! Видимо так установлено в самой программе. »

Ну всё верно, так и должно было быть. Только вот зачем вы вставили убитый диск обратно - непонятно ;) Вставили бы новый и на этом ваши труды закончились.

Notsaint 09-03-2010 08:44 1364054

Цитата:

Цитата vadblm
на этом ваши труды закончились »

Так не дошел еще пока :(

vadblm 09-03-2010 08:49 1364057

Всмысле новый диск ещё у вас не на руках? Ну для RAID1 это ничего, можно подождать. А вот если б сдох диск в RAID5, был бы очень серьёзный повод для беспокойства, я уже выше писал почему.

Notsaint 09-03-2010 09:51 1364096

Все равно - повод для беспокойства есть всегда.

В общем я посмотрел лог (если его можно так назвать) перестройки. Процесс проходит нормально, 100%, диск переходит в нормальное состояние ... на 30 минут. Потом опять все снова



Значит вставка нового решит все проблемы?.. Будем ждать тогда

vadblm 09-03-2010 09:59 1364103

Можете в ожидании посмотреть, за что контроллер выкинул диск. Показания SMART тобишь. И у остальных это тоже будет нелишне.

Notsaint 09-03-2010 11:17 1364152

Цитата:

Цитата vadblm
Показания SMART тобишь »

Ваш совет - чем лучше проверить с учетом того, что это рейд?

vadblm 09-03-2010 11:23 1364156

А родная утилита менеджмента разве не умеет? Я, к сожалению, не имел дела c ServeRAID 7k на виндовс.

Notsaint 09-03-2010 11:38 1364165

Нет, родная утилита из-под Windows не умеетю А перезагружать... чревато

vadblm 09-03-2010 11:44 1364171

Да перезагрузка не поможет, устройства на вашем контроллере за семью печатями, гг. Как я не люблю проприетарные железки с их вые-онами...

Notsaint 09-03-2010 11:52 1364175

В принципе я доволен. Но вот эта ситуация...

Виктория - не видит, HDDScan - не видит тоже...

vadblm 09-03-2010 12:07 1364188

Цитата:

Цитата Notsaint
Виктория - не видит, HDDScan - не видит тоже... »

и smartctl тоже не увидит. Выше сказано, почему.

Ment69 09-03-2010 13:49 1364275

Notsaint, Мой вам совет, учитывая
Цитата:

Цитата Notsaint
я вытащил эту ошибочную 70, подождал немного (ну осмотрел его кончено) и вставил опять в его родное гнездо. »

дождитесь HDD для замены.

Цитата:

Цитата Notsaint
Попадался на глаза пост, что во время проведения "ребилдинга" данные восстановились, но с откатом на две недели назад. Меня такой вариант не очень устраивает »

Не путайте софтовый райд с вашим случаем!

Проверить HDD вы можете в утилите вашего райд-контроллера, там наверняка есть утилита для проверки дисков, только предупреждаю проверка вашего диска займет очень много времени.


Время: 04:05.

Время: 04:05.
© OSzone.net 2001-