Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Непонятные проблемы с Железом (http://forum.oszone.net/forumdisplay.php?f=48)
-   -   Проблемы с RAID контроллером (http://forum.oszone.net/showthread.php?t=185979)

zakbc 20-09-2010 13:48 1499811

Проблемы с RAID контроллером
 
Предистория:
Сервер Dell 1850(Два SCSI винта по 73 гбайта- работали в Raid1) работает на Windows 2003, Microsoft SQL Server.
Работал нормально(ниодного сбоя).
Но в определенны момент выбило ошибку с синем екраном. Сервер перестал загружатся, точнее загружался до заставки Windows.
Был на выключеном Сервере снят один из Винтов (сервер поддерживает гарячую замену). Поочеродно проверено, не из какого винта не загружался.
Но, при включении биос начал выбивать что загрузка без второго винта невозможна.
После установки обратно двох винтов результата не дало.
Через некоторое время, было определено, что raid вообще отключился, автоматически с BIOSa.
Повотрное включение и сбор рейда, начал выбивать ошибку(до этого ее не было), что батарейка на райд - села, была проверена батарейка, показала нормальный заряд.
При установке Windows, рейд разбился на два винта, отформатировался, но на 27 % копирования файлов выкидывал в перезагрузку.
В результате винты не собирались в raid, а были запущены так, по отдельности, уже 4 сутки работают без сбоев.

Вопрос:
1. В чем может быть проблема?
2. Может ли этого происходит без постороннего вмешательства, тоесть само-собой?
3. Или мог повлиять человеческий фактор (меня в тот момент возле сервера не было)?
4. Как такие вещи можно предусмотреть? И как боротся?

Заранее благодарен за ответы.

DVDshnik 20-09-2010 14:36 1499843

Цитата:

Цитата zakbc
батарейка на райд - села, была проверена батарейка, показала нормальный заряд. »

Чем проверялось? Вольтметром или же светодиодом?

zakbc 20-09-2010 20:08 1500143

вольтметром конечно

Ment69 20-09-2010 20:37 1500177

Цитата:

Цитата zakbc
начал выбивать ошибку(до этого ее не было), что батарейка на райд - села »

Скорее всего вы не верно перевели :) На подобных серверах подобная ошибка выскакивает по прошествии определенного времени - проверьте дату в биосе.
Цитата:

Цитата zakbc
При установке Windows, рейд разбился на два винта »

ВЫ перед тем как устанавливать заходили в меню райд контроллера? В каком состоянии был райд-массив? Возможно он был в ребилде и надо было дождаться окончания операции.

Уважаемый Dell PowerEdge 1850 мне тебя искренне жаль, тебя просто не понимают и не ценят :)

cameron 20-09-2010 22:35 1500275

Цитата:

Цитата Ment69
На подобных серверах подобная ошибка выскакивает по прошествии определенного времени - проверьте дату в биосе. »

думаю что perc 4 (а там скорее всего именно он), писал о том, что начался цикл перезарядки батареи =)
Цитата:

Цитата zakbc
1. В чем может быть проблема? »

в винтах, менее вероятно в контроллере.
Цитата:

Цитата zakbc
2. Может ли этого происходит без постороннего вмешательства, тоесть само-собой? »

теоритически да. 1850 это уже лет наверно 6-7 ему, старичок.
Цитата:

Цитата zakbc
3. Или мог повлиять человеческий фактор (меня в тот момент возле сервера не было)? »

Цитата:

Цитата zakbc
4. Как такие вещи можно предусмотреть? И как боротся? »

использовать Dell Open Server Manager, он много чего рассказывает.

zakbc 21-09-2010 00:07 1500328

Цитата:

Цитата Ment69
Цитата zakbc:
начал выбивать ошибку(до этого ее не было), что батарейка на райд - села »
Скорее всего вы не верно перевели На подобных серверах подобная ошибка выскакивает по прошествии определенного времени - проверьте дату в биосе. »

Та нет, да кстати в биосе времени ошибки не показывает...

Цитата:

Цитата Ment69
Цитата zakbc:
При установке Windows, рейд разбился на два винта »
ВЫ перед тем как устанавливать заходили в меню райд контроллера? В каком состоянии был райд-массив? Возможно он был в ребилде и надо было дождаться окончания операции. »

Он не существовал, когда я к нему добрался, в биосе вообще рейд был отключен, после включения, я добрался до меню рейд контроллера, но он не существовал.

Цитата:

Цитата cameron
Цитата Ment69:
На подобных серверах подобная ошибка выскакивает по прошествии определенного времени - проверьте дату в биосе. »
думаю что perc 4 (а там скорее всего именно он), писал о том, что начался цикл перезарядки батареи »

Нет, он писал именно что ошибка (кажется инициализации, или сбой) батарейки, но точно не перезарядки.

Цитата:

Цитата cameron
Цитата zakbc:
1. В чем может быть проблема? »
в винтах, менее вероятно в контроллере. »

Ну это понятно, но в этом случае винты полностю рабочие.

Цитата:

Цитата cameron
Цитата zakbc:
2. Может ли этого происходит без постороннего вмешательства, тоесть само-собой? »
теоритически да. 1850 это уже лет наверно 6-7 ему, старичок. »

Кажется лет 5.

Цитата:

Цитата cameron
Цитата zakbc:
3. Или мог повлиять человеческий фактор (меня в тот момент возле сервера не было)? »
Цитата zakbc:
4. Как такие вещи можно предусмотреть? И как боротся? »
использовать Dell Open Server Manager, он много чего рассказывает. »

Попробуем :)

DVDshnik 21-09-2010 06:47 1500438

Цитата:

Цитата zakbc
вольтметром конечно

Отвер неверный. Батарейки и аккумуляторы следует проверять под нагрузкой. Для распространённых в компьютерной технике литиевых трёхвольтовых батареек такой нагрузкой является обыкновенный светодиод.

Ment69 21-09-2010 08:50 1500480

Цитата:

Цитата zakbc
Он не существовал, когда я к нему добрался »

Произошел сброс биоса по дефолту, возможно из-за севшей батарейки. По совету DVDshnik я взял со старой системной платы гнездо под батарейку, припаял к ней светодиод с морды старого компьютера и теперь у меня быстрый и надежный пробник для батареек CR2032 :)
При включении райд контроллера в биосе все должно было восстановится.

zakbc 21-09-2010 12:51 1500636

попробую.
Но опять же, он же не мог вылететь на рабочем пк, или может?
И почему тогда винты не поднялись по отдельности?

zakbc 21-09-2010 13:08 1500647

Есть такие подозрения:
1. Батарейка все таки сдохла;
2. Скорее всего при копировании файлы пишутся на память контроллера, в этом сервере, стоит память 256 мбайт, и есть подозрения, что по объему файлов, они заливались туда, ну дальше не сливались на винт (это как вариант), ибо выскочила еще одна ошибка, о том, что мало виртуальной памяти (это при загрузке BIOS).

Остается вопрос открытым, почему винты по одному не запустились, скорее всего, но на этот счет есть тоже ответ: контроллер начал сбоить во время работы, некоторые файлы, не записались, или были повреждены, а учитывая, что винты были собраны, ошибка записалась на обеих.

Остался один открытый вопрос:
Возможно ли, что из-за мертвой батарейки, полетели при включенном сервере настройки контроллера?

Такой вариант возможен?

Ment69 21-09-2010 13:24 1500662

Цитата:

Цитата zakbc
Остается вопрос открытым, почему винты по одному не запустились »

Потому что контроллер работал в другом режиме.
Можно попробовать запустить Live CD и с него посмотреть содержимое HDD.
Батарейка на контроллере служит для сохранения информации в кэше, если она села, при выключении питания эта информация будет потеряна.


Время: 15:44.

Время: 15:44.
© OSzone.net 2001-