Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Накопители (SSD, HDD, USB Flash) (http://forum.oszone.net/forumdisplay.php?f=53)
-   -   [решено] Intel RAID5 в состоянии Degraded (http://forum.oszone.net/showthread.php?t=285829)

Tonny_Bennet 31-07-2014 12:50 2383602

Intel RAID5 в состоянии Degraded
 
Здравствуйте.

Есть сервер. Он далеко и доступ только по RDP. Материнка Intel S5500BC. не мною Развернут RAID5 из трёх дисков. На сервере крутится MS SQL с несколькими базами 1С. Сотрудники начали жаловаться на тормоза в работе. Зашёл в монитор ресурсов - там было 100 процентов активного времени использования дисков. Поставил утилиту от Intel RAID Web Console 2. Увидел, что логический массив в состоянии Degraded, все физические диски Online.

Ниже текстовый вариант конфигурации:

Server Profile

Код:

SERVER---
        Server IP:              192.168.3.2
        Server Name:            profit-main
        OS name:                Windows Server 2008
        OS Version:              6.0
        OS Architecture:        x86_64
        Driver Name:            LSI MegaSR RAID5
        Driver Version:          14.05.0727.2011
        Application Version:    RAID Web Console 2 - 14.02.01.03

HARDWARE---             
        Controller:              Intel Embedded Server RAID Technology II(Bus 0,Dev 31)
        Status:                  Needs attention
        Firmware Package Version:
        Firmware Version:        null
        BBU:                    NO
        Enclosure(s):            0
        Drive(s):                3
        Virtual Drive(s):        1

Drives:---
        PRODUCT ID              VENDOR ID                STATE                    DISK TYPE                CAPACITY                POWER STATE             
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               

Optical Drives---
        PRODUCT ID              VENDOR ID                SCSI Device Type        REVISION LEVEL         
        OptiarcDVDRWA            ATA                      CDROM                    31 0                   

Virtual Drive(s):---
        TARGET ID                NAME                    CAPACITY                STATE                    RAID LEVEL              MegaRAID RECOVERY       
        0                        MegaSR  R5 #0          695.695 GB              Degraded                RAID  5                  NO



Что меня смущает: в этой программке я не вижу причины почему массив перешёл в состояние Degraded. Не вижу смарта дисков и их ошибок. Также в сети да и в мануале говорится о пункте меню Operations. У меня почему-то такого пункта в ПО нет. Может быть так, что ПО не стыкуется с контроллером, контроллером, что-то не включено в BIOS контроллера.

vadblm 02-08-2014 18:41 2384509

Предположу, что контроллер потерял полудохлый диск, но потом опять подцепил и сейчас идёт ребилд. По идее, об этом должно сообщаться в мониторинге, но к сожалению, я не знаком с подходящим софтом для этого в Windows. Но картина как раз такая, когда ребилдится RAID5.

Во всяком случае, сервер нужно переделывать, RAID5, да ещё всего на 3 дисках при серьёзном использовании дисковой подсистемы, это выстрел в ногу.

И бэкап делайте незамедлительно, если ещё не сделали!

Ment69 03-08-2014 07:54 2384602

Цитата:

Цитата vadblm
и сейчас идёт ребилд »

Тогда бы состояние массива было - ребилд.

Tonny_Bennet 04-08-2014 10:53 2384947

Цитата:

Цитата vadblm
Во всяком случае, сервер нужно переделывать, RAID5, да ещё всего на 3 дисках при серьёзном использовании дисковой подсистемы, это выстрел в ногу. »

Прекрасно понимаю что это косяк, но как и говорил - собирал его не я :).

Цитата:

Цитата vadblm
но потом опять подцепил и сейчас идёт ребилд. »

Цитата:

Цитата Ment69
Тогда бы состояние массива было - ребилд. »

Не могу разобраться в непонятном ПО от Intel. Там только статус Degraded и больше ничего. И ничего сделать нельзя. Наверное придётся ехать в другой город и ребилдить массив на месте. Или сломать всё и поднять RAID10 на новых дисках.

Tonny_Bennet 04-08-2014 13:52 2385037

Для инофрмации. Согласовал с руководством замену всего дискового массива и развёртывание двух логических томов для баз данных RAID10 и для системы RAID1. Позвонил айтишнице и попросил узнать сколько влезает дисков в корзину. Она сказала, что там сейчас установлено пять и есть место для шестого. Зашёл ещё раз в утилиту конфигурирования. Там видны уже четыре диска, один в состоянии offline.

Server Profile

Код:

SERVER---
        Server IP:              192.168.3.2
        Server Name:            profit-main
        OS name:                Windows Server 2008
        OS Version:              6.0
        OS Architecture:        x86_64
        Driver Name:            LSI MegaSR RAID5
        Driver Version:          14.05.0727.2011
        Application Version:    RAID Web Console 2 - 14.02.01.03

HARDWARE---             
        Controller:              Intel Embedded Server RAID Technology II(Bus 0,Dev 31)
        Status:                  Needs attention
        Firmware Package Version:
        Firmware Version:        null
        BBU:                    NO
        Enclosure(s):            0
        Drive(s):                4
        Virtual Drive(s):        1

Drives:---
        PRODUCT ID              VENDOR ID                STATE                    DISK TYPE                CAPACITY                POWER STATE             
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Offline                  SATA                    231.898 GB              On                                               

Optical Drives---
        PRODUCT ID              VENDOR ID                SCSI Device Type        REVISION LEVEL         
        OptiarcDVDRWA            ATA                      CDROM                    31 0                   

Virtual Drive(s):---
        TARGET ID                NAME                    CAPACITY                STATE                    RAID LEVEL              MegaRAID RECOVERY       
        0                        MegaSR  R5 #0          695.695 GB              Degraded                RAID  5                  NO



P.S. Командировка и бессонная ночь впереди.

vadblm 04-08-2014 21:59 2385211

Цитата:

Цитата Tonny_Bennet
Там видны уже четыре диска, один в состоянии offline. »

Значит, всё ещё хуже, диск отвалился совсем и вы каждый момент рискуете потерять всё. А что контроллер (или его драйвер, или утилита, снимающая с него показания) врёт, радости не добавляет.
Раз так, я бы не рисковал, поменял всю железку, а не ограничился перестройкой массива. А эту на диагностику и может поживёт ещё.
Цитата:

Цитата Tonny_Bennet
установлено пять »

М.б. это был hot-spare и тоже потерялся в веках и глюках. Хотя уже и гадать не хочется, так всё скверно выглядит. Скверно потому, что нет достоверной инфы.

Цитата:

Цитата Tonny_Bennet
Прекрасно понимаю что это косяк, но как и говорил - собирал его не я . »

Я не упрекаю, не нужно оправдываться. Просто всё очень плохо было изначально. Не сделать мониторинг (и проверить его работу) с уведомлением хотя бы по почте — верх безответсвенности. Тут либо настраивавший поленился, либо заказчику пох.
Цитата:

Цитата Tonny_Bennet
P.S. Командировка и бессонная ночь впереди. »

Удачи.

Tonny_Bennet 05-08-2014 22:26 2385524

Цитата:

Цитата Tonny_Bennet
P.S. Командировка и бессонная ночь впереди. »

Я на месте, пишу с фронта :).

В корзине стоит пять дисков. Система видела 3. Как из RAID5 убрать два диска и система останется рабочей я не знаю, но у меня работает. Поправил шлейфы в корзине; система увидела 5. Из новеньких: один оффлайн, второй Unconfigured Good. Что-то мне кажется, что про последнего забыли, когда массив собирали. Или специально оставили про запас. Итого RAID5 из 4-х дисков и один не в массиве.

При запуске сервера утилита конфигурирования RAID говорит, что всё плохо и предлагает сделать ребилд. Прождал 15 минут, даже на 1 процент прогресс не сдвинулся. Отменил. Перезапустил сервер.

Попробовал диск из оффлайн перевести в онлайн (из под Windows). Система стала безбожно виснуть. Потом диск снова перешёл в оффлайн. Скорее всего это и есть мой косячный винт. Но как его определить в корзине не знаю. Она без индикации и понять кто есть кто не получится.

Думал убрать сбойный винт и добавить в массив нормальный, потом запустить ребилд. Боязно что не поднимется.

Решение о замене дисков на новые уже принято руководством и следующая ночь будет посвящена именно этому.

Server Profile

Код:

SERVER---
        Server IP:              192.168.3.2
        Server Name:            profit-main
        OS name:                Windows Server 2008
        OS Version:              6.0
        OS Architecture:        x86_64
        Driver Name:            LSI MegaSR RAID5
        Driver Version:          14.05.0727.2011
        Application Version:    RAID Web Console 2 - 14.02.01.03

HARDWARE---             
        Controller:              Intel Embedded Server RAID Technology II(Bus 0,Dev 31)
        Status:                  Needs attention
        Firmware Package Version:
        Firmware Version:        null
        BBU:                    NO
        Enclosure(s):            0
        Drive(s):                5
        Virtual Drive(s):        1

Drives:---
        PRODUCT ID              VENDOR ID                STATE                    DISK TYPE                CAPACITY                POWER STATE             
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Online                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Failed                  SATA                    231.898 GB              On                                               
        ST3250310NS              ATA                      Unconfigured Good        SATA                    231.898 GB              On                                               

Optical Drives---
        PRODUCT ID              VENDOR ID                SCSI Device Type        REVISION LEVEL         
        OptiarcDVDRWA            ATA                      CDROM                    31 0                   

Virtual Drive(s):---
        TARGET ID                NAME                    CAPACITY                STATE                    RAID LEVEL              MegaRAID RECOVERY       
        0                        MegaSR  R5 #0          695.695 GB              Degraded                RAID  5                  NO


User001 06-08-2014 07:51 2385592

Цитата:

Цитата Tonny_Bennet
При запуске сервера утилита конфигурирования RAID говорит, что всё плохо и предлагает сделать ребилд. Прождал 15 минут, даже на 1 процент прогресс не сдвинулся. Отменил. Перезапустил сервер. »

Всегда "радуют" такие моменты...
Цитата:

Цитата Tonny_Bennet
Решение о замене дисков на новые уже принято руководством и следующая ночь будет посвящена именно этому. »

А восстанавливать как будете?

Tonny_Bennet 06-08-2014 10:41 2385632

Цитата:

Цитата User001
Всегда "радуют" такие моменты... »

Заменил фейловый диск на нормальный. Радуюсь ребилду второй час. Всё ещё 0%.

Цитата:

Цитата User001
А восстанавливать как будете? »

Цитата:

Цитата vadblm
И бэкап делайте незамедлительно, если ещё не сделали! »

Бекапы баз делались раз в сутки и скидывались на внешний диск. Ещё в последний момент слил сами файлы *.mdf *.ldf.

Попробую развернуть сервер 1С + MS SQL на обычном компе. Пришёл утром. На сервере синий экран и траблы с дисками.

User001 06-08-2014 11:13 2385645

Цитата:

Цитата Tonny_Bennet
Попробую развернуть сервер 1С + MS SQL на обычном компе. Пришёл утром. На сервере синий экран и траблы с дисками.»

Интересно в данной ситуации как произойдет создание / восстановление ОС из бекапа...

Tonny_Bennet 06-08-2014 11:19 2385649

Цитата:

Цитата User001
Интересно в данной ситуации как произойдет создание / восстановление ОС из бекапа... »

Делались бекапы баз данных. Так что нужно развернуть ОС самому, в ней развернуть MS SQL Server, и уже внутри него развернуть бекапы.

vadblm 06-08-2014 22:23 2385911

Цитата:

Цитата Tonny_Bennet
В корзине стоит пять дисков. Система видела 3. Как из RAID5 убрать два диска и система останется рабочей я не знаю, но у меня работает. Поправил шлейфы в корзине; система увидела 5. Из новеньких: один оффлайн, второй Unconfigured Good. Что-то мне кажется, что про последнего забыли, когда массив собирали. Или специально оставили про запас. Итого RAID5 из 4-х дисков и один не в массиве. »

Из RAID 5 2 диска никак не убрать, второй очевидно был задуман как hot spare, но либо его недоконфигурили, либо глюк.
Цитата:

Цитата Tonny_Bennet
Делались бекапы баз данных. Так что нужно развернуть ОС самому, в ней развернуть MS SQL Server, и уже внутри него развернуть бекапы. »

Ну хоть так.

А основную машинку нужно лечить серьёзно, узнать почему диски потерялись, почему нашлись после перетыка (оксил на контактах? полудохлые кондёры на контроллере? хз). Диски точно менять, причём все. Желательно всю машинку заменить, но если с бюджетом туго, то можно попытаться гальванизировать труп, хотя судя по описанию, ей и так пора на списание, пардон за каламбур. Как правильно сделать массив вы сами знаете, про мониторинг не забудьте.

Tonny_Bennet 06-08-2014 22:51 2385921

Цитата:

Цитата vadblm
Из RAID 5 2 диска никак не убрать, второй очевидно был задуман как hot spare, но либо его недоконфигурили, либо глюк. »

Возможно и был задуман как hot spare да только как его отличить от остальных я так и не понял (корзина без индикации для каждого диска; просто ящик с охлаждением) Методом тыка нашёл убитый диск и подцепил на его место тот неведомый. Запустил ребилд. За 1 час прогресс сдвинулся на 2 процента. За это время как раз и развернул резервный сервер, на котором поднялась 1С и MS SQL.

Цитата:

Цитата vadblm
А основную машинку нужно лечить серьёзно, узнать почему диски потерялись, почему нашлись после перетыка (оксил на контактах? полудохлые кондёры на контроллере? хз). »

Всяко бывает. Склоняюсь к дискам ибо из 5 отзывов - 4 с негативом типа "сдох через пол года". Эти жили не менее 5 лет. Вернусь в свой офис оттестирую диски.

Цитата:

Цитата vadblm
Диски точно менять, причём все. »

Уже сделано :)

Цитата:

Цитата vadblm
Желательно всю машинку заменить, но если с бюджетом туго, то можно попытаться гальванизировать труп, хотя судя по описанию, ей и так пора на списание, пардон за каламбур. »

С бюджетом и правда напряг. Выделили не много. Поставил шесть таких.

Цитата:

Цитата vadblm
Как правильно сделать массив вы сами знаете, про мониторинг не забудьте. »

Развернул RAID 10 из 4 дисков для БД и RAID1 для системы. С диска на диск файл копируется со скоростью более 350МБ/с. Другие тесты скорости пока не проводил. Разворачивал новую ОСь и СУБД. Настраивал 1С. Поставил утилиту от Intel, о которой писал выше. В настройках можно прописать уведомление на почту при критических ошибках и варнингах.

vadblm 06-08-2014 23:28 2385934

Цитата:

Цитата Tonny_Bennet
В настройках можно прописать уведомление на почту при критических ошибках и варнингах. »

Это не можно, а нужно сделать и проверить, как работает.

cameron 07-08-2014 22:13 2386355

топиг агонь!
очень жаль, что системные администраторы не умеют считать объёмы массивов.
я таких на работу не беру :)
RAID5 = n-1. где n -кол-во дисков в массиве.
у вас raid5 на 4 дисках, один из которых вышел из строя.

порядок дальнейших действий:
1. бэкап (этот пункт обязателен,у вас SATA диски.
2. установка подходящего диска, ребилд.
3. замена дисков на SAS, если бэкплейн и контроллер это поддерживают (подробнее в мане от материнки, недоинтелы я не знаю).
4. RTFM, RTFM,RTFM до просветления.

vadblm 07-08-2014 22:19 2386360

Цитата:

Цитата cameron
очень жаль, что системные администраторы не умеют считать объёмы массивов.
я таких на работу не беру
RAID5 = n-1. где n -кол-во дисков в массиве. »

Вы это к чему, капитан?

Tonny_Bennet 08-08-2014 12:29 2386524

Цитата:

Цитата vadblm
Это не можно, а нужно сделать и проверить, как работает. »

Формулируя "можно сделать" я ставил систему, подразумевая что сделаю когда поставлю. Уже сделано.

Цитата:

Цитата cameron
топиг агонь!
очень жаль, что системные администраторы не умеют считать объёмы массивов. »

Не все.
или это камень в мой огород?

Цитата:

Цитата cameron
я таких на работу не беру »

Есть открытые вакансии?


Цитата:

Цитата cameron
1. бэкап (этот пункт обязателен,у вас SATA диски. »

Если представить что массив заполнен полностью то для бекапа потребуется объём на один диск меньше чем размер массива. Не всегда такое есть под рукой.
Цитата:

Цитата cameron
2. установка подходящего диска, ребилд. »

Чуть выше я писал, что два процента прогресса ребилда заняло около часа. Т.е. весть ребилд в 100 процентов мог занять около 50 часов = чуть более 2-х суток. Плюс ещё не совсем понятно как там остальные диски себя поведут. Экономически целесообразнее было сделать бекап нужного, перенести роли сервера на другой сервер, заменить все диски (предварительно купив их) и собрать новый массив (собрать не 5-й, а 10 RAID т.к. используется MS SQL), перенести роли сервера обратно. Всё вышеописанное стало в 10-12 часов.

Цитата:

Цитата cameron
3. замена дисков на SAS, если бэкплейн и контроллер это поддерживают (подробнее в мане от материнки, недоинтелы я не знаю). »

Увы, но мать поддерживает только SATA II. SAS контроллер и SAS диски руководство даже не рассматривало.

Цитата:

Цитата cameron
4. RTFM, RTFM,RTFM до просветления. »

Вы про общевойсковые общеадминские M говорите или имеете ввиду что-то конкретное?

User001 08-08-2014 12:41 2386530


Цитата:

Цитата Tonny_Bennet
Если представить что массив заполнен полностью то для бекапа потребуется объём на один диск меньше чем размер массива. Не всегда такое есть под рукой.»

Объем же небольшой у массива был, на тот же внешний HDD. Другое дело, что все это медленно, а надо как обычно, все и сразу...
Цитата:

Цитата Tonny_Bennet
Есть открытые вакансии?»

+1

cameron 08-08-2014 13:02 2386540

Цитата:

Цитата vadblm
Вы это к чему, капитан? »

это я к тому, что первом посте (то есть в описании проблемы) был ясный и чёткий ответ на вопрос, почему же массив в статусе Degraded.
ответа на этот очевидный вопрос ТС не получил.
это плохо.
Цитата:

Цитата Tonny_Bennet
Если представить что массив заполнен полностью то для бекапа потребуется объём на один диск меньше чем размер массива. Не всегда такое есть под рукой. »

если представить, что данные на массиве имеют хоть какую-то ценность, то топаем в магазин и берём сохо нас на 1Тб (у вас там 650Гб всего), или USB винт и перегоняем данные туда.
по 1G Ethernet в данном случае быстрее было бы ;)
на чтение деградированная пятёрка почти не проседает.
Цитата:

Цитата Tonny_Bennet
Чуть выше я писал, что два процента прогресса ребилда заняло около часа. Т.е. весть ребилд в 100 процентов мог занять около 50 часов = чуть более 2-х суток. »

1. ребилд пятёрки всегда медленно.
2. вы, видимо, не убрали нагрузку с массива, вот и результат.
3. есть подозрение, что контроллер без BBU и кеша.
Цитата:

Цитата Tonny_Bennet
Плюс ещё не совсем понятно как там остальные диски себя поведут. »

это очень верное опасение, особо в разрезе SATA дисков.
Цитата:

Цитата Tonny_Bennet
Увы, но мать поддерживает только SATA II. SAS контроллер и SAS диски руководство даже не рассматривало. »

для MS SQL не нужно даже рассматривать SATA и бортовые недоконтроллеры.
начинать нужно с этой аксиомы, а всё остальное это уже дурь.

P.S. вакансий нет.

User001 08-08-2014 13:24 2386551

Цитата:

Цитата cameron
1. ребилд пятёрки всегда медленно.
2. вы, видимо, не убрали нагрузку с массива, вот и результат.
3. есть подозрение, что контроллер без BBU и кеша. »

Видел RAID 6 из дисков SAS и SATA, причем разного размера (видимо для "эффективного" использования дисков большей емкости :) )? Такое, когда посыпется, сразу убивают и делают нормальные массивы или ждут ребилда?
Цитата:

Цитата cameron
P.S. вакансий нет. »

T_T

Tonny_Bennet 08-08-2014 13:30 2386557

Цитата:

Цитата cameron
это я к тому, что первом посте (то есть в описании проблемы) был ясный и чёткий ответ на вопрос, почему же массив в статусе Degraded.
ответа на этот очевидный вопрос ТС не получил.
это плохо. »

Да, ответа как такового нет, но как факт могу заявит,ь что один из дисков попросту отвалился и никак не определялся системой. Ещё один не был виден вовсе. Старые диски на следующей неделе приедут ко мне поближе и тогда смогу сделать тесты поверхности, смарт и всё остальное.

Т.к. в этом подразделении зимой пару раз выключали свет и сервер перевозили во временный офис - тряска и тому подобное могло повлиять на контакты (а может и на диски).

Цитата:

Цитата cameron
если представить, что данные на массиве имеют хоть какую-то ценность, то топаем в магазин и берём сохо нас на 1Тб (у вас там 650Гб всего), или USB винт и перегоняем данные туда.
по 1G Ethernet в данном случае быстрее было бы
на чтение деградированная пятёрка почти не проседает. »

Согласен. Бекап я сделал на соседнее хранилище. Но на ребилд нужно время, на которое нужно было остановить работу компании.

Цитата:

Цитата cameron
2. вы, видимо, не убрали нагрузку с массива, вот и результат. »

Ребилд был запущен из консольной утилиты контроллера с псевдографическим интерфейсом, до загрузки самой системы.

Цитата:

Цитата cameron
3. есть подозрение, что контроллер без BBU и кеша. »

Подозрения верны. Точнее я не могу ничего утверждать т.к. не могу на сайте производителя найти нормальное описание характеристик материнки. В ПО указано
Цитата:

BBU: NO
. Кеш быть может тоже есть, но берётся из оперативки и следовательно энергозависим. Вот что есть на nix.ru
Цитата:

Встроен в чипсет, возможно построение RAID массивов уровней 0, 1, 10 из Serial ATA устройств, возможна поддержка RAID5 при установке приобретаемого отдельно ключа AXXRAKSW5
Цитата:

Цитата cameron
для MS SQL не нужно даже рассматривать SATA и бортовые недоконтроллеры.
начинать нужно с этой аксиомы, а всё остальное это уже дурь. »

Бюджет.
Как говорится: скупой платит дважды, тупой трижды, а ты, баран, будешь платить всегда! Пока не могу донести сию истину до руководства

Цитата:

Цитата cameron
P.S. вакансий нет. »

:cry:

cameron 08-08-2014 23:07 2386827

Цитата:

Цитата User001
Видел RAID 6 из дисков SAS и SATA, причем разного размера (видимо для "эффективного" использования дисков большей емкости :) )? Такое, когда посыпется, сразу убивают и делают нормальные массивы или ждут ребилда? »

я не вижу профита от такого массива, поэтому что с ним делать - ума не приложу.
наверно развалить и сделать пару других.

vadblm 08-08-2014 23:18 2386829

Цитата:

Цитата cameron
это я к тому, что первом посте (то есть в описании проблемы) был ясный и чёткий ответ на вопрос, »

Либо вы Ванга, либо просто сбрехнули.

cameron 09-08-2014 00:05 2386845

Цитата:

Цитата vadblm
Либо вы Ванга, либо просто сбрехнули. »

да вы что?
окай.
объём массива указанного как degraded
695.695 GB, а это, сюрприз, 231.898 GB *3.
идём дальше?
массив жив, но деградирован, а формула рассчёта райд5 это n-1 (повторяюсь), отсюда вывод - массив состоял из 4-х дисков, один из которых вышел строя.

ещё один не умеющий считать массивы? :)

vadblm 09-08-2014 00:15 2386851

Цитата:

Цитата cameron
695.695 GB, а это, сюрприз, 231.898 GB *3. »

Ясно. Приношу извинения.

Tonny_Bennet 14-08-2014 11:37 2389115

Приехали диски. Протестировал сбойный на битые секторы.





Такое количество bad-секторов может быть обусловлено проблемой контроллера диска, прошивкой или ещё чем-то? Или у диска действительно 99% поверхности просто нечитабельны?

Проверяем остальные диски. Они в целом нормальные: смарт зелёный, бед-секторов нет.

cameron 14-08-2014 19:51 2389348

Tonny_Bennet,
Цитата:

Цитата Tonny_Bennet
Такое количество bad-секторов может быть обусловлено проблемой контроллера диска, прошивкой или ещё чем-то? Или у диска действительно 99% поверхности просто нечитабельны?
Проверяем остальные диски. Они в целом нормальные: смарт зелёный, бед-секторов нет. »

простите за оффтоп, но зачем тратить время на диски, которые стоят по 10$, и то если повезёт?

Tonny_Bennet 21-08-2014 10:46 2392156

Цитата:

Цитата cameron
простите за оффтоп, но зачем тратить время на диски, которые стоят по 10$, и то если повезёт? »

А как же докопаться до истины? Вдруг все диски целые были бы а проблема в порте контроллера плате или в самом контроллере? Наверняка единственно верный ответ это износ и выработанный ресурс. Но т.к. я очень мало знаю - я всегда ищу подводные камни в любой проблеме. И в основном вопрос не в цене, а в саморазвитии.

cameron 21-08-2014 10:50 2392159

Цитата:

Цитата Tonny_Bennet
А как же докопаться до истины? Вдруг все диски целые были бы а проблема в порте контроллера плате или в самом контроллере? Наверняка единственно верный ответ это износ и выработанный ресурс. Но т.к. я очень мало знаю - я всегда ищу подводные камни в любой проблеме. И в основном вопрос не в цене, а в саморазвитии. »

у вас наверняка есть новые диски для рабочих станций.
ставите в сервер, собираете raid5 или 6 (главное чтобы с CRC), и iometer'ом гоняете пару суток.

bardzuk 24-10-2018 23:21 2837453

Intel - не Adaptec.
вечное теряние рабочих винтов и внеплановое переключение на любые другие по объему.
На новелле такого не было...
Там даже создавалась область диска для замещения бэдбдлоков.
А уникальные технологии новеля щас пытаются реализовать аппаратно, но малоуспешно!
RAID наиболее удачно реализовывал Adaptec, Интелу долго курить до этого!
Для нормального сервака на интеле не суйте много одинаковых помимо RAID винтов и включайте мыльное оповещение админа!
Да и то не факт!
Порой, софтварный лучше!
Хотите надёжку: Либо 5+1, либо иное, но без железки интела! Щыт ещё тот! 5, 6, 0+1 - круто! но, если хоть один сдохнет, на интеле - не восстановите, только чз PE, отключив RAID, да и то не факт
НЕ умеют, короче!

Даже то, что любой сказёывый адаптек мог бы!

Пока не сталкивался со сбоями с САСовскими винтами, но этож САТАСКАЗЗИ!
Поумнее винты. Поумнее контроллеры.
Кричит контроллер винта заранее!

bardzuk 24-10-2018 23:40 2837456

А интел что? Восстановить RAID?
А как, даже не спрашивает, козил.
Для него нужно вешать резервный пустой винт, и остальные меньшего объёма, чтоб не дай Тэнгри он их
не подключил к рэйду!

А интел что? Восстановить RAID?
А как, даже не спрашивает, козил.
Для него нужно вешать резервный пустой винт, и остальные меньшего объёма, чтоб не дай Тэнгри он их
не подключил к рэйду!
И ессно, оповещение админа, поскольку отключает он винты не физически, а логически. Чем лучше софтварного?
Софтварный, я думаю, стабильнее. Даже мастдайный!

Либо контроллер интегрированный от Adaptec, но это на серверных матерях....
Внешний не рекомендую....

Либо софтверный.

Либо на никсах сетевой.

Оппонентов спрошу: пытались восстанавливать?

bardzuk 25-10-2018 00:02 2837460

LSI - контроллеры хуже интела даже, к тому же младшая линейка даже не имеет расширения БИОСа, т.е. не поддерживает загрузку с массива.
Стабильности - минимум!
Кэш - слабо семафорится многоядерными и особливо виртуализированными системами.
Живут своей жистью!
Хотите потерять частично или полностью данные - выбирайте!

Частичная потеря - бзик этих!
Используйте шифрование ФС с проверкой, но это не для быстрых серверов!

Это, походу, предшественник интела....

На адаптеке диагностировать и/или восстановить любой рейд на уровне биоса- как два байта переслать!
попробуйте такое сделать предсказуемо по Crtl-I!

bardzuk 25-10-2018 00:22 2837463

Итог: Либо нормальный железный сервак, либо софтверный рэйд!
Если, конечно, вы - штатник, можно и дешёвый геммор под регулярным наблюдением и оповещением.
но быстро устанете....

cameron 25-10-2018 09:45 2837491

Цитата:

Цитата bardzuk
вечное теряние рабочих винтов и внеплановое переключение на любые другие по объему. »

да вы что. и давно это у них?
Цитата:

Цитата bardzuk
На новелле такого не было... »

какая связь между новелом и аппаратным контроллером? во времена новеля, кстати, были майлексы и промайсы.
Цитата:

Цитата bardzuk
А уникальные технологии новеля щас пытаются реализовать аппаратно, но малоуспешно! »

какие-то пруфы этого высказывания будут?
Цитата:

Цитата bardzuk
Хотите надёжку: Либо 5+1, либо иное, но без железки интела! Щыт ещё тот! 5, 6, 0+1 - круто! но, если хоть один сдохнет, на интеле - не восстановите, только чз PE, отключив RAID, да и то не факт
НЕ умеют, короче! »

какое-то сомнительное утверждение.
Цитата:

Цитата bardzuk
но этож САТАСКАЗЗИ! »

это что-то новое. что за протокол такой?
Цитата:

Цитата bardzuk
LSI - контроллеры хуже интела даже, к тому же младшая линейка даже не имеет расширения БИОСа, т.е. не поддерживает загрузку с массива.
Стабильности - минимум!
Кэш - слабо семафорится многоядерными и особливо виртуализированными системами.
Живут своей жистью!
Хотите потерять частично или полностью данные - выбирайте! »

intel=LSI. сюрприз.
Цитата:

Цитата bardzuk
Частичная потеря - бзик этих!
Используйте шифрование ФС с проверкой, но это не для быстрых серверов! »

какая связь между шифрованием ФС и аппаратным RAID массивом? и при чём тут вообще шифрование?
Цитата:

Цитата bardzuk
Итог: Либо нормальный железный сервак, либо софтверный рэйд!
Если, конечно, вы - штатник, можно и дешёвый геммор под регулярным наблюдением и оповещением.
но быстро устанете.... »

итог немного другой: нужно меньше эмоций и больше понимания процессов и технологий.
адаптеки (особенно младшие), как контроллеры, откровенный треш. старшие - лучше, но тоже не фонтан.
немного истории для, возможного, понимания: раньше, лет 13-15 назад Dell делал всё на адаптеке. сейчас - нет. LSI и только LSI.
причины этого в том, что глюки у адаптеков очень и очень весёлые.


Время: 07:04.

Время: 07:04.
© OSzone.net 2001-