![]() |
SCSI/SAS диски. Диагностика, ремонт.
Вопросы по различию команд ATA и SCSI. Позволяет ли интерфейс SAS (SCSI) производить операции REMAP и Reasign иначе чем с SATA?
|
misha2, если желаете, давайте уточним.
Цитата:
Если уж Вы требуете от меня безупречных формулировок, тогда и сами их используйте, логично? Цитата:
Термин "кластер" не используется никем, кроме Microsoft, и только по отношению к её собственным файловым системам. Термин "суперблок" используется в целом ряде файлов систем, таких как extX, reiserfs, XFS, HFS+, JFS, но означает совсем не то, что Вы думаете. Он представляет собой основной блок фс, содержащий гиперданные (данные о метаданных) файловой системы. Поэтому, как я уже отметил, задача состоит в том, чтобы сначала по номеру сектора определить к какому блоку он относится и установить свободен ли этот блок или распределен какому-то файлу. В файловых системах extX (т.е. ext2/ext3/ext4) для этой цели используется программа debugfs и последовательность команд icheck/ncheck. Большая просьба, если собираетесь пытаться меня поправлять, будьте любезны предварительно ознакомиться с существом проблемы по которой высказываетесь. Искренне прошу не обижаться на меня за это замечание. |
Цитата:
Цитата:
Цитата:
|
Вы правы. Форум о накопителях. Но есть одно "но". Сама по себе пустая железка никого не интересует. Как только с жестким диском начинают возникать проблемы, у всех сразу первым делом встает вопрос: "как спасти данные"?
А логическая структура данных поддерживается именно файловой системой. Поэтому, я полагаю, никому из людей с проблемными HDD не интересно знать, что для диагностики поверхности диска некоторое ПО от балды использует последовательность секторов определенной длины (причем разной) и называет это дело "блоком". Который ни физически, ни логически ничему не соответствует. Неинтересно пострадавшему как автор ПО назвал тот участок, к которому в данный момент обращение происходит. Вот ни капельки. А судьба своих любимых файлов ему, напротив, очень интересна. Поэтому, с моей точки зрения, всё-таки правильнее будет называть блоком именно ту структуру, которую так называют авторы ОС и драйверов файловых систем. Цитата:
Цитирую по стандарту. Команда "Reassign Blocks" (код команды 0x07): |
AMDBulldozer, сначала вы пишите:
Цитата:
Цитата:
Цитата:
|
IgNat, возможность выполнить операцию переназначения сектора, естественно, не зависит от операционной системы. Просто для Linux я команды знаю, а для Windows нет.
Возможны два варианта. Первый - у Вашего диска интерфейс SAS. Именно у диска. Если у Вас диск SATA подключенный к SAS контроллеру, ничего не выйдет. Так вот, среди SCSI block commands (SBC) есть команда переназначения группы секторов в резервную зону. Независимо от того, хорошие они или плохие - микропрограмма контроллера диска выполнит то, что ей приказали. Есть и другая команда. Прочитать список переназначенных секторов (GLIST). Выполнить принудительное переназначение [диапазона] секторов для SAS-диска можно в Linux командой sg_reassign. Если попробовать использовать эту команду с SATA устройством (а у подавляющего большинства домашних пользователей, согласитесь, именно диск с SATA интерфейсом), никакого результата не будет вообще. Набор команд SATA урезан по сравнению с командами SBC. И две упомянутые мной команды в него не вошли. Поэому остается одно - идти по пути "Виктории" и других подобных программ. Дать команду записи в нестабильный сектор, в надежде, что контроллер обнаружит ошибку и сам переназначит сектор на резервную зону. Таким образом, для разных типов интерфейса мы используем разные команды. sg_reassign, которая дает 100% результат для SAS и hdparm --repair-sector (или "hdparm --write-sector") для SATA дисков. Принципиальная разница между этими двумя ситуациями понятна. В случае SAS мы можем взять хороший сектор, принудительно его переназначить и нет никаких сомнений, что команда будет исполнена. Попытка переназначить не только хороший, но даже "слегка аномальный" сектор записью в него, естественно, уже не пройдет. Если контроллер не посчитает нужным - он ничего переназначать не будет. |
AMDBulldozer, спасибо. По сути:
Цитата:
|
IgNat,
для SAS: sg_reassign -a 1000 /dev/sda sg_reassign -a 1000 /dev/sda && sg_reassgn -a "$(echo {1001..2000})" /dev/sda Этот вариант годится для обоих интерфейсов: hdparm --repair-sector 1000 /dev/sda for i in {1000..2000}; do hdparm --repair-sector $i /dev/sda; done Как раз физические дефекты поверхности "--repair-sector" и отлавливает. Если сектор уже включен в список "нестабильных", количество которых фиксируется в 197-ом атрибуте, то любая попытка записи в него автоматически сопровождается последующим чтением. И если при чтении зафиксирована ошибка контрольных сумм, либо несовпадение записанной и прочитанной информации, сектор автоматически переназначается микропрограммой контроллера диска. |
AMDBulldozer,
Приведите лучше для примера формат, саму команду переназначения или переноса самого вендора, а не описание стандарта. Ради интереса. (подсказка - ключевое слово merge to p-list). |
Цитата:
|
Цитата:
|
Цитата:
Но, судя по той же подписи, Вы также занимаетесь восстановлением информации на них. А значит, должны знать структуру метаданных всех файловых систем, которые используют потенциальные заказчики Ваших услуг. И, тем более, должны знать все подробности функционирования SMART, поскольку именно эта технология отвечает за самодиагностику накопителя. Настройка запуска автономного тестирования в фоновом режиме осуществляется именно функциями ОС. По запросу или по таймеру. К примеру, "smartctl -t offline /dev/sda". Приняв эти предположения, мне остается непонятным как Ваши высказывания о файловых системах (которые, исходя из Вашей работы, Вы должны знать намного лучше меня), так и высказывания о процедуре встроенного самотестирования. Естественно, контроллер предпринимает действия по отношению к проблемным блокам, выявленным при таком тестировании. К примеру, 198-ой атрибут содержит счетчик нестабильных блоков, выявленных именно при самотестировании. Это первое. И второе. Такое впечатление, что мы с Вами ходим по какому-то замкнутому кругу. Я привожу Вам конкретный опкод и описание стандартной команды принудительного переназначения сектора, а Вы, никак не комментируя этот факт, опять повторяете, что "ремап, как таковой, якобы недоступен для ОС". Я не хочу Вас задеть, но наша с Вами беседа превращается в какой-то бессмысленный обмен сообщениями, в которых каждая сторона пытается непонятно что доказать и не может понять вторую сторону. Мне, поверьте, совершенно не жалко с Вами согласиться. Я признаю Ваш авторитет в области внутреннего устройства накопителей и архитектуры их прошивки. Я уважаю Ваши знания, но к сути нашей с Вами дискуссии они не относятся. Мне неинтересно, как устроен накопитель. Для меня это просто "черный ящик", который получает на вход один поток байтов, а на выходе выдает другой. И вот то, что он выдаст, строго стандартизовано. А Вы, к примеру, не имеете представления о деталях работы операционной системы. Вам это не нужно и неинтересно. Поэтому, к примеру, пишете, что для SATA-дисков нет понятия "master" и "slave". Давайте я Вам начну в ответ рассказывать, что Вы глубоко ошибаетесь и что промежуточный уровень ПО операционной системы инициализирует каждый дисковод как главный или подчиненный в зависимости от того, к первичному или вторичному порту контроллера он подключен? Я могу прямо вырезки кода выложить с указанием из какой системной библиотеки они взяты. Вам будет интересно? Нет. Потому что это сугубо внутреннее дело операционной системы и все эти структуры данных не выходят за пределы уровня промежуточного ПО. А теперь давайте поменяемся местами и, надеюсь, Вы меня поймете. Детали реализации технологического режима в каждом конкретном накопителе пользователя интересуют ничуть не больше, чем работа middle layer software в ОС. Может быть сойдемся на том, что я с удовольствием признаю Ваше неоспоримое превосходство в области ремонта жестких дисков и мы закроем эту тему? Как думаете? Я мог бы, ради прекращения этого непонятного спора, согласиться и с прочими Вашими утверждениями, но просто не хочется вводить в заблуждение остальных уважаемых читателей этой ветки. |
Цитата:
Цитата:
Цитата:
Цитата:
P.S. Кстати примерно так заносится дефект у Самсунгов F3 : 8f a,0000/0/хх,хх хх хх ''''''''''''''''''''' [GL][ADD:хххххххх][C:хххх][E:0000] @Successful writeRList [GL][SAVE] где х - координаты и параметры команды. Но это тоже практически никому не надо... |
AMDBulldozer, Вы почему то не хотите понять, что пытается объяснить misha2, забудьте про ОС, более того забудьте об остальной начинке компьютера. Попробуйте рассмотреть этот вопрос как будто у вас есть доступ к ТМОС HDD через спецоборудование. В этом случае все что вы пытались доказать лишено смысла, именно потому, что все что вы объясняете привязано к ОС и железу компьютера.
Цитата:
|
Да-да. Именно это я и пытался сказать. Просто команды к винту всегда можно разделить на открытые (доступные по АТА-стандарту) и закрытые (вендор-команды). Так вот СМАРТ селфтесты доступны, а сам ремап - нет. При запуске смарт селфтеста ата-командой запускается селфтест внутри винта, а сама ТМОС обнаруживая дефекты - уже и ремапит сама, своими вендор-командами. А инженерный софт умеет подавать супер-он, тем самым открывая доступ к СА (модулям) винта и позволяет именно вендор-командами заносить/перемещать/очищать дефекты в листах винта. Вот потому и недоступно это из-под ОС, т.к. в ОС (любых) просто нет этих самых супер-, вендор-команд.
А если б было доступно - то представьте сколько было б вирусни, убивающей винты и инфу на них напрочь. :) |
misha2, всё бы так и было незыблемо для всех, кто хоть чуть-чуть сталкивался с обслуживанием/ремонтом HDD. Но прямое утверждение в описании программы sg_reassign: С учётом того, что программа портирована под большое количество ОС, включая Windows и включена во многие дистрибутивы Linux. Также пользователи интернета сообщают об успешном использовании данной программы. Всё это наводит на размышления :)
misha2, AMDBulldozer, этот спор можно было решить довольно просто. Нужен SCSI/SAS диск (к сожалению, у меня нет такого), отчёты до и после использования программы. Но вот проверить верность отчётов и изменение модулей, как я понимаю можно только с помощью комплекса PC-3000 for SCSI. И в первую очередь, меня лично интересует, производится ли пересчёт транслятора. Операция переназначения - секундное дело, но пересчёт транслятора измеряется минутами/десятками минут/часами :) AMDBulldozer что можете сказать по этому поводу? Как при использовании hdparm так и sg_reassign. Возможно, что если затрагивается только G-лист, то пересчёт и не нужен :confused: |
Реассигн это 2 варианта :
1. переназначение существущего ЛБА только через смарт селфтест (оффлайн, онлайн, short и long), и неважно на чём он проводится (ИДЕ, САТА, САС, СКАЗИ) это ж делает сам винт. 2. Ремап в процессе скана поверхности. Тогда винт при натыкании на дефект пытается 8-16 раз (например 10 раз и Сигейт Ф3) переписать его с проверкой КС . Занесение в аттрибут 197 (С5). Неудача - переназначение ЛБА. Неудача всех попыток переназначения - аттрибут 198 (С6). Удачи и неудачи операций переназначения - аттрибут 05 (удачные) , а все (и удачные и неудачные) в аттрибуте 196 (С4) общее значение. И ещё, дефект-листов у винтов несколько : 1. Р-лист (заводской) при изготовлении винта (Primary-первичный). (D-, S- листы у Самсунгов). 2. G-лист (Grown) текущих дефектов при эксплутатации (Alt- у Сигейт, R-, A- у Самсунгов). 3. Relo-лист у WD кандидаты на ремап. Сами записи о дефектов несут в себе не только адреса и кол-во, но и аттрибуты (причины) по которым он переназначен. Это легко посмотреть у Сигейтов в терминале по "Vх", где х-номер дефект листа. В А-листах самсунгов тоже можно увидеть дефекты с разными аттрибутами. Как практически и у других винтов. По аттрибутам дефекты могут заносится в соответствующие листы и логи. И напомню что отображаемый СМАРТ лишь сборник этих отчётов. Цитата:
|
misha2, в том и дело, что из описание следует, что нет никаких
Цитата:
Цитата:
Цитата:
Я лишь хочу разобраться в верности/не верности утверждений AMDBulldozer. Для этого нужен тест программы с SCSI/SAS-диском :) |
Цитата:
|
Цитата:
Конечно, опять Вы можете сказать, что они делают это не самостоятельно, а выдавая команду микропрограмме контроллера. Но то же самое возражение можно привести практически для любой периферии. Суть в том, что в данном (и только в данном) случае у контроллера не остается "права выбора". "Виктория", к примеру, не боится давать команду записи в дефектный сектор 10 раз подряд. В любом случае, больше одного переназначения не случится. А 10 команд "SCSI Reassign Blocks" приведут к тому, что один и тот же сектор будет переназначен 10 раз. И, соответственно, 10 секторов будут заняты в резервной зоне. Простите, но я возможно проблема в том, что Вам больше приходилось иметь дело с PATA/SATA, чем со SCSI/SAS дисками? |
Цитата:
Пересчет транслятора НЕ производится. Выполняется только операция занесения сектора в GLIST. |
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
|
Цитата:
Еще до того, как я написал фразу, которую Вы процитировали, я отмечал, что Цитата:
Цитата:
Но, если уж начинают цепляться цепляться к моим формулировкам, то цепляться имеет право только человек, формулировки которого всегда безукоризненны. Поэтому я спокойно ответил misha2 в его же собственном стиле. Разница была только в том, что я-то, формулируя свою мысль, заранее знал, что для краткости упрощаю ситуацию. А misha2 просто был не в курсе того, что существует другой инфетерфейс с другими командами. Поэтому мой последующий рассказ о командах SCSI служил единственной цели. Показать человеку, что если он недостаточно знаком с каким-то вопросом (в этом нет ничего страшного или позорного), то не надо пытаться поправлять других. Вы сами понимаете, что писать трактаты в форуме готов далеко не каждый. И не каждый готов постоянно выверять формулировки и делать оговорки, что он в данном случае несколько упрощает. Согласны? Из этого следует, что не стоит и пытаться "поправлять" человека, который, кстати, один раз уже описал ситуацию корректно. Ну, а если уж кто-нибудь начинает пытаться править чужие высказывания, пусть не обижается, когда ему укажут на некорректность его собственных. Цитата:
У каждого из нас есть доступ в интернет и выяснить как действительно обстоят дела никакого труда не представляет. Но почему-то мои оппоненты не горят желанием потратить эти самые 10 минут для того, чтобы убедиться в своей неправоте. Цитата:
|
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
P.S. А вирусописатели как бы хорошо этим воспользовались - написали б простенький генератор таблицы дефектов и открытой командой запихивали б эту таблицу в винт , обрушая тем самым трансляцию винта и данные на нём. Винт бы переставал нормально работать с заполненными дефект-таблицами, заодно выставляя смарт-статус "BAD". |
Цитата:
Цитата:
Ладно, пора заканчивать. Вернёмся к обсуждению когда у меня появится SCSI/SAS диск и я проведу тест ;) P.S. Господа модераторы, может вырежьте все сообщения про SCSI/SAS в новую тему, типа: SCSI/SAS диски. Диагностика, ремонт. Тема, в любом случае нужная, т.к. у этого интерфейса свои способы решения проблем, во многом отличающиеся от ATA. |
Цитата:
Цитата:
Цитата:
Я кстати брал читахи и подсовывал их РС3000 через сас-сата адаптер WD. Фокус не удался. Это так, на будущее. :) |
Цитата:
Цитата:
Цитата:
С точки зрения операционной системы, такой сектор "плохим" не является и ей абсолютно по барабану будет он переназначен или нет. Поэтому ответ на Ваш вопрос прост (и я давал его уже неоднократно): если интерфейс SATA, то никак. Если SAS - можно переназначить принудительно. |
Цитата:
Цитата:
Цитата:
Цитата:
|
Цитата:
Зато я ими пользуюсь так что у меня были и есть контроллеры Adaptec, Areca, диски со SCSI-интерфейсом (Seagate Cheetah) и стандартный набор команд я уж, поверьте, знаю. Технологические, конечно, не знаю. Во-первых информации по ним крайне мало, во-вторых, зачем они мне нужны если стандартными средствами операционной системы их выдать всё равно нельзя? Вы позволите мне напомнить Вам, что мы сейчас говорим именно о команде, включенной в стандарт? Цитата:
Цитата:
Если Вы не согласны с таким определением, что ж... Значит весь наш с Вами спор возник из-за недопонимания терминологии оппонента. Цитата:
Возможно, пользователям windows помогло бы увеличение периода таймаута команды 0x25 "Read DMA Ext" или переключение режима работы накопителя с UDMA в PIO. Как это сделать и поможет ли им это? Не знаю. Это не моя проблема. Мы с Вами вроде бы говорили о дефектных секторах, а не о секторах с увеличенным временем доступа. |
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
|
Цитата:
Есть команда переназначения. Есть утилита, которая использует эту команду. Как после этого, можно продолжать утверждать, что "решение всегда принимает микропрограмма контроллера"? |
misha2, AMDBulldozer, без теста, обсуждение становится из пустого в порожнее. Позиции высказаны и понятны, заканчивайте :)
Если только теоретически порассуждать :) Например, непонятно, если необходима команда SUPER ON для доступа к модулю и записи изменений, то как она реализована в программе? Ведь у разных производителей она разная или есть единая команда для всех производителей, обусловленная стандартами SCSI/SAS? Также, нет ясности с пересчётом транслятора. Всё это конечно можно было бы проверить при тесте и отслеживании происходящего после подачи команды в терминале. Но увы и ах :( misha2, я правильно рассуждаю или глубоко заблуждаюсь? ;) |
Цитата:
Цитата:
комплексы типа PC3000 различных версий ? Если это можно делать линухом. Цитата:
Цитата:
|
Цитата:
|
misha2 и AMDBulldozer я меньше вашего понимаю в этой области, но считаю, что в подобных спорах лучше приводить ссылки на статьи вроде этой. Кстати у меня подозрение, что misha2, уже знаком со статьей.
Мое мнение совпадает с мнением автора этой статьи: Цитата:
|
Да, и ещё. Есть Ниагара для САС и есть Ниагара под обычные (у меня), так вот в них есть команда 50h format unit, она стандартная и вроде при формате должна и заносить дефекты в Г-лист. Ранее (несколько лет назад) я сам пытался применять эту команду и она меня не устроила тогда.
|
Цитата:
Цитата:
Цитата:
Вы эти примеры упорно игнорируете и продолжаете повторять "средствами ОС переназначить блок нельзя". Тогда хоть как-нибудь прокомментируйте причины включения в набор SCSI Block commands команды принудительного переназначения. Выскажите, например, мнение, что это первоапрельская шутка. Или что это планы на XXII век. Добавьте то же самое про утилиту sg_reassign. А то получается как-то не вполне логично. Прекратить эту дискуссию на том основании, что обе стороны только раз за разом повторяют одни и те же аргументы, Вы не желаете. Опровергнуть информацию записанную в стандарте не можете (хотите, дам прямую ссылку. Только там файл pdf). Вместо этого Вы упорно держитесь точки зрения "средствами ОС переназначить сектор нельзя", но никаких аргументов кроме ссылки на свой опыт, к сожалению, не приводите. Повторюсь: я уважаю Ваш опыт. Но ведь, согласитесь, это не означает, что Вы знаете о жестких дисках абсолютно всё. Тем более, что речь идет не о ремонте, а о их штатном функционировании. Цитата:
|
Ment69,
Да, спасибо. И кстати я упоминал о WD Raptor с SAS-интерфейсом. Так вот формат команд у них обычный, не сказёвый. Подтверждение этому - я их успешно ремонтил на обычном РС3000. |
Цитата:
PS Не хочу утверждать 100%, но в случае с SAS и SCSI, в ОС определяются не HDD, а LUN = Logical Unit Number. |
Цитата:
|
Цитата:
Правда это и сейчас есть с SATA-дисками, но тут, сколько я мог заметить, причина не столько в аппаратной несовместимости, сколько в драйверах (хотя, конечно, можно припомнить общеизвестный факт, что многие старые контроллеры не могут работать с дисками > 2.2TB). Резюме: мне кажется, уважаемый Ment69 очень удачно подвел итог этой дискуссии, может быть имеет смысл её прекратить? |
Ment69,
Да и кстати по ссылке в комменте есть - Цитата:
|
Цитата:
Цитата:
|
Цитата:
Как говорил Леопольд "Ребята давайте жить дружно!" Ну и в "споре рождается истина" :) Цитата:
Благодаря misha2, я сегодня перекопал кучу ссылок связанных с ТМОС, а благодаря AMDBulldozer, такую же кучу связанных с командами SCSI и другими особенностями этого интерфейса. |
Доки-то какие-нить можно найти и на Сигейт F3 и САС, и САТА в плане технокоманд, типа F3 SerialPort Diagnostics. (Жаль что похоже ссылку прибили). Но это нестрашно, большинство технокоманд и так известно (из общеприменимых) на Сигейт.
P.S. Терминал одинаков и для САТА, и для САС Сигейт. |
Интересная тема, но по моему этот спор будет продолжатся вечно.
Виктория просто выполняет неоднократную запись файлов по адресам, а винт уже и решает что с ними делать (обычный, SATA). Причем с SATA без спец софта/железа просто взять и сделать ремап хорошего lba средствами ОС не реально в принципе. Про SCSI ничего сказать не могу. Для разрешения спора нужно просто взять SCSI/SAS диск(и) (ну ес-но с полноценным контроллером, который в полной мере поддерживает весь набор команд для этого интерфейса), и попробовать заставить (виктория его просит перезаписями, а винт решает ремапить или нет) винчестер произвести ремап хорошего lba средствами ОС (потом, наверное можно все вернуть спец софтом/железом, точно не знаю). Наверное misha2 может просто взять и провести этот эксперимент, но нужно ли оно ему. Думаю без этого дальнейший спор не имеет смысла, спорить в теории можно очень долго (честно говоря аж самому интересно стало). |
-Diablo-,
Я выше писал про ВД Рапторы (САС) они понимают многократную попытку ремапа Викторией, но не на всех дефектах. Просто потому что архитектуры они сата-шной. То есть ведут себя как обычные сата-винты со всеми вытекающими...И софт их понимает как и обычные сата. Чисто САС типа читахов просто нет сейчас под опыты. Принесут - попробую. |
Привет всем
Ни кто не подскажет утилиту для диагностики lsi adapter ultra320 scsi 2000 series w/1020/1030 и соответственно HDD, которые подключены к нему... Есть подозрение, что один из hdd начал тупить... хотелось бы проверить... система WIN 2008 SR2 SP2. RAID 0 на данном сервере используется для хранения бэкапов. Заранее благодарю... |
Время: 20:00. |
Время: 20:00.
© OSzone.net 2001-