Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Непонятные проблемы с Железом (http://forum.oszone.net/forumdisplay.php?f=48)
-   -   Сервер выдает сигнал тревоги. (http://forum.oszone.net/showthread.php?t=352429)

BVN-2005 22-11-2022 09:12 2997050

Сервер выдает сигнал тревоги.
 
Старый сервер на базе MB Supermicro x8sie-f; ОС - Вин 2008R2. Исправно работал более 10 лет, сейчас единственное назначение его - раздавать лицензии 1С с USB ключа, т.е. нагрузка нулевая. Вдруг вчера включился сигнал тревоги - завывание спикерфона по типу автомобильной сигнализации. Через некоторое время (не сразу) загорелась красная лампочка на морде. Вроде бы сигналы о перегреве. При этом AIDA показывает температуру проца, материнки, дисков 20-25 градусов. В биосе тоже самое. Вентиляторы работают. После перезагрузки сигнал отключается на некоторое время, потом включается опять. В чем может быть проблема?

NickM 22-11-2022 09:56 2997051

RAID?

dmitryst 22-11-2022 10:14 2997052

BVN-2005, для начала неплохо бы фото "лампочки"

BVN-2005 22-11-2022 10:28 2997053

Цитата:

Цитата NickM
RAID? »

Нет
Цитата:

Цитата dmitryst
для начала неплохо бы фото "лампочки" »

Нечем фоткать... обычный красный светодиод и рядом изображение, похожее на градусник.

Перезагрузил после очередного срабатывания, запустил стресс-тест в Аиде. Температура проца в районе 70, материнка 35. Пока тишина...

dmitryst 22-11-2022 10:43 2997056

Цитата:

Цитата BVN-2005
Температура проца в районе 70 »

чем измеряли? Для таких целей лучше использовать настоящий термометр с термопарой (есть даже на дешевых мультиметрах) или, в крайнем случае, пальцОметром ;) Есть мнение, что перегревается проц (термопрокладка сдохла или радиатор забит пылью)

BVN-2005 22-11-2022 11:15 2997062

Цитата:

Цитата dmitryst
чем измеряли? »

График в Аиде.
Цитата:

Цитата dmitryst
пальцОметром »

Щупал, соответствует.
Цитата:

Цитата dmitryst
радиатор забит пылью »

Радиатор чист, про термопасту не знаю. Есть мысль, снять кулер и поменять, но пасты нету под рукой.

dmitryst 22-11-2022 12:04 2997066

Цитата:

Цитата BVN-2005
График в Аиде. »

ну да, ему можно доверять, 146% ))
Цитата:

Цитата BVN-2005
Щупал, соответствует. »

70 градусов?
Цитата:

Цитата BVN-2005
снять кулер и поменять »

для начала просто снять и посмотреть, что там.

Jula0071 22-11-2022 12:26 2997071

Иногда от старости начинают глючить датчики, бывает. У супермикр довольно убогий IPMI, но он есть, попробуйте глянуть в него. Емнип была даже какая-то фирменная тулза для этого.

dmitryst 22-11-2022 12:39 2997073

Jula0071, вот чтобы исключить глюк датчиков, и предложил мерить нормальными приборами, а для начала разобрать, может там уже труха вместо термоинтерфейса.
Цитата:

Цитата Jula0071
У супермикр довольно убогий IPMI »

да глючат все, кто-то больше, кто-то меньше.. Нельзя доверять датчикам на плате ;)

Jula0071 22-11-2022 12:50 2997075

dmitryst, так хотя бы посмотреть, на что жалуется девайс подробнее, чем "запищал и загорелась красная лампочка, что бы это значило?"
У админов, которые не зря получают зп, в мониторинг сразу алерты прилетают, когда что-то случается, со всеми подробностями, а не это вот.

dmitryst 22-11-2022 13:14 2997080

Цитата:

Цитата Jula0071
У админов »

дык, ТС ни разу не админ, разве что начинающий ;).
Посмотрел его темы, много тем по этому серверу, так и просится на списание :help:

BVN-2005 22-11-2022 13:32 2997082

Цитата:

Цитата dmitryst
Нельзя доверять датчикам на плате »

Как говорил известный персонаж, верить нельзя никому. Но возникает вопрос: разве не с этих же датчиков берет информацию система тревоги? Откуда тревога, если на датчиках 20 градусов?

dmitryst 22-11-2022 13:41 2997084

Цитата:

Цитата BVN-2005
Откуда тревога, если на датчиках 20 градусов? »

  1. Не все датчики напрямую видит аида и прочий софт, часть датчиков "железная" и их данные обрабатываются местной системой мониторинга
  2. Вот посмотрели бы, что за тревога, в логах должно быть.
  3. Может, это и не перегрев, а что-то еще. (я сам с этими серверами дела не имел)
Кстати, если зайти в биос и не загружать систему, тоже пищит?

BVN-2005 22-11-2022 13:44 2997086

Цитата:

Цитата dmitryst
Кстати, если зайти в биос и не загружать систему, тоже пищит? »

Пробовал, ждал больше часа, тишина. Загрузил винду и минут через 15 заорало...

Цитата:

Цитата dmitryst
в логах должно быть »

А что за логи и где их искать?

dmitryst 22-11-2022 13:52 2997087

BVN-2005, Тут описание технологии мониторинга
А искать можно тут:

BVN-2005 22-11-2022 14:18 2997089

Посмотрел. Последняя запись от 2017 года (всего 512). Очистил журнал, дождался срабатывания сирены. Новых записей не появилось, журнал пуст.

dmitryst 22-11-2022 14:27 2997090

Цитата:

Цитата BVN-2005
Последняя запись от 2017 года »

Цитата:

Цитата BVN-2005
Новых записей не появилось, журнал пуст. »

Дата/время правильные? По-любому запись должна появляться, хотя бы и с неправильной датой... Подождем, что коллеги подскажут.

BVN-2005 22-11-2022 14:39 2997091

Цитата:

Цитата dmitryst
Дата/время правильные? »

Да

BVN-2005 22-11-2022 15:42 2997098

Похоже на тревогу от датчика открытия корпуса... которого здесь отродясь не было...

dmitryst 22-11-2022 19:16 2997104

Цитата:

Цитата BVN-2005
датчика открытия корпуса... которого здесь отродясь не было. »

специально обученная пыль может имитировать датчик ;)

BVN-2005 23-11-2022 08:52 2997147

Установил утилиту Super Doctor 5 (от Supermicro). Странноватая программулина, но это она нарисовала открытый корпус с кнопочкой ресет под картинкой. После нажатия на кнопочку корпус закрылся и сирена отключилась. Оставил на ночь. Прихожу сегодня утром - завывает. В Аиде, в Супердокторе никаких проблем, лампочка перегрева на морде не горит. В логах BMC несколько записей. Как я понял, про вентилятор (по слову FAN). Как полностью расшифровать - не знаю...

dmitryst 23-11-2022 10:41 2997157

Цитата:

Цитата BVN-2005
Как полностью расшифровать - не знаю... »

скиньте сюда, поможем..

Angry Demon 24-11-2022 11:26 2997222

BVN-2005, в IPMI заглядывали, как советывали коллеги вам ранее? Там по датчикам целая таблица должна быть, в которой красным будет отмечено то, что не комильфо.
Датчик корпуса отключен в BIOS?

BVN-2005 25-11-2022 09:20 2997277

Цитата:

Цитата Angry Demon
в IPMI заглядывали, как советывали коллеги вам ранее? »

Не получается... Вроде бы настроил, но подключиться не удается.

Попутно обнаружил интересное явление. Переключил процессорный кулер на другой разъем. В течение суток срабатываний не было. А сегодня утром запустил Аиду, включил Тест стабильности системы чтобы вывести графики на экран, сам стресс-тест не запускал. И через полтора часа простоя с графиками на экране сработала тревога... Может Аида провоцировать включение тревоги?

Angry Demon 25-11-2022 10:44 2997284

Цитата:

Цитата BVN-2005
Не получается... Вроде бы настроил, но подключиться не удается

Плохо. Только там нормально всё посмотреть сможете.

Цитата:

Цитата BVN-2005
Может Аида провоцировать включение тревоги?

Если её тест вызывает перегрев, то может.

Не занимайтесь вы плясками с бубном, сосредоточьтесь на получении сведений IPMI!

kim-aa 25-11-2022 14:47 2997298

Цитата:

Цитата BVN-2005
В логах BMC несколько записей. Как я понял, про вентилятор (по слову FAN) »

Надо смотреть тип подключения вентилятора.
У Супермикры есть тревога по забитию вентилятора пылью, т.е. если обороты ПАДАЮТ ниже определенных - начинает орать.

Цитата:

Цитата BVN-2005
И через полтора часа простоя с графиками на экране сработала тревога... Может Аида провоцировать включение тревоги? »

Может. Если у вас проблема в локальном перегреве, то может.
Тестилки процессора естественно загружают его и он греется выше обычного.
На смартфонах и устройствах с пассивным охлаждением я попадал на весьма жесткий перегрев при процессорном тесте.

dmitryst 25-11-2022 14:58 2997301

Цитата:

Цитата kim-aa
если обороты ПАДАЮТ ниже определенных - начинает орать. »

да это есть у всех, не только у Supermicro.
BVN-2005, что у вас с оборотами вентиляторов? В той же аиде должно быть видно ;)


Время: 03:24.

Время: 03:24.
© OSzone.net 2001-