Войти

Показать полную графическую версию : Аварийная перезагрузка Windows Server 2008 R2 несколько раз в сутки


Win32_Green
15-05-2013, 11:55
Доброго времени суток!

Прошу помощи, заканчиваются идеи...

5 дней назад один из серверов Windows Server 2008 R2 Standart начал уходить в аварийную перезагрузку (раз ~5 хаотично в течении суток).
Сервер подключен к мощному ИБП (не он один, остальные сервера в норме и без ребутов).
IPMI View не показывает ошибок и отклонений в вольтаже и вентиляторах...
В IPMI View логах перезагрузки фиксируются как: System Event 05/14/2013 21:26:30 Tue OS Stop Shutdown Assertion: OS Stop Shutdown| Event = OS Graceful Shutdown

В логах из повторяющихся ошибок:

Имя журнала: System
Источник: Microsoft-Windows-Kernel-Power
Дата: 10.05.2013 13:42:17
Код события: 41
Категория задачи:(63)
Уровень: Критический
Ключевые слова:(2)
Пользователь: система
Компьютер: SRV-x.xxx.local
Описание:
Система перезагрузилась, не завершив полностью работу. Эта ошибка может быть результатом того, что система перестала отвечать, произошел критический сбой, или неожиданно отключилось питание.

За день до первой перезагрузки была еще единичная ошибка (до этого такой не видел... с кодом 1 не нагуглил ничего :( ):

Имя журнала: Application
Источник: Microsoft-Windows-Wininit
Дата: 09.05.2013 11:25:25
Код события: 1015
Категория задачи:Отсутствует
Уровень: Ошибка
Ключевые слова:Классический
Пользователь: Н/Д
Компьютер: SRV-х.ххх.local
Описание:
Критический системный процесс "C:\Windows\system32\lsm.exe" завершился ошибкой с кодом состояния 1. Необходимо перезагрузить компьютер.

+ где-то в это же время на С закончилось свободное место (исправил первым делом).

Что делал/обнаружил:
- просканил систему Cureit!-ом, Kaspersky virus removal tool-ом и Microsoft Safety Scanner - криминального ничего не обнаружил.
- накатил последние обновления (11 важных и 4 необ-ных)
- в журналах ошибок кроме указанных выше и стандартных (драйвера на принтера, когда-никогда отвалился ворд/ексель) нет...
- отключил автоматический ребут системы - в охоте за bsod-ом (пока что неудачно... бсодов нет сразу ребут)
- так как дампов памяти ядра не нашел сохраненных - поставил малый дамп памяти... (после нескольких ребутов тоже пусто)
- средствами Intel(R) Rapid Storage проверил оба рейда - ошибок нет, рассогласований нет... статус рейда - Система работает нормально
- при перезагрузке в таблице состояния статус рейдов тоже в норме

Что за железо/настойки:
- Supermicro SYS-5017R-M3F 19" 1U, Intel C606
- Intel Xeon E5-2603 4x1.8GHz
- 32 ГБ оперативки
- два SAS-рейда, 2 х 60ГБ 15000rpm - система + 2 ТБ 7200 файлохранилище.
- файл подкачки фиксированный 15,3 ГБ (на отдельном разделе)
- роли: терминалка, AD DC (резервный), DNS, веб-сервер IIS (используется всего пару служб для разработки)


Физического доступа к серверу не имею... только чужими глазами и IPMI.
Прошу помощи и советов.

Win32_Green
15-05-2013, 11:59
Добавлю:
- утилитой autoruns проверил - ничего подозрительного нет...

exo
15-05-2013, 12:03
http://forum.oszone.net/thread-130713.html

Win32_Green
15-05-2013, 12:08
http://forum.oszone.net/thread-130713.html »

В случае возникновения критической ошибки (BSOD)

нужно основываться на анализе дампа памяти.

Ни того ни другого нет - описал же... в BSOD не вываливается, дампа - нет.

Win32_Green
20-05-2013, 17:28
Сменили БП - аптайм 4 дня...
Думаю тему можно закрывать.




© OSzone.net 2001-2012