PDA

Показать полную графическую версию : Падение сервера


Maximys717
22-03-2016, 16:14
Добрый день, уважаемые участники форума!
Уповаю на Ваш опыт и знания.
Проблема вот в чём: каждую субботу в 5:00 падает сервер. Где-то с 4:58:56 начинает перезагружается. И перезагружается пока его не отключу. Помогает только восстановление с бэкапа.
Дано:
VMWare ESXi 5.5 (полностью обновлен).
Windows Server 2012 R2. Установлены все обновления по сегодняшний день.
Сеть организована таким образом: 2 сервера - DC (AD) + RDP. Сами сервера установлены и настроены были на Новый год. В эксплуатацию ввелись 14 января.
До переустановки работал Windows Server 2012 R2 со всеми обновлениями и по такой же схеме. Проблема с перезагрузками/падениями началась, приблизительно, с сентября.
Падает RDP. И один раз падал DC.

В течении недели никаких проблем, после переустановки никаких проблем не было где-то с месяц. А потом снова всё началось.
Особенность, которая осталась неизменной - в субботу, 5:00, ни минутой позже, ни раньше.
Тестировалась ОЗУ - проблем не обнаружено, заменены старые HDD на новые SSD для DC и RDP - никаких проблем ни с HDD, ни с SSD.

Ещё одна странная закономерность - при бэкапе накануне (в ночь перед субботой) падений и перезагрузок не наблюдалось. Бэкап делается - Acronis'ом LiveCD.
Надеюсь на Вашу помощь,
Спасибо

NickM
22-03-2016, 16:40
Maximys717, заглянуть в системные журналы. Обычно событие завершения и тот, кто его вызвал - логирруются.

Maximys717
22-03-2016, 16:53
NickM, в логах ошибка ntkernel 41 - внезапное отключение питания. Пусть это и может быть проблемой, но единожды хотя бы... Периодичность постоянная - суббота 5:00 с отклонением в 6 секунд.

Petya V4sechkin
22-03-2016, 17:30
в логах ошибка ntkernel 41 - внезапное отключение питания.
На ошибке правой кнопкой мыши -> Копировать -> Копировать сведения как текст -> выложите.

Maximys717
22-03-2016, 17:47
Petya V4sechkin, вот что собрал в себе последний дамп:
==================================================
Dump File : 031916-10468-01.dmp
Crash Time : 19.03.2016 5:02:10
Bug Check String : SYSTEM_SERVICE_EXCEPTION
Bug Check Code : 0x0000003b
Parameter 1 : 00000000`c0000005
Parameter 2 : fffff801`afb2505f
Parameter 3 : ffffd000`3263a720
Parameter 4 : 00000000`00000000
Caused By Driver : ntoskrnl.exe
Caused By Address : ntoskrnl.exe+14e3a0
File Description :
Product Name :
Company :
File Version :
Processor : x64
Computer Name :
Processors Count : 8
Major Version : 15
Minor Version : 9600
==================================================

Petya V4sechkin
22-03-2016, 17:49
031916-10468-01.dmp
Выложите несколько свежих DMP-файлов из папки \Windows\Minidump.

Maximys717
22-03-2016, 19:07
Petya V4sechkin, после последнего раза остался 1 лишь дамп.

Petya V4sechkin
22-03-2016, 19:11
Maximys717, сбой процесса sqlservr.exe (на каком драйвере, выяснить не удалось).

Maximys717
22-03-2016, 19:25
Хм..боюсь мне надо дождаться субботы, чтобы собрать по-больше дополнительной информации..пока посмотрю, что может быть связано с указанным процессом, спасибо..

Petya V4sechkin
22-03-2016, 19:43
Maximys717, вообще сторонних драйверов в дампе немного:
epfw.sys, epfwwfp.sys, eamonm.sys, ehdrv.sys, EpfwLWF.sys - ESET
vsock.sys, vmci.sys, vsepflt.sys, vnetflt.sys, vmrawdsk.sys, vmmouse.sys, vmhgfs.sys, vm3dmp.sys, vmmemctl.sys - VMware
truecrypt.sys - старая версия 2012 года - TrueCrypt
tib.sys, snapman.sys, tib_mounter.sys, fltsrv.sys - Acronis
e1i63x64.sys - Intel Gigabit Adapter NDIS 6.x driver

NickM
22-03-2016, 19:52
Maximys717, не берусь утверждать, но тема заинтересовала...

BUGCHECK_STR: 0x3B
This error has been linked to excessive paged pool usage and may occur due to user-mode graphics drivers crossing over and passing bad data to the kernel code (https://msdn.microsoft.com/en-us/library/windows/hardware/ff558949(v=vs.85).aspx)

PROCESS_NAME: sqlservr.exe
Тут больше подозрение на используемый пул памяти, может в эту дату SQLServer какие мероприятия с БД проводит? Коли повторяется в определенное время - следует задания в планировщике поизучать.

Upd: Примечательно, что по этой ошибке KB (https://support.microsoft.com/ru-ru/kb/3055343) заявлено, хотя в данном случае и не актуально...
Upd2: Поиском ищется данная ошибка на многих виртуальных машинах: Например вот (https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2073791), интересно, а что в логах VMWare?




© OSzone.net 2001-2012