PDA

Показать полную графическую версию : Неизвестная проблема


neviDimka91
16-09-2019, 10:32
Добрый день форумчане. Вынужден обратиться к вам за помощью и помочь решить вроде не сложную, но очень глобальную проблему для нашей организации. Есть у нас windows server 2008 r2 (обычная железяка Intel Xeon x7350 2.93 Ghz, 32 gb ОЗУ) крутиться там сервер баз данных для 1С. Не так давно, сервак выключился , не сообщив о проблеме, просто взял и выключился и соответственно самостоятельно не запустился. Так как физически он расположен не рядом со мной, придя к нему мы обнаружили, что он работает, только вот на чем то он застопорился при запуске. Подключая к нему монитор мы увидели на экране помехи, дефекты, цветную рябь, артефакты в общем все было похоже на (см. скриншот)

https://ichudoru.com/wp-content/uploads/2018/11/eddfab30fd2e9732e1299ad801c733b0-330x140.jpg

Пришли к выводу, что это проблема с видеочипом. Выключил сервак "жестким" методом, процес загрузки начался заново и все повторилось. Цветная рябь и тишина (пинги не шли).
Начали перебирать варианты проблемы, подключали другой моник, в разные VGA разъемы, все повторялось. Сквозь рябь, было слегка различим курсор при загрузке биоса, было принято решение запустить его без подключения к локальной сети (вынули патчкорд) и не поверите, он начал запускаться, но все так же с рябью. Дождались полной загрузки винды , подключили патчкорд обратно в сервер, пинги пошли, подключились по рдп - все работает как часы. В журналах и логах тишина, никаких проблем или ошибок.
Ну думаем пускай пока работает, и спустя несколько дней, серак перестал пинговаться. Мы бегом туда, и там та же самая картина, вытащили патчкорд, запустили,подключили обратно. И такое повторяется каждые 2-3 дня. Сервак самопроизвольно уходит на перезагрузку. В шедулере нету задач или что то похожее на то, что он самопроизвольно делает. Обновления отключены.
ТАк вот итог какой, имеется две проблемы : 1) Почему он уходит самостоятельно на перезагрузку 2) Почему он не включается когда в сетевую карту установлен патчкорд

есть идеи?

Ageron
16-09-2019, 11:28
есть идеи? »

Воткните внешнюю видео карту, подключитесь через нее.
В биос должен быть свой журнал регистрации ошибок, обычно выключен. включите, посмотрите какие ошибки будут.

что за модель сервера?

neviDimka91
16-09-2019, 11:44
Нашел кое что интересное в журнале:

Процесс wininit.exe (хх.хх.хх.хх) инициировал действие "Перезапустить" для компьютера server_1c от имени пользователя domain\u.user по причине: Причина на перечислена
Код причины: 0x800000ff
Тип выключения: Перезапустить
Комментарий:

раньше, в шедулере была задача - перезагружать сервер каждый день в 22:30. Мы её завершили и удалили.

neviDimka91
16-09-2019, 12:55
Как говорится, стоит только написать о проблеме где-то, как тут же начинают появляться решения. Покопавшись в логах более тщательнее, обнаружил, что Процесс wininit.exe (хх.хх.хх.хх) инициировал действие "Перезапустить" для компьютера server_1c от имени пользователя domain\u.user ссылается не на родной сервер, а на другой. Посетив сервер который у нас давно уже не используется, так ка все с него перенесено, но работает потому что руки не доходят, обнаружил, что в шедулере есть задачка, которая запускает каждый день файлик, в котором есть скрипт :

rem если положить flag.txt то
if exist c:\work\flag.txt goto rrr
shutdown /r /f /m \\server_1c
shutdown -r -f
:rrr
del c:\work\flag.txt

в скриптах не силен, но не сложно догадаться, что наш проблемный сервер перезапускала именно эта задача. Остается проверить на теории. Понаблюдаю сервер и позже отпишусь, что получилось.

ShaddyR
16-09-2019, 13:23
neviDimka91, это никак не объясняет наличие артефактов и недогруз сервер, не так ли?

neviDimka91
16-09-2019, 13:32
это никак не объясняет наличие артефактов и недогруз сервер, не так ли? »
Да, все верно я думаю, проблема №2 как была так и остается, но сначала нужно проверить ушла ли проблема №1. Для этого нужно время.

cameron
16-09-2019, 14:07
я бы начала с проверки сетевого кабеля и\или использования другой сетевой карты. возможно где-то на линии мышки прогрызли кабелёк.
с другой стороны - пытаться диагностировать ошибку железа 12 летней давности без логов IPMI\iLO\iDrac\etc может оказаться почти бессмысленным.
его производительность ниже, чем у современного i7, включая память и диски.

neviDimka91
18-09-2019, 08:40
я бы начала с проверки сетевого кабеля и\или использования другой сетевой карты. возможно где-то на линии мышки прогрызли кабелёк. »
Кабель цел, мышей нет))) Все же работает когда обратно подключаешь кабель в разъем , потерь пакетов нету. Тут что-то аппаратное я думаю, но проверить теории пока нет возможности, так как сервер должен работать 24/7 пока не перенесем всю 1с на другой сервак




© OSzone.net 2001-2012