Войти

Показать полную графическую версию : Система периодически подвисает


hozman
22-12-2020, 20:18
Добрый вечер. У меня назрел вопрос. Уже некоторое время у меня на одном из сервером происходит какой-то сбой. Раз в неделю или полторы, в среднем, система зависает. В этот момент, если зайти удалённо или локально бывает так, что появляется запрос авторизации, но авторизоваться н возможно, сколько бы раз не вводил корректные данные, а бывает и так, что система вообще не реагирует на запросы никак. После перезагрузки система, в принципе, работает адекватно. Тем не менее, это не нормально. Вот сегодня у меня добрались руки до этого сервера. Вот скрин событий сервера:

http://images.vfl.ru/ii/1608654003/2ff779d2/32741405_m.png (http://vfl.ru/fotos/2ff779d232741405.html)

По сути, как видно из скрина ситуация следующая:

1. Появляется цупочка событий:
SERVER1C 153 Предупреждение disk Система 22.12.2020 2:18:12
Следующего содержания:
Операция ввода-вывода по адресу логического блока 0xdd12b70 для диска 0 (имя PDO: \Device\Ide\IdeDeviceP0T0L0-0) выполнена повторно.

2. Далее вижу событие:
SERVER1C 140 Предупреждение Microsoft-Windows-Ntfs Система 22.12.2020 2:18:13
Следующего содержания:
Системе не удалось записать данные в журнал транзакций. Могло возникнуть повреждение в VolumeId: E:, DeviceName: \Device\HarddiskVolume4.
(Ошибка ввода/вывода на устройстве ввода/вывода.)

3. Далее вижу в раных местах события:
SERVER1C 2008 Ошибка mrcbt Система 22.12.2020 8:45:22
Следующих содержаний:
The previous session did not finalize the tracking file on device \Device\HarddiskVolume4 (C :). The tracking file has been reset.
The previous session did not finalize the tracking file on device \Device\HarddiskVolume5 (D :). The tracking file has been reset.
The previous session did not finalize the tracking file on device \Device\HarddiskVolume1. The tracking file has been reset.
4. В итоге вижу:
SERVER1C 41 Критическое Microsoft-Windows-Kernel-Power Система 22.12.2020 8:45:41
Следующего содержания:
Система перезагрузилась, завершив работу с ошибками. Возможные причины ошибки: система перестала отвечать на запросы, произошел критический сбой или неожиданно отключилось питание.
5. Чуть выше по событиям, которые не влезло в скрин находится:
SERVER1C 8193 Ошибка VSS Приложение 22.12.2020 8:47:42
Следующего содержания:
Ошибка теневого копирования тома: Непредвиденная ошибка при вызове подпрограммы RegOpenKeyExW(-2147483646,SYSTEM\CurrentControlSet\Services\VSS\Diag,...).. hr = 0x80070005, Отказано в доступе.
.

Операция:
Инициализация модуля записи

Контекст:
Код класса модуля записи: {e8132975-6f93-4464-a53e-1050253ae220}
Имя модуля записи: System Writer
Код экземпляра модуля записи: {322b5d3f-7ec6-4739-83f1-15f8b9505bb7}

Как всё это понимать? Проблема в том, что у меня происходят бэкапы? Я наблюдал на один из серером проблему в бэкапами, но.. там я тестировал другое ПО для этого. Здесь программа для бэкапа другая. Сколько работает, проблемы возникают периодически, не кадый раз. Бэкапы делаются в разное время. Некоторые ежечасно, некоторые ежедневно. Базы бухгалтерии бэкапятся ежечастно и раз в день. Сама операционная система бэкапится раз в день ночью. И самое интересное, что подвисания возникали только по ночам. Днём таких сюрпризов не возникало ни разу.
Как понять в чём источник проблем? Имею ввиду, всё-таки в программе для бэкапа или в железе?
Жёсткий диск с системный новый. Я ео менял пару месяцев назад, когда обнаружились первые признаки таких "сюрпризов". Оперативную память я уже заменил на аналогичную. Остаётся лишь материнская плата или проц.
В общем, очень интересно услышать мнение со стороны. Думаю, прикупить новый системник под сервер, но вот вопрос в том, что имеется ли вероятность, что проблема не в этом, а в программного обеспечении для бэкапа?

NickM
22-12-2020, 20:30
Смотрите состояние ж/д, если они в RAID, тогда смотрите с помощью того ПО/ утилит, которые предоставляет производитель - Adaptec там, LSI и пр. вендоры.
Если диски под "простым", Embedded RAID ли, или просто так стоят - тогда, возможно, вам помощник окажется "CrystalDiskInfo (https://crystalmark.info/redirect.php?product=CrystalDiskInfo)", для просмотра СМАРТа.
Прикладывайте, а там посмотрим...

hozman
27-12-2020, 13:17
NickM, оказалось, что тот жёсткий диск (б.у.), который я одключил временно до покупки нового, чтобы на него записывать бэкапы вообще отключился. Даже разделов не было на нём.. Первый раз такое вижу. В итоге, программа, которая делает бэкапы когда начинала делать бэкап клинила, как я понимаю.
Но вот одно интересно. По идее, программа могла проверить состояние места для хранения резервной копии , если жсткий диск не доступен, ругнуться и всё. А реально так и происходило, но периодически клинило и подвисала вся система. Вот это странно..




© OSzone.net 2001-2012