Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Windows Server 2008/2008 R2 (http://forum.oszone.net/forumdisplay.php?f=97)
-   -   [решено] Откат сервера на 4 часа назад. (http://forum.oszone.net/showthread.php?t=270055)

HellFire_MZ 16-10-2013 10:14 2235338

Откат сервера на 4 часа назад.
 
Всем привет, коротко о конфигурации.
Имеется Windows 2008 R2 server, установлен на RAID SRCSASRB с BBU - RAID 1 из 2 дисков SAS, с базами данных 1с 8, которые стоят на RAID 10 из 4 дисков SAS.
Имеется также второй RAID RS2BL040 c BBU, на нем установлен RAID 1 из двух SSD и RAID0 из одного терабайтного диска.
Вчера неожиданно RS2BL040 завис и вобще пропал из системы. Это было около 5 часов дня. Работа в базах 1с продолжалась до 20.00, и в 20.00 я перезагрузил сервер.
Последствием стало то, что на системном диске появились ошибки. Например, у меня пропал список баз 1с. Тут я заподозрил неладное и пошел проверять базы.
Я был в шоке, данные в базах откатились на 17.00.

Подскажите, коллеги, как данное могло произойти?

alef2474 16-10-2013 11:48 2235392

Наверно настроили автобэкап всего и системы и баз, а потом автовосстановление случилось после перезагрузки как раз.
В промежутке между 17-00 и 20-00 Вы создавали/пересоздавали список баз?

HellFire_MZ 16-10-2013 11:58 2235400

Цитата:

Цитата alef2474
Наверно настроили автобэкап всего и системы и баз »

Автобекап происходит в 22.00. Через Cobian Backup. Backup системы делается ночью в 2 часа ночи.
Цитата:

Цитата alef2474
В промежутке между 17-00 и 20-00 Вы создавали/пересоздавали список баз? »

Вполне возможно я его изменял.

alef2474 16-10-2013 12:32 2235426

Что было на зависшем рейде и как он включен в систему Вы не пишете. Какие ошибки на системном диске тоже, гадать сложно.
Список баз 1С - в реестре вроде как.
В любом случае Cobian backup часто использует для настроек системный каталог временных файлов, который мог сбиваться.
Есть ли что в журнале Cobian неизвестно.
Еще скорее всего базы 1С - SQL и через SQL-агенты может быть настроен и бэкап и автовосстановление. Сбой был, вот и автовосстановилось на время сбоя, как положено после перезагрузки.

cameron 16-10-2013 15:16 2235543

Цитата:

Цитата alef2474
Еще скорее всего базы 1С - SQL и через SQL-агенты может быть настроен и бэкап и автовосстановление. Сбой был, вот и автовосстановилось на время сбоя, как положено после перезагрузки. »

:o
может быть покажете запрос? :)
что бы было ясно и понятно - уточню, в ходе запроса должна быть проверка выкл/вкл ОС и автоматическое восставление какого-либо бэкапа. :clapping:
HellFire_MZ,
я не поняла что было на втором контролелер и где возникли проблемы.
по поводу отката данных:
1. лог контроллера
2. лог SQL (если базы SQL).

alef2474 16-10-2013 18:12 2235628

Цитата cameron:
может быть покажете запрос? »

Не понимаю, отчего смайликов накидали, лучше бы свою версию случившегося предложили.
Все стандартно, могли понаписать чего угодно для автовосстановления, а оно неудачно сработало.Если у автора это случилось и есть, то посмотрит, какой у него запрос запускается.
Restore Database ...
From Disk ...
With ...
Restore Log ...
From Disk ...
With ...
....
проверка включения sql - проверка открыть соединение и анализ ошибок:
try
{
connection.Open();
}
catch (SqlException esql)
{
switch (esql.Number))
{
case 0: ...
...
case N: ...
default: ...
}
}

cameron 16-10-2013 20:23 2235706

Цитата:

Цитата alef2474
Не понимаю, отчего смайликов накидали, лучше бы свою версию случившегося предложили.
Все стандартно, могли понаписать чего угодно для автовосстановления, а оно неудачно сработало.Если у автора это случилось и есть, то посмотрит, какой у него запрос запускается. »

я про то, что автовосстановление не должно запускаться при штатной перезагрузке.
и я почти уверена что ничего такого у ТС нет.
Цитата:

Цитата alef2474
лучше бы свою версию случившегося предложили. »

для моей версии мало исходных данных.
похожую ситуацию я слышала от коллеги, но там был контроллер адаптек какой-то 1000 серии.

HellFire_MZ 22-10-2013 22:55 2239217

Прошу прощения за молчание.
Цитата:

Цитата alef2474
Что было на зависшем рейде и как он включен в систему Вы не пишете. »

На первом RAID контроллере стоит система и рейд для баз создан. другой зависший рейд контроллер состоял из 2 дисков SSD в RAID1 и RAID-0 - гигобайтный диск WD, который в свою очередь и стал причиной нестабильной работы контроллера. Сейчас он отключен и ошибок нет.
Базы не SQL, так что про запросы разговора нет.
cameron, у меня лишь догадки. Оба контроллера - Intel, второй контроллер, с проблемным диском перестал видеться в консоли. Просто Device И всё.
После ребута - Работа Windows восстановлена после серьезной ошибки. еще в логах я заметил удаленные теневые копии + синий экран Power driver failure.
То есть - все это время контроллер писал не на диски, а в свой кэш, после ребута не смог скинуть данные на диски, хоть батарейка и стоит.
Не нравятся мне контроллеры Интел последнее время.


Время: 18:59.

Время: 18:59.
© OSzone.net 2001-