Показать полную графическую версию : [решено] Откат сервера на 4 часа назад.
HellFire_MZ
16-10-2013, 10:14
Всем привет, коротко о конфигурации.
Имеется Windows 2008 R2 server, установлен на RAID SRCSASRB с BBU - RAID 1 из 2 дисков SAS, с базами данных 1с 8, которые стоят на RAID 10 из 4 дисков SAS.
Имеется также второй RAID RS2BL040 c BBU, на нем установлен RAID 1 из двух SSD и RAID0 из одного терабайтного диска.
Вчера неожиданно RS2BL040 завис и вобще пропал из системы. Это было около 5 часов дня. Работа в базах 1с продолжалась до 20.00, и в 20.00 я перезагрузил сервер.
Последствием стало то, что на системном диске появились ошибки. Например, у меня пропал список баз 1с. Тут я заподозрил неладное и пошел проверять базы.
Я был в шоке, данные в базах откатились на 17.00.
Подскажите, коллеги, как данное могло произойти?
alef2474
16-10-2013, 11:48
Наверно настроили автобэкап всего и системы и баз, а потом автовосстановление случилось после перезагрузки как раз.
В промежутке между 17-00 и 20-00 Вы создавали/пересоздавали список баз?
HellFire_MZ
16-10-2013, 11:58
Наверно настроили автобэкап всего и системы и баз »
Автобекап происходит в 22.00. Через Cobian Backup. Backup системы делается ночью в 2 часа ночи.
В промежутке между 17-00 и 20-00 Вы создавали/пересоздавали список баз? »
Вполне возможно я его изменял.
alef2474
16-10-2013, 12:32
Что было на зависшем рейде и как он включен в систему Вы не пишете. Какие ошибки на системном диске тоже, гадать сложно.
Список баз 1С - в реестре вроде как.
В любом случае Cobian backup часто использует для настроек системный каталог временных файлов, который мог сбиваться.
Есть ли что в журнале Cobian неизвестно.
Еще скорее всего базы 1С - SQL и через SQL-агенты может быть настроен и бэкап и автовосстановление. Сбой был, вот и автовосстановилось на время сбоя, как положено после перезагрузки.
Еще скорее всего базы 1С - SQL и через SQL-агенты может быть настроен и бэкап и автовосстановление. Сбой был, вот и автовосстановилось на время сбоя, как положено после перезагрузки. »
:o
может быть покажете запрос? :)
что бы было ясно и понятно - уточню, в ходе запроса должна быть проверка выкл/вкл ОС и автоматическое восставление какого-либо бэкапа. :clapping:
HellFire_MZ,
я не поняла что было на втором контролелер и где возникли проблемы.
по поводу отката данных:
1. лог контроллера
2. лог SQL (если базы SQL).
alef2474
16-10-2013, 18:12
Цитата cameron:
может быть покажете запрос? »
Не понимаю, отчего смайликов накидали, лучше бы свою версию случившегося предложили.
Все стандартно, могли понаписать чего угодно для автовосстановления, а оно неудачно сработало.Если у автора это случилось и есть, то посмотрит, какой у него запрос запускается.
Restore Database ...
From Disk ...
With ...
Restore Log ...
From Disk ...
With ...
....
проверка включения sql - проверка открыть соединение и анализ ошибок:
try
{
connection.Open();
}
catch (SqlException esql)
{
switch (esql.Number))
{
case 0: ...
...
case N: ...
default: ...
}
}
Не понимаю, отчего смайликов накидали, лучше бы свою версию случившегося предложили.
Все стандартно, могли понаписать чего угодно для автовосстановления, а оно неудачно сработало.Если у автора это случилось и есть, то посмотрит, какой у него запрос запускается. »
я про то, что автовосстановление не должно запускаться при штатной перезагрузке.
и я почти уверена что ничего такого у ТС нет.
лучше бы свою версию случившегося предложили. »
для моей версии мало исходных данных.
похожую ситуацию я слышала от коллеги, но там был контроллер адаптек какой-то 1000 серии.
HellFire_MZ
22-10-2013, 22:55
Прошу прощения за молчание.Что было на зависшем рейде и как он включен в систему Вы не пишете. »
На первом RAID контроллере стоит система и рейд для баз создан. другой зависший рейд контроллер состоял из 2 дисков SSD в RAID1 и RAID-0 - гигобайтный диск WD, который в свою очередь и стал причиной нестабильной работы контроллера. Сейчас он отключен и ошибок нет.
Базы не SQL, так что про запросы разговора нет.
cameron, у меня лишь догадки. Оба контроллера - Intel, второй контроллер, с проблемным диском перестал видеться в консоли. Просто Device И всё.
После ребута - Работа Windows восстановлена после серьезной ошибки. еще в логах я заметил удаленные теневые копии + синий экран Power driver failure.
То есть - все это время контроллер писал не на диски, а в свой кэш, после ребута не смог скинуть данные на диски, хоть батарейка и стоит.
Не нравятся мне контроллеры Интел последнее время.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.