Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Windows Server 2012/2012 R2 (http://forum.oszone.net/forumdisplay.php?f=117)
-   -   2 DC, 2 проблемы (http://forum.oszone.net/showthread.php?t=296340)

rezets 03-03-2015 15:53 2478252

2 DC, 2 проблемы
 
есть 2 DC:
1. cluster1 (2012, pdc, хранитель всех fsmo ролей);
2. cluster2 (2012, dc).

Раньше cluster2 был pdc, но в какой-то момент приказал долго жить (полетела система). было решено пока восстанавливался сервер роли были перехвачены на другой (clusyer1). После этого оживший cluster2 ввели в строй. Детали уже не скажу.
2 сервера достаточно мощные, идея их использования была следующая:
1. на обоих поднимается стандартный набор сервисов (AD, DNS, DHCP и пр.), поднимается Hyper-v сервер на обоих и на каждом сервере поднимаются нужные нам ВМ со взаимной отказоустойчивостью.

И вроде сейчас всё работает, решили настроить отказоустойчивый кластер. Запускаем оснастку, запускаем общий тест, в результате выдает отчет со следующей ошибкой:
Полное доменное имя Домен Роль домена Имя сайта Подразделение
Cluster1.stokf.ru stokf.ru Основной контроллер домена Default-First-Site-Name Domain Controllers
cluster2.stokf.ru stokf.ru Произошла неопознанная ошибка. Default-First-Site-Name Domain Controllers
Не удалось определить, является ли узел cluster2.stokf.ru контроллером домена только для чтения, из-за следующей ошибки: Объект не существует.
Узлы Cluster1.stokf.ru cluster2.stokf.ru не могут связаться с контроллером домена, доступным для записи. Проверьте возможность подключения этих узлов к контроллерам домена.

попытался просто снять с cluster2 роль DC, в результате получил ошибку при понижении. В общем по хорошему опускаться он отказался.
Теперь стоим перед выбором:
1. выключаем cluster2, чистим все в ад от него, поднимаем на его основе новый сервер с новым именем и делаем его вторым DC;
2. исправляем косяк на живом.
Хочется пойти вторым способом, поскольку на cluster2 висят разные службы, а также виртуальные машины, работа которых также нужна, а перенести всё сразу на cluster1, страшновато.

подскажите, как победить, какие отчеты нужны, сброшу

ko4evneg 03-03-2015 16:15 2478265

А вы уверены, что второй контроллер вообще функционирует? Покажите dcdiag с него. Какую ошибку выдал при понижении?

rezets 03-03-2015 16:36 2478277

Вот результаты с cluster2:

PS C:\Windows\system32> dcdiag /q /e - выдает ошибки.
Cинтаксическая ошибка: Недопустимый параметр /. Для получения справки используйте dcdiag.exe /h.
PS C:\Windows\system32> dcdiag /q /e
Учетная запись CLUSTER1 не является доверенной для делегирования. Она не может реплицироваться.
......................... CLUSTER1 - не пройдена проверка MachineAccount
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:35:58
Строка события:
Не удалось установить связь DCOM с компьютером 193.106.72.254 через какой-либо из настроенных протоколов; за
прос от PID 3270 (C:\Windows\system32\dcdiag.exe).
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:36:19
Строка события:
Не удалось установить связь DCOM с компьютером 193.106.73.254 через какой-либо из настроенных протоколов; за
прос от PID 3270 (C:\Windows\system32\dcdiag.exe).
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:36:40
Строка события:
Не удалось установить связь DCOM с компьютером 8.8.8.8 через какой-либо из настроенных протоколов; запрос от
PID 3270 (C:\Windows\system32\dcdiag.exe).
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:36:50
Строка события:
Не удалось установить связь DCOM с компьютером 91.221.232.1 через какой-либо из настроенных протоколов; запр
ос от PID 3270 (C:\Windows\system32\dcdiag.exe).
......................... CLUSTER1 - не пройдена проверка SystemLog
Неверный тип запуска службы: NtFrs на CLUSTER2, текущее значение - DISABLED, ожидаемое значение -
AUTO_START
Служба NtFrs в [CLUSTER2] остановлена
......................... CLUSTER2 - не пройдена проверка Services
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:35:32
Строка события:
Не удалось установить связь DCOM с компьютером 193.106.72.254 через какой-либо из настроенных протоколов; за
прос от PID 4314 (C:\Windows\system32\dcdiag.exe).
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:35:55
Строка события:
Не удалось установить связь DCOM с компьютером 193.106.73.254 через какой-либо из настроенных протоколов; за
прос от PID 4314 (C:\Windows\system32\dcdiag.exe).
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:36:16
Строка события:
Не удалось установить связь DCOM с компьютером 8.8.8.8 через какой-либо из настроенных протоколов; запрос от
PID 4314 (C:\Windows\system32\dcdiag.exe).
Возникла ошибка. Код события (EventID): 0x0000272C
Время создания: 03/03/2015 14:36:35
Строка события:
Не удалось установить связь DCOM с компьютером 91.221.232.1 через какой-либо из настроенных протоколов; запр
ос от PID 4314 (C:\Windows\system32\dcdiag.exe).
......................... CLUSTER2 - не пройдена проверка SystemLog
Проблемы у некоторых объектов, относящихся к DC CLUSTER2:
[1] Проблема: Отсутствует ожидаемое значение
Базовый объект:
CN=NTDS Settings,CN=CLUSTER2,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=stokf,DC=ru
Описание базового объекта: "Объект DSA"
Имя атрибута объекта значения: serverReferenceBL
Описание объекта значения: "Объект члена SYSVOL FRS"
Рекомендуемое действие: См. статью базы знаний: Q312862

[1] Проблема: Отсутствует ожидаемое значение
Базовый объект: CN=CLUSTER2,OU=Domain Controllers,DC=stokf,DC=ru
Описание базового объекта: "Объект учетной записи DC"
Имя атрибута объекта значения: frsComputerReferenceBL
Описание объекта значения: "Объект члена SYSVOL FRS"
Рекомендуемое действие: См. статью базы знаний: Q312862

......................... CLUSTER2 - не пройдена проверка VerifyReferences

А вот ошибка при понижении:
Сбой операции по следующей причине:

Ошибка на удаленном сервере службы каталогов Cluster1.stokf.ru при попытке ликвидации сервера службы каталогов CN=CLUSTER2,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=stokf,DC=ru.

"Отказано в доступе."

ko4evneg 03-03-2015 17:17 2478293

Что-то я не уверен в его работоспособности, посмотрите локально на cluster2, например есть ли в AD объекты которые вы создавали в последние дни?
Как именно вы восстанавливали cluster2 после сбоя?
Какие именно на него завязаны сервисы, мешающие просто добавить новый контроллер? Допускают ли они сценарий вывода этой машины из домена?

User001 03-03-2015 17:36 2478297

Цитата:

Цитата rezets
1. на обоих поднимается стандартный набор сервисов (AD, DNS, DHCP и пр.), поднимается Hyper-v сервер на обоих и на каждом сервере поднимаются нужные нам ВМ со взаимной отказоустойчивостью. »

Что вы из этого сделали? Где какие сервисы? Что на ВМ, что нет?

rezets 03-03-2015 18:05 2478317

на cluster1 и 2 на каждом из них висят AD, DNS, DHCP, File, IIS, DFS и Hyper-v.
На cluster1 дополнительно: службы сертификации и активации.
На cluster2 дополнительно: служба печати и NAP
Виртуальные машины вертят бекапы, антивирусы, всусы и прочее не приоритетное добро.

rezets 04-03-2015 08:36 2478527

А после попытки понижения cluster2 на cluster1 в консоли вылетает предложение повысить cluster2 до уровня DC. Если попробовать это сделать, вылетает:
Ошибка при определении того, является ли целевой сервер контроллером домена: Целевой сервер уже выполняет роль контроллера домена.

rezets 05-03-2015 14:00 2479089

Что, никто ничего не скажет, не посоветует?№

ko4evneg 05-03-2015 15:26 2479136

Цитата:

Цитата rezets
Что, никто ничего не скажет, не посоветует?№ »

Можете попробовать выключить фаервол и сделать dcdiag еще раз. Вообще похоже больше на то, что контроллер криво восстановили, вы так и не сказали как именно вы его реанимировали

rezets 05-03-2015 15:35 2479140

Вот результат:
S C:\Windows\system32> dcdiag /q /e
За последние 24 часа после предоставления SYSVOL в общий доступ зафиксированы предупреждения или сообщения об
ошибках. Сбои при репликации SYSVOL могут стать причиной проблем групповой политики.
......................... CLUSTER1 - не пройдена проверка DFSREvent
Учетная запись CLUSTER1 не является доверенной для делегирования. Она не может реплицироваться.
......................... CLUSTER1 - не пройдена проверка MachineAccount
Внимание: CLUSTER2 не объявлен как сервер времени.
......................... CLUSTER2 - не пройдена проверка Advertising
Неверный тип запуска службы: NtFrs на CLUSTER2, текущее значение - DISABLED, ожидаемое значение -
AUTO_START
Служба NtFrs в [CLUSTER2] остановлена
......................... CLUSTER2 - не пройдена проверка Services
Проблемы у некоторых объектов, относящихся к DC CLUSTER2:
[1] Проблема: Отсутствует ожидаемое значение
Базовый объект:
CN=NTDS Settings,CN=CLUSTER2,CN=Servers,CN=Default-First-Site-Name,CN=Sites,CN=Configuration,DC=stokf,DC=ru
Описание базового объекта: "Объект DSA"
Имя атрибута объекта значения: serverReferenceBL
Описание объекта значения: "Объект члена SYSVOL FRS"
Рекомендуемое действие: См. статью базы знаний: Q312862

[1] Проблема: Отсутствует ожидаемое значение
Базовый объект: CN=CLUSTER2,OU=Domain Controllers,DC=stokf,DC=ru
Описание базового объекта: "Объект учетной записи DC"
Имя атрибута объекта значения: frsComputerReferenceBL
Описание объекта значения: "Объект члена SYSVOL FRS"
Рекомендуемое действие: См. статью базы знаний: Q312862

......................... CLUSTER2 - не пройдена проверка VerifyReferences

Восстанавливали из какого-то бекапа месячной давности.

сегодня утром перезагружали cluster1. В этот момента на cluster2 начали валиться ошибки DNS:
DNS-сервер обнаружил критическую ошибку Active Directory. Проверьте работоспособность Active Directory. Дополнительная отладочная информация об ошибке: "" (может отсутствовать). Данные о событии содержат сведения об ошибке.

Получается, он понимает, что его AD не работает/глючит, но что с этим делать? Возвращаемся к моему вопросу: восстанавливаем или убиваем и чистим?

ko4evneg 05-03-2015 16:21 2479165

Цитата:

Цитата rezets
Возвращаемся к моему вопросу: восстанавливаем или убиваем и чистим? »

Неизвестно в каком состоянии находится ваш контроллер, вполне возможно, что в AD при попытке понижения была удалена часть атрибутов. Можете попробовать восстановить (начинайте с этой статьи). Я бы рекомендовал переставить, если сервисы без труда переносятся, и почистить данные об этом контроллере в AD принудительно.

rezets 18-03-2015 09:48 2484193

Почистили принудительно, сейчас собираемся поднимать новый. Только в эксчендже одну ошибку победим и начнем (почему-то не хочет отрабатывать запрос на пользователей к AD). Но это уже другая история.


Время: 18:24.

Время: 18:24.
© OSzone.net 2001-