Цитата:
Цитата __sa__nya
вы имеете ввиду запись событий в файлы логов, которые есть в ОС "из коробки" и их нужно настроить, или установку какого-то софта, связанного с записью данных по состоянию железа ? »
|
Большей частью второе, по умолчанию система в логи пишет только критическое с её точки зрения, например, ошибки сегментирования, отвал интерфейсов, ошибки при выполнении cron-задач, oom-киллы и прочее в таком духе. Если есть куда писать - например, если отваливается фс раздела, куда пишутся логи, они туда не запишутся (но dmesg покажет проблему, если сервер ещё не перезагружен). Температуры, обороты вентиляторов, состояние дисков, ошибки ECC памяти - для всего этого нужен специальный софт. Ну и нужен софт для сбора и анализа всех показателей (не только по железу, например, сервер может подвергнуться дос-атаке, железо в полном порядке, но сервер не работает должным образом, тк перегружен). Потому что сидеть и пялиться в top, логи и прочее вручную никаких ресурсов не хватит. Также нельзя исключать деятельность зловредов - должен быть включен брандмауэр (если сервер в мир с голым задом, а не уже за брандмауэром), вестись его логи, должен был быть настроен софт, детектящий атаки, проверки на руткиты и прочую дрянь. Но всем этим нужно было озаботиться заранее, а сейчас у вас проблема ещё и в том, что версия убунты очень старая, она емнип снята с поддержки лет 5 как. Что-то доустановить будет проблематично.
mdadm? железный райд? недорайд?
Цитата:
Цитата __sa__nya
Какая мамка сказать не могу. »
|
dmidecode довольно подробно расскажет о железе. smartctl покажет смарт хардов. Поскольку железо десктопное, то диагностика памяти без окна обслуживания с остановкой сервера и запуска того же memtest86+ невозможна. Температуры может показать lmsensors.