Отладка сбоя ОС Solaris

У меня есть доступ к удаленному терминалу Solaris, который время от времени дает сбой, и мне приходится просить кого-то с физическим доступом загрузить машину, что он и делает успешно. Я хотел бы знать, на какие инструменты/файлы мне следует обратить внимание, чтобы выяснить причину сбоя, чтобы я мог внести необходимые изменения в конфигурацию и избежать этого в будущем.


person Epitaph    schedule 06.01.2009    source источник
comment
Почему это помечено как не связанное с программированием? На мой взгляд, ответы на этот вопрос могут быть полезны для целей отладки (особенно на уровне операционной системы и драйвера устройства).   -  person matli    schedule 13.01.2009
comment
Я не ставил этот тег. Но это не имеет прямого отношения к программированию. Я понимаю ваши рассуждения, так как я столкнулся с этой ошибкой при программировании;)   -  person Epitaph    schedule 13.01.2009


Ответы (1)


Какие инструменты вы можете использовать, будет зависеть от того, какая у вас версия Solaris и в чем проблема. Первое, что нужно сделать, это проверить системную консоль (к которой, похоже, у вас нет доступа) и файл /var/adm/messages. Этот файл обновляется системными сообщениями, и самые новые сообщения появляются в конце.

Затем вы можете найти файл ядра системы. Если создается основной файл, он будет находиться в /var/crash/hostname, где «hostname» — это имя машины.

Если у вас есть реальный файл ядра в каталоге /var/crash/hostname, этот набор команд даст вам хорошую строку для поиска в Google:

# cd /var/crash/hostname

Замените «имя хоста» на имя хоста вашей машины.

# mdb -k unix.0 vmcore.0 

Если у вас есть несколько основных файлов, выберите самую последнюю версию.

 > ::status

Это должно дать вам паническое сообщение, вырежьте и вставьте его в Google и посмотрите, что вы можете найти.

Подробнее об анализе основных файлов читайте здесь: http://cuddletech.com/blog/pivot/entry.php?id=965

person Alan H    schedule 07.01.2009