Сервер завис, перезагрузился или kernel panic

по сравнению с
Ключ
Эта строка удалена.
Это слово было удалено. Это слово было добавлено.
Эта строка добавлена.

Изменения (17)

просмотр истории страницы
На текущий момент нет известных нам проблем с повисанием и reset сервера с обычным ядром и типовым оборудованием. Возможные проблемы есть у экспериментальных ядер, отличных от ICServer и при использовании редкого оборудования.
h2. Общая информация


* Если сервер завис программно, то на экране будет выводиться tracelog(сообщения об ошибках) в течение 8 минут, после этого будет reset.
Этот tracelog реализован средствами немаскируемых прерываний NMI и работает в любых условиях даже если ядро совсем повисло.
# На текущий момент нет известных нам проблем с повисанием и reset сервера с обычным ядром и типовым оборудованием. Возможные проблемы есть у экспериментальных ядер, отличных от ICServer и при использовании редкого оборудования.
# Если сервер завис программно, то на экране будет выводиться tracelog(сообщения об ошибках) в течение 8 минут, после этого будет reset. Этот tracelog реализован средствами немаскируемых прерываний NMI и работает в любых условиях даже если ядро совсем повисло.
# Если на экране сервера нет сообщений об ошибках tracelog, значит сервер не повис или повис аппаратно.

* Если на экране сервера нет сообщений об ошибках tracelog, значит сервер не повис или повис аппаратно.

{code:borderStyle=solid}

{code}

h2. Зависание сервера

При повисании зависании сервера необходимо:

     Первым делом проверить аппаратную часть:
# Сохранить в отдельный файл вывод команды: *netstat*
# Сохранить в отдельный файл вывод команды: *pstree \-upal*
# Необходимо сделать фотографию экрана и включить режим помощника и выслать фото и пароль на asr@ideco.ru, support@carbonsoft.ru, наши специалисты исправят проблему и установят вам исправленное ядро
# Проверить доступность сервера из сети Интернет
# Проверить что никто не подставляет ip-адрес сервера. Проверить можно командой arping \-D 192.168.0.1 \-I Leth1
# Проверить с  пользовательской машины ping до сервера и записать мак адрес который определился arp \-a или arp \-n
# Попробовать перезагрузить коммутатор или попробовать подключиться к серверу напрямую кабелем
#  

----
Если происходит panic или reset необходимо:
# Задать интервал времени до перезагрузки можно задать в секундах, указав их в команде, например 600 секкунд
h2. Kernel panic или перезагрузка

Если происходит *kernel panic* или *перезагрузка* необходимо:
# Задать интервал времени до перезагрузки можно задать в секундах, указав их в команде, например 600 секкунд. Если вы не уверены, что успеете сфотографировать сервер за 10 минут, можно выставить большее значение.
echo "600" >/proc/sys/kernel/panic
# При следующем reset или panic сервер будет ждетть ждать 600 секунд, нужно:

- сфотографировать экран;
- [скопировать файлы с сервера|asrdocnew:Резервное копирование и восстановление из бекапов при помощи WinSCP]
- выслать фото и файлы в тех.поддержку вложениями к заявке.

# - Если на экране ничего нет, значит сервер сделал reset аппаратно, попробовать сменить память, сетевки, диск, БП, материнку, или установить на другой сервер.