1. До перезагрузки нужно собрать данные для последующего анализа
- Сфотографировать/заскриншотить экран для последующего выяснения и устранения причины.
- Выяснить реакцию на нажатия Num lock / Caps lock / Scroll lock (загораются ли лампочки на клавиатуре).
- Проверить, работает ли локальная консоль, если сервер недоступен по SSH.
- Если получится залогиниться:
dmesg > /root/dmesg.log && ip -s -s link show > /root/links.log && ip a > /root/ip_a.log
2. После перезагрузки надо собрать ещё немного данных
Проверить собранную kdump информацию (содержимое папки /var/crash/). По файлу dmesg.txt можно будет определить причину повисания (модули фильтрации, прошивки оборудования, что-то ещё и т.д.).
В случае отсутствия этой информации - единственное на что можно как-то полагаться - собранная в пункте 1 информация (которая часто оказывается недостаточной для определения настоящей причины проблемы).
3. Если сервер вообще не отвечает
При повисании сервера необходимо:
Первым делом проверить аппаратную часть:
- Проверить крутятся ли вентиляторы.
- Выключить сервер.
- Проверить руками температуру HDD и радиаторов, рука должна терпеть.
- Отключить все шлейфы, вытащить память, прочистить контакты(можно стирательной резинкой), включить заново.
- Включить, продуть весь сервер пылесосом.
Если после этих действий повисания продолжаются и на экране ничего нет, значит сервер сделал reset аппаратно, попробовать сменить память, сетевки, диск, БП, материнку, или установить на другой сервер.
4. Если не хочется особо за это заморачиваться
Можете запросить бесплатную лицензию для резервного сервера, который будет получать точно такое же зеркало.