Проблемы с оборудованием

Ключ
Эта строка удалена.
Это слово было удалено. Это слово было добавлено.
Эта строка добавлена.

Изменения (1)

просмотр истории страницы
{color:#333333}[http://mirror.yandex.ru/centos/6.6/isos/x86_64/]{color}{color:#333333}  ({color}[CentOS-6.6-x86_64-minimal.iso|http://mirror.yandex.ru/centos/6.6/isos/x86_64/CentOS-6.6-x86_64-minimal.iso]{color:#333333}).{color}

h2. Полезные утилиты и способы диагностики

h3. Посмотреть тип оборудования:

Устанавливаем утилиту:

{code}
yum install dmidecode
{code}

запускаем

{code}
dmidecode -t system | head -n20
{code}

анализируем в выводе Manufacturer: и Product Name:

h3. Примеры:
а) Manufacturer: HP
Product Name: ProLiant DL360 Gen9
Это сервер HP
б) Manufacturer: Supermicro
Product Name: SYS-5019S-MR
Это тоже сервер
в) Manufacturer: System manufacturer
Product Name: System Product Name
Это обычное "десктопное" оборудование -- часто производитель не заполняет эти поля
г) Manufacturer: VMware, Inc.
Product Name: VMware Virtual Platform
Это виртуализированное окружение, хост-машина может быть на любой платформе


h3. Контроль температуры:

1) Серверные платформы

{code}
yum -y install ipmitool

modprobe ipmi_si

modprobe ipmi_devintf

{code}

теперь можно посмотреть сенсоры:

{code}
ipmitool sdr list
{code}

2) Обычные "десктопные" платформы

{code}
yum install lm_sensors
{code}
после установки ищем сенсоры
{code}
sensors-detect
{code}
теперь можно посмотреть сенсоры:
{code}
sensors
{code}

(пока поддерживаются не все современные материнские платы)


h3. Проверка процессора:

Подготовка: если сервер многопроцессорный, устанавливаем утилиту numactl

{code}
yum -y install numactl
{code}

Она позволит ограничить выполнение определенными ядрами процессора.
Смотрим конфигурацию машины:

{code}
numactl --show
{code}

Анализируем вывод: если в параметре "cpubind:" только 0, то система считает себя однопроцессорной, и ограничение не имеет смысла
Далее любую команду выполняем так: "numactl --cpubind <номер процессора> <ваша команда>"
Для проверки правильности можно вызвать командой саму себя:

{code}
numactl --cpubind 1 numactl --show
{code}

Должно показать "cpubind: 1"

Устанавливаем утилиту:

{code}
yum -y install stress
{code}

Используем утилиту stress: stress -t <время теста> -c <количество потоков>
количество потоков задаем как кол-во ядер процессора
Пример: stress -t 120 -c 16 — две минуты (120 секунд) и 16 потоков

Во время выполнения теста контролируем температуру процессора и вывод в /var/log/messages
Если в messages во время теста появилось что-то типа "Сore temperature above threshold, cpu clock throttled", значит имеются проблемы с охлаждением
Если в messages во время теста появилось "[Hardware Error]: Machine check events logged", значит есть реальные проблемы с аппаратной частью машины

h1. Сетевые карты