Проблемы с оборудованием

Skip to end of metadata
Go to start of metadata
Вы просматриваете старую версию данной страницы. Смотрите текущую версию. Сравнить с текущим  |   просмотр истории страницы

Перед обращением в техподдержку

Включение SSH в установщике

Для отладки можно использовать подключение по ssh прямо в установщик, включить можно по инструкции:

http://docs.carbonsoft.ru/pages/viewpage.action?pageId=49775231

Информация необходимая при создании заявки в хелпдеске

TODO: пополнить список необходимой информации

Протестируйте, проявляется ли проблема на стандартном CentOS 6.6.

Загрузить установочный образ можно здесь:

http://mirror.yandex.ru/centos/6.6/isos/x86_64/  (CentOS-6.6-x86_64-minimal.iso).

Сетевые карты

Если у вас не обнаруживаются сетевые карты, выполните 

ip addr 

и проверьте что карты действительно не определились, и проблема не в локальном меню и его отображении.

Затем выполните

lspci -nn

сфотографируйте / скопируйте вывод и прикрепите его в заявку в helpdesk.

Если из-за проблем с сетевыми картами не удаётся подключиться к серверу - подключите к нему любую дешёвую сетевую карту с которой сервер будет работать, чтобы можно было подключиться к серверу по SSH и отладить проблему с другими сетёвками.

Жёсткие диски

CentOS не видит новый подключенный диск

  1. Убедитесь, что в BIOS/UEFI диск виден и настроен корректно (не отключен порт, настроено автоопределение и BIOS корректно распознал устройство)
  2. Hotplug дисков может не работать, поэтмоу попробуйте перезагрузить сервер
  3. Если диск подключался к выключенному серверу, но ОС не увидела его после загрузки, попробуйте еще раз перезагрузить сервер
  4. Если диск не виден после второй перезагрузки, проверьте dmesg (лог /var/log/messages), возможно там есть упоминание ошибок определения дисков
  5. Если ошибки отсутствуют, но диск все равно не виден ОС, загрузите сервер с LiveCD Linux (например Ubuntu), проверьте определится ли диск
  6. Если у Вас используется аппаратный RAID, это так же может быть причиной - вероятней всего ОС не имеет доступа к SATA-контроллеру при использовании RAID и массив нужно сначала настроить в меню контроллера
    Если диск корректно определяется BIOS и виден в другой ОС, создайте заявку на портале HelpDesk, техподдержка поможет Вам определить источник проблемы.

Не находится рейд-контроллер (smart array) или установка зависает при выборе диска

В некоторых случаях (обычно на g5 и g8), драйвер hpvsa не может увидеть рейд-контроллер и при установке видно два жёстких дисках.

I found this on the HP web site

DL360e Gen8 Server with B320i/512MB Controller driver is causing the issue. The RAID functionality for the B120i and B320i controllers in the "e" series ProLiant servers is provided by a software driver. Unlike the cciss/hpsa driver for the "p" series Smart Array controllers, the driver for these software RIAD controllers is closed source and offered in binary form only. Currently the drivers are available for RHEL and SLES. User should be able to use the RHEL driver with CentOS but it is not a supported option.Answer/Solution
FIX:To fix the issue download and install Smart Array SATA RAID Controller Driver for RHEL 6

1. Click here to download RHEL 6.3 Software Driver Update and extract it.

2. Copy hpvsa-1.2.4-4.rhel6u1.x86_64.dd to a USB Key formatted as FAT32.

3. Once the floppy driver diskette is ready on the USB Key and the Array is being created, it is time to begin the CentOS 6.3 installation by booting from the DVD.

4. On the main installation menu for CentOS, mount the USB Key with the driver on it. At the installation menu, select the installation method (just highlight it) and hit “ESC” key to receive the "boot:" prompt

5. At that "boot" prompt enter the following command: linux dd blacklist=ahci

6. Hit ENTER. Select Yes for driver diskette, Select the USB drive.

7. Select the driver disk image and select OK.

8. Continue with the OS installation, then just click select the logical volume where to install the CentOS 6.3.

I was able to configure the B120i and load the logical drive and it all worked.

Также, в некоторых случаях, помогают:

mv /lib/modules/2.6.32-carbon-johnik_xge/kernel/drivers/ata/ahci.ko /lib/modules/2.6.32-carbon-johnik_xge/kernel/drivers/ata/ahci.ko_blacklist
dracut --force  /boot/initramfs-carbon-johnik_xge.img  2.6.32-carbon-johnik_xge

Если при установке ваш жёсткий диск не обнаруживается, перезагрузитесь и при появлении приветствия

Нажмите одновременно: ALT+F1, откроется терминал в котором вы можете выполнять команды вручную.

Выполните:

ls -laR /dev/disk/by_id
ls /dev/

сфотографируйте / скопируйте вывод и прикрепите его в заявку в helpdesk.

Xen: clocksource_failover

добавить в grub: clocksource_failover clocksource=hpet

Высокая нагрузка на процессор.

Необходимо проверить скорость дисков. Скорость чтения с диска должна быть не меньше 150 MB/sec. Скорость записи не менее 80 MB/sec.
Проверить скорость дисков можно с помощью утилит hdparm и dd.

Пример проверки скорости

Чтение

hdparm -t /dev/sda3

Вывод:

/dev/sda3:
 Timing buffered disk reads:  64 MB in  0.21 seconds =299.07 MB/sec

Наиболее точный результат можно получить сделав проверку несколько раз подряд, в этом Вам поможет небольшой скрипт:

for i in 1 2 3 4 5 6; do hdparm -t /dev/sda; sleep 1; done

Запись

Разные области диска могут иметь различный износ. Для проверки скорости записи в тот или иной раздел выполните следующую команду:

sync; dd if=/dev/zero of=/mnt/var/write.test conv=fdatasync bs=1M count=1k && sync; rm -f /mnt/var/write.test
sync; dd if=/dev/zero of=/mnt/db/write.test conv=fdatasync bs=1M count=1k && sync; rm -f /mnt/db/write.test

На время выполнения теста, потребуется 1Гб свободного места.
Вывод:

1024+0 записей считано
1024+0 записей написано
 скопировано 1073741824 байта (1,1 GB), 12,3008 c, 87,3 MB/c

Перезагрузка сервера.

  1. Softdog_agent
    Необходимо проверить лог /var/log/softdog_agent.log на предмет правильного чередования строк со словами Stopping и Starting
    Если порядок нарушен - значит перезагрузка была внезапной

Пример штатной перезагрузки:

[2020-03-13T14:25:27.232Z] (sys) Stopping
Trap exit!
[2020-03-13T14:53:51.297Z] (sys) Starting
  1. Пункты меню "Выключить сервер" и "Перезагрузить сервер" в base-интерфейсе.
    Для проверки ищем слова shutdown reboot в логе /app/base/var/log/base_web_server.log
    grep shutdown base_web_server.log | grep -v '^\+'
    [pid: 3102|app: 0|req: 27592/120314] 85.140.78.107 () {40 vars in 997 bytes} [Fri Mar 13 14:24:43 2020] GET /shutdown/ => generated 4196 bytes in 43975 msecs (HTTP/1.1 200) 2 headers in 73 bytes (1 switches on core 0)
    
  1. Возможно имеет место быть kernel panic. Необходимо проверить лог в /var/crash/'дата перезагрузки системы'/vmcore-dmesg.txt
Введите метки, чтобы добавить к этой странице:
Please wait 
Ищите метку? просто начните печатать.