Автор Тема: [РЕШЕНО] Зависание сервера. ESXi 5.5 и RAID контроллер Adaptec 6805Q.  (Прочитано 30895 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
Всем привет.

РЕШЕНИЕ - http://ask-ru.adaptec.com/app/answers/detail/a_id/17403/


Проблема следующего характера, раз в 10-12 дней все виртуалки на сервере перестают быть доступными.
Сам гипервизор при этом какое-то время доступен, можно подключиться по ssh, но после введения пары команд консоль перестает отвечать.
Когда подключаешься через IPMI, то есть возможность ввести логин и пароль, успешно авторизоваться, но далее, как с в случае с ssh, тупняк - не раегирует ни на что.
Помогает, соответственно, только reset.

Настроил remote syslog сервер, там вижу следующее:
Jul 22 19:20:01 virtsrv1.domain.local hostd-probe: [FFBA97E0 quiet 'Default'] Successfully acquired hardware: X9DR3-F
Jul 22 19:20:01 virtsrv1.domain.local Hostd: [FFEB4B70 verbose 'SoapAdapter'] Responded to service state request
Jul 22 19:20:01 virtsrv1.domain.local hostd-probe: [FFC0CB70 info 'ThreadPool'] Thread delisted
Jul 22 19:20:01 virtsrv1.domain.local hostd-probe: [FFC8EB70 info 'ThreadPool'] Thread delisted
Jul 22 19:20:01 virtsrv1.domain.local hostd-probe: [FFC4DB70 info 'ThreadPool'] Thread delisted
Jul 22 19:20:01 virtsrv1.domain.local hostd-probe: [FFCCFB70 info 'ThreadPool'] Thread delisted
Jul 22 19:20:01 virtsrv1.domain.local hostd-probe: [FFBA97E0 info 'ThreadPool'] Thread delisted
Jul 22 19:20:01 virtsrv1.domain.local syslog[742749]: hostd probing is done.
Jul 22 19:20:01 virtsrv1.domain.local vmkernel: cpu0:34736)World: 14296: VC opID hostd-56fd maps to vmkernel opID ce32609f
Jul 22 19:20:20 virtsrv1.domain.local vmkernel: cpu6:34195)World: 14296: VC opID hostd-2dce maps to vmkernel opID 44f95eb7
Jul 22 19:20:33 virtsrv1.domain.local vmkernel: cpu0:33079)<3>aacraid: Host adapter abort request (7,0,0,0)
Jul 22 19:20:33 virtsrv1.domain.local vmkwarning: cpu0:33079)WARNING: LinScsi: SCSILinuxAbortCommands:1837: Failed, Driver aacraid, for vmhba2
Jul 22 19:20:33 virtsrv1.domain.local vmkernel: cpu0:33079)WARNING: LinScsi: SCSILinuxAbortCommands:1837: Failed, Driver aacraid, for vmhba2
Jul 22 19:20:33 virtsrv1.domain.local vmkernel: cpu0:33079)<3>aacraid: Host adapter abort request (7,0,1,0)
Jul 22 19:20:33 virtsrv1.domain.local vmkwarning: cpu0:33079)WARNING: LinScsi: SCSILinuxAbortCommands:1837: Failed, Driver aacraid, for vmhba2
Далее последние 5 строк постоянно повторяются еще в течение 15 минут.

Железо.
MB: Supermicro X9DRi-F
CPU: 2xIntel Xeon E5-2640v2
RAM 4x16GB 1600MHz DDR3 PC-12800 ECC Reg
RAID: Adaptec RAID 6805Q
HDD: 4xHitachi HUS724020ALA640 2Tb
SSD: 2xIntel SSD DC S3500 Series 160GB

ОС.
ESXi 5.5 Update 1  Build 1623387

Собраны:
RAID-1 из SSD, на нем система и storage под БД.
RAID-10 из HDD, storage под виртуалки и прочее.

В гугле советовали отключать Intel VT-d, пробовал, не помогло.
Переставлять контроллер в другой слот пока не пытался.

PS
В саппорт поставщику сервера писал, говорят открывайте кейс у vmware, доселе не доводилось, отпишите кто знает как там чего.


Внимание, решение:
Вот такой солюшн предложили вчера Adaptec.
Цитировать
Пока ещё не имеется новый драйвер для Вашего контроллера под ESXi 5.5, но зато могу Вам предоставить решение проблемы довольно простым способом (см. ниже).

Сначало обновите драйвер контроллера на версию 40700, если этот драйвер ещё не установлен: http://www.adaptec.com/en-us/speed/raid/aac/linux/aacraid_vmware_drivers_1_2_1-40700_cert_tgz.php.

После обновления драйвера перезагрузите сервер.

Потом в консоле хоста введите следующую команду: esxcli system module parameters set -m aacraid --parameter-string 'msi=1'

Перезагрузите сервер. Войдите в консоль и проверьте, включен ли MSI с командами :

1. lspci | grep Adap
2. dmesg | grep MSI

Дайте системе поработать и сообщите нам результаты через пару дней.
« Последнее редактирование: 19 июня 2015, 20:07:53 от FessAectan »
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн VanDyke

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1800
  • Рейтинг: 73
  • Пол: Мужской
  • Network Warrior
    • Просмотр профиля
  • Откуда: Destination network unreachable
FessAectan, такая же фигня была на 5.1 и 5405 на днях.... Правда, ттт, единичный случай.
Дрова родные? C сайта адаптека? Контроллер перепрошивал?
Not as ultimate as 42, but pretty close...

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
VanDyke, дрова родные, с сайта адаптека.
Прошивка контроллера соответствует тыц, но есть более свежая.
Прошивать самую свежую стремаюсь что-то.


Updated: 23 July 2014, 12:37:17

arcconf getversion
Controllers found: 1
Controller #1
==============
Firmware           : 5.2-0 (19144)
Staged Firmware    : 5.2-0 (19144)
BIOS               : 5.2-0 (19144)
Driver             : 1.2-1 (40301)
Boot Flash         : 5.2-0 (19144)
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн VanDyke

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1800
  • Рейтинг: 73
  • Пол: Мужской
  • Network Warrior
    • Просмотр профиля
  • Откуда: Destination network unreachable
FessAectan, ну я бы попробовал драйвер на родной заменить, но тут надо осторожно. можно провтыкать датасторы :)
Not as ultimate as 42, but pretty close...

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
VanDyke, родной, имеешь в виду с сайта vmware ?
Скачал сейчас и с вмвари и с адаптека, одно и тоже.

Я ставил тот, что с адаптека качал.
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн VanDyke

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1800
  • Рейтинг: 73
  • Пол: Мужской
  • Network Warrior
    • Просмотр профиля
  • Откуда: Destination network unreachable
FessAectan, эм... если я не ошибаюсь - родной не умеет CIM по крайней мере в 4 и 5.0/5.1
Поэтому всегда нада качать с сайта адаптека и заменять, иначе arcconf не подключить.
Возможно конечно в 5.5 чет изменили...
ЗЫ родной - который идет в ESXi вшитый
Not as ultimate as 42, but pretty close...

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
VanDyke, когда ставил систему, то контроллер не увиделся установщиком, только после того как скачал с адаптека драйвер и вшил в его iso сумел поставить ESXi.
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн VanDyke

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1800
  • Рейтинг: 73
  • Пол: Мужской
  • Network Warrior
    • Просмотр профиля
  • Откуда: Destination network unreachable
FessAectan, нагуглил https://yadi.sk/d/jwI_NVsZX2GRW
отсюда http://суперхрюн.рф/index.php/10-vmware-esxi/20-vmware-esxi-5-1-x-ispolzuem-raid-kontroller-adaptec-arc-6805e-kit-p-n-2271800-r-single-p-n-2270900-r
ЗЫ я нивинават за любую потерю данных, взрывы в серверной и прочая катастрофы в связи с установкой этого неведомого драйвера :D
Not as ultimate as 42, but pretty close...

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
VanDyke, спс, изучу ссылки... )
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн VanDyke

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1800
  • Рейтинг: 73
  • Пол: Мужской
  • Network Warrior
    • Просмотр профиля
  • Откуда: Destination network unreachable
Там кстати написано что у некоторых вообще контроллер отвалился. так что аккуратно..
Not as ultimate as 42, but pretty close...

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
неее, чот не хочу я его втыкать )


Updated: 23 July 2014, 12:58:20

в вмварю написать попробую, может ответят.


Updated: 23 July 2014, 12:58:46

Адаптек, кстати, не ответили, писал им неделю назад где-то.
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн VanDyke

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1800
  • Рейтинг: 73
  • Пол: Мужской
  • Network Warrior
    • Просмотр профиля
  • Откуда: Destination network unreachable
в вмварю написать попробую, может ответят.
скорее в адаптек нада :)
Not as ultimate as 42, but pretty close...

Оффлайн Flyer_SPb

  • Модераторы
  • Ветеран
  • *****
  • Сообщений: 1019
  • Рейтинг: 26
  • Пол: Мужской
  • Ветеран войны с Kilrathi
    • Просмотр профиля
  • Откуда: 2:5030
На всяк случ, заглянуть бы ещё в логи адаптека и СМАРТ дисков.
They stole my gun, my beautiful Steltek gun!

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
Flyer_SPb, выслал все это добро саппорту адаптека, прислали ссылку на драйвер посвежее, пока не опробывал(прекратились вдруг, ттт, зависания)
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
Зависание сервера. ESXi 5.5 и RAID контроллер Adaptec 6805Q.
« Ответ #14 : 06 сентября 2014, 17:20:54 »
нет, не прекратились, но таки проапдейтил драйвер, будем посмотреть
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.