Автор Тема: [РЕШЕНО] Зависание сервера. ESXi 5.5 и RAID контроллер Adaptec 6805Q.  (Прочитано 30893 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
вот что ответили:
"В данный момент, увы, новый драйвер предоставить не можем. Но, в данный момент ясно, что проблематика связанна с материнскими платами Supermicro и процессорами Intel V2. Если взять процессор V1, то проблема исчезает."

« Последнее редактирование: 04 января 2015, 12:24:44 от FessAectan »
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн Селениус

  • Постоялец
  • ***
  • Сообщений: 109
  • Рейтинг: 3
    • Просмотр профиля
  • Откуда: Мензоберранзан
Зависание сервера. ESXi 5.5 и RAID контроллер Adaptec 6805Q.
« Ответ #16 : 17 сентября 2014, 03:40:07 »
Неплохой ответ. И сразу понятно, что никто не виноват, просто так сложилось. :pardon:

Оффлайн GenSys

  • Новичок
  • *
  • Сообщений: 4
  • Рейтинг: 0
    • Просмотр профиля
  • Откуда: Москва
у меня ситуация один в один...
И что решения нет? Так и виснет несчастный?

Оффлайн GenSys

  • Новичок
  • *
  • Сообщений: 4
  • Рейтинг: 0
    • Просмотр профиля
  • Откуда: Москва
нашел в общем тему...
говорят помогает...

Сообственно выключение ремапа
Посмотреть что счаз
esxcli system settings kernel list -o iovDisableIR
И выключить
esxcli system settings kernel set --setting=iovDisableIR -v TRUE
ну и ребут хоста.
Только обычно применялось тогда когда IRQ шарился между сетевыми и стораджем

Правда так и не разобрался на что оно влияет...
буду посмотреть

Оффлайн scrame

  • Начинающий
  • *
  • Сообщений: 25
  • Рейтинг: 0
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: Saint-Petersburg
Проблема один в один. Помогло что-нибудь?
может действительно обновить прошивку у контроллера?
Коллеги еще советовали попробовать заменить сетевухи, ибо я выловил в какой момент времени стабильно зависает сервер - когда с терминального сервера пытаешься записать файл на, замапленный с клиента диск, тут же валится варька, и все симптомы, как у вас...

Оффлайн GenSys

  • Новичок
  • *
  • Сообщений: 4
  • Рейтинг: 0
    • Просмотр профиля
  • Откуда: Москва
Вот завтра будет свободный денег буду тестировать описанное мной выше...

Пока ничего не помогает, кроме замены контроллера.
Прошивку биоса и контроллера я уже сделал, драйвера поставил тестовые. Все равно виснет. Обновления стоят все, и на esx и на гостевых системах. Проблема чаще наблюдается при работе с windows машинами, по крайней мере у меня.
Гарантированно виснет если запустить тест скорости жесткого диска на массиве. Тестировал LSI все работает без проблем, но LSI чужой, а по гарантии адаптек забирать не хотят (

попробую скоро выключить Intel vt-d
 

Оффлайн scrame

  • Начинающий
  • *
  • Сообщений: 25
  • Рейтинг: 0
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: Saint-Petersburg
попробую скоро выключить Intel vt-d

оК, буду ждать...
Чем проводил тест скорости на массиве? хочу протестить будет ли у меня такая же проблема возникать при тех же условиях.

Оффлайн GenSys

  • Новичок
  • *
  • Сообщений: 4
  • Рейтинг: 0
    • Просмотр профиля
  • Откуда: Москва
crystal disk info
 5 проходов по 1 и 5 Гб...

Оффлайн scrame

  • Начинающий
  • *
  • Сообщений: 25
  • Рейтинг: 0
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: Saint-Petersburg
crystal disk info
 5 проходов по 1 и 5 Гб...
я так полагаю на одной из виртуалок развлекался? =)

Оффлайн scrame

  • Начинающий
  • *
  • Сообщений: 25
  • Рейтинг: 0
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: Saint-Petersburg
crystal disk info
 5 проходов по 1 и 5 Гб...
как успехи??? мне тут сервер приехал, как раз 2630 v2, Adaptec 6405... поставил последние дрова, с нуля накатил варьку 5.5u2... ща буду тестить...

Оффлайн scrame

  • Начинающий
  • *
  • Сообщений: 25
  • Рейтинг: 0
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: Saint-Petersburg
crystal disk info
 5 проходов по 1 и 5 Гб...
Crystal disk info или Crystal Disk Mark??? какой версии?
что то у меня не получается варьку снова уложить на лопатки =((( тесты проходят мимо, через терминалку не падают, через Disk Mark тоже, а Disk Info вообще не видит варькин диск...



Updated: 01 December 2014, 13:58:43

нет, не прекратились, но таки проапдейтил драйвер, будем посмотреть
давно в теме небыло, победил?

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
Сорь, забыл я про эту тему.
Новости следующие:
1. Ответ от Адаптека такой:
Цитировать
Adaptec признает эту проблему (28.10.2014):

1.      Новая информация по текущей проблеме с VMware 5.5

Эта проблема существует только для контроллеров Series 2, 5, 6 и 6E! Природа проблемы заключается в том, что старые контроллеры не поддерживают новую схему прерываний, используемую в операционной системе VMware 5.5 и в процессорах Intel V2.

Исправление уже существует и представляет собой обновление как BIOS системной платы, так и CPU microcode. В настоящее время мы испытываем данные апгрейды и готовим наши рекомендации подобных апргрейдов для всех плат Supermicro.
2. Я решил заменить проблемный контроллер на LSI MegaRAID SAS 9271-8i + LSICVM01
Тринити(у них сервер брали) признали случай гарантийным.


Updated: 01 December 2014, 17:31:59

попробую скоро выключить Intel vt-d
не помогает это
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
Вот такой солюшн предложили вчера Adaptec.
Цитировать
Пока ещё не имеется новый драйвер для Вашего контроллера под ESXi 5.5, но зато могу Вам предоставить решение проблемы довольно простым способом (см. ниже).

Сначало обновите драйвер контроллера на версию 40700, если этот драйвер ещё не установлен: http://www.adaptec.com/en-us/speed/raid/aac/linux/aacraid_vmware_drivers_1_2_1-40700_cert_tgz.php.

После обновления драйвера перезагрузите сервер.

Потом в консоле хоста введите следующую команду: esxcli system module parameters set -m aacraid --parameter-string 'msi=1'

Перезагрузите сервер. Войдите в консоль и проверьте, включен ли MSI с командами :

1. lspci | grep Adap
2. dmesg | grep MSI

Дайте системе поработать и сообщите нам результаты через пару дней.
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.

Оффлайн scrame

  • Начинающий
  • *
  • Сообщений: 25
  • Рейтинг: 0
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: Saint-Petersburg
собственно драйвер и так 40700 стоял, так что апдейтить не нужно было (хотя я бы в отдельную темы вынес способы апдейта драйвера на ESXi, ибо как я уже говорил, у меня гипервизор стоит на том же RAID, по этому обновиться можно либо установкой на флешку и подключать потом стор, либо на отдельный диск. ну либо перенося машинки на друой хост и инсталить заново с нужным драйвером...

В общем рекомендацию применил, однако вот что:
~ # lspci | grep Adap
0000:05:00.0 Mass storage controller: Adaptec AACRAID [vmhba1]
~ # dmesg | grep MSI
2014-12-15T07:13:43.198Z cpu18:33443)WARNING: SCU OSSL Setting up MSI-X (requesting 2 vectors)
2014-12-15T07:13:44.030Z cpu20:33461)MSIX enabled for dev 0000:02:00.0
2014-12-15T07:13:44.411Z cpu20:33461)<6>igb 0000:02:00.0: Using MSI-X interrupts. 1 rx queue(s), 1 tx queue(s)
2014-12-15T07:13:44.412Z cpu20:33461)MSIX enabled for dev 0000:02:00.1
2014-12-15T07:13:44.580Z cpu20:33461)<6>igb 0000:02:00.1: Using MSI-X interrupts. 1 rx queue(s), 1 tx queue(s)
2014-12-15T07:13:50.842Z cpu16:33569)Enabling MSI for dev 0000:05:00.0
Смущает меня надпись Enabling MSI for dev 0000:05:00.0

Оффлайн FessAectan

  • Модераторы
  • Старожил
  • *****
  • Сообщений: 972
  • Рейтинг: 25
  • Пол: Мужской
  • На пути к просветлению
    • fessae@jabber.ru
    • fessae
    • Просмотр профиля
    • https://vistep.ru/
  • Откуда: vistep.ru
Ну так написано, что включили режим прерываний MSI для контроллера твоего.
Мы переоцениваем себя завтрашнего, поэтому и страдаем прокрастинацией.