Ping-Admin.Ru

Автор Тема: падает служба msexchangetransport  (Прочитано 867 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« : 05 Августа 2018, 22:24:14 »
Доброго здравия.
Виртуалка на hper-v. 4 ядра, 8 Гб памяти. Места свободного на жестком диске 100+Гб.
Windows server 2012 64bit (не R2) + Exchange 2007 sp3 с последним патчем за март 2017г + kaspersky antispam for exchange 2007 8.0 с последним фиксом.
В среднем 50 писем в день и около 70-100 спама.

На протяжении последней недели стал замечать что не проходит мониторинг по 25 порту, мол сервис недоступен.
Начал копать по мере сил и умственных возможностей (в почте особо не разбираюсь, могу только по сути новые ящики заводить, да там по малости перенаправление и т.п.).
В общем служба msexchangetransport периодически раз в 4-5 часов виснет ну и соответственно smtp не работает, т.е. письма не принимаются и не отправляются. pop и imap работают, т.е. заходить в ящик и смотреть уже имеющуюся почту можно. В момент старта службы процесс занимает 60-80 Мб памяти, в момент зависания 180-190Мб.
На момент зависания службы в событиях ОС ни в приложениях ни в системе никаких сообщений об ошибках, предупреждений, критических ошибка ничего нет.
Если пытаюсь остановить/перезапустить службу вручную - появляется ошибка в приложениях 14001.

Значит в пятницу посмотрел логи на файрволе и в логах транспорта - ничего особо подозрительного для себя не нашел, за исключением 4 IP с которых постоянно пытались подключиться с серверу и было сообщение в логах транспорта что мол неизвестный метод авторизации. На файрволе добавил в блокировку эти IP адреса.

Т.к. службу перезапустить не получается, когда она уже висит, то приходится перезагружать сервер. При попытке кильнуть процесс - пишет отказано в доступе т.к. работает от network service.

Завтра буду более подробно гуглить и копать логи.
На время разбора полетов, думаю в планировщик закинуть скрипт на рестарт службы каждые 1-2 часа.  :-[

Может кто нить пнуть в каком хотя бы примерно направлении стоит копать? просто я даже хз, хотя бы какое то сообщение об ошибке в системе писалось бы, а то ничего, пусто, ну или просто не знаю где ещё в таких ситуациях нужно смотреть.

 ???


Оффлайн Triangle

  • Модераторы
  • Олдфаг
  • *****
  • Сообщений: 5903
  • Рейтинг: 38
  • Пол: Мужской
    • s.popov-skype
    • Просмотр профиля
  • Откуда: замкадыш
падает служба msexchangetransport
« Ответ #1 : 07 Августа 2018, 06:35:26 »
Цитата
Stop the Transport service on the server.
Please try to Rename the complete DATA folder on HUB server.
It may be possible that the Queue & IPFilter folder under Data folder was corrupt.
After renaming the Data folder on the HUB server. Then restart the Transport service.
Тетрис научил нас жизненно важному пониманию, успехи исчезают, ошибки накапливаются.

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« Ответ #2 : 07 Августа 2018, 09:12:28 »
Цитата
Stop the Transport service on the server.
Please try to Rename the complete DATA folder on HUB server.
It may be possible that the Queue & IPFilter folder under Data folder was corrupt.
After renaming the Data folder on the HUB server. Then restart the Transport service.
остановил. переименовал. перезапустил.
теперь буду ждать часиков 5-6, обычно через это время зависала служба.

Оффлайн Triangle

  • Модераторы
  • Олдфаг
  • *****
  • Сообщений: 5903
  • Рейтинг: 38
  • Пол: Мужской
    • s.popov-skype
    • Просмотр профиля
  • Откуда: замкадыш
падает служба msexchangetransport
« Ответ #3 : 07 Августа 2018, 11:52:52 »
А кстати мил человек, а у тебя там с дисковой подсистемой вообще всё точно в порядке?
Тетрис научил нас жизненно важному пониманию, успехи исчезают, ошибки накапливаются.

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« Ответ #4 : 07 Августа 2018, 13:29:02 »
А кстати мил человек, а у тебя там с дисковой подсистемой вообще всё точно в порядке?
ну как сказать, на железе 2 виртуалки. одна почта, другая для бэкапов (туда руками раз в месяц что нить только копирую, так что в простое 99% времени).
на самой физике никаких ошибок на счет диска нету, ночью ставил на проверку чекдиском - все в порядке говорит.
на почте тоже делал проверку дисков - все в порядке, так же в логах нет сообщений от disk.
ну на основе этого делаю вывод что с диском все нормально.
более того, монитюрю забиксом очереди дисков что на физике что на виртуалке, никаких проблем нет, если не считать моментов ночью, когда на почте идет обслуживание БД.
как то так.

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« Ответ #5 : 07 Августа 2018, 15:17:46 »
служба все равно упала, проработав около 6 часов.
имею на руках лог от processmonitor, буду сейчас смотреть, может чего найду хотя бы там.  :-[

Оффлайн Triangle

  • Модераторы
  • Олдфаг
  • *****
  • Сообщений: 5903
  • Рейтинг: 38
  • Пол: Мужской
    • s.popov-skype
    • Просмотр профиля
  • Откуда: замкадыш
падает служба msexchangetransport
« Ответ #6 : 07 Августа 2018, 16:03:46 »
а не может ли быть причиной Касперский к примеру, я бы попробовал проверить.
Тетрис научил нас жизненно важному пониманию, успехи исчезают, ошибки накапливаются.

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« Ответ #7 : 07 Августа 2018, 16:58:50 »
а не может ли быть причиной Касперский к примеру, я бы попробовал проверить.
отключил проверку на вирусы и антиспам для роли транспорта.
паралельно увеличил своп файл, было 2,5Гб сделал х2 по оперативки т.е. 16Гб.
через 5-6 часов будем посмотреть  ???

ну и паралельно смотрю логи, в момент когда сервис стал недоступен, он создал около 20 потоков и из всех этих потоков обращался к КД. в конфиге транспорта (edgetransport.exe.config) максимальное число подключений указано 10, может из - за этого? думаю это проверю уже завтра, повторно оставлю запущенным процессмонитор на ночь. думаю ситуация с кучей подключений повторится в момент "зависания".
процесс как бы не зависает, в тот момент когда он перестает отвечать на 25 порту, сам процесс всякие действия с файлами и ключами реестра продолжает активно работать. в общем буду разбираться потихоньку.

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« Ответ #8 : 07 Августа 2018, 17:34:53 »
еперный театр. почему только сейчас в голове появилась мысль, проверить подключение к 25 порту локально, в тот момент когда он не отвечает в сеть  :idea:

Оффлайн DedMagarbI4

  • Ветеран
  • *****
  • Сообщений: 1757
  • Рейтинг: 11
  • Пол: Мужской
    • Просмотр профиля
  • Откуда: г.Невинномысск
падает служба msexchangetransport
« Ответ #9 : 08 Августа 2018, 11:19:21 »
В общем ситуация примерно следующая.
в какой то момент времени edgetransport.exe создает от 30 до 40 новых потоков, в этот же момент начинается ldap опрос одного из КД (у меня их 3 и в каждом случае краха он опрашивал разные). спустя 10 секунд он начинает закрывать все эти потоки.
в это время он перестает слушать именно по ipv4 25 порт, в то время как ipv6 25 порт слушается.

вот подробно по ситуации вчера ночью
22:52:45 - подключение edgetransport.exe по ldap к КД
22:52:51 - появляются информационные 3 события в журналах винды "приложение" - 16022 "Обновление конфигурации успешно завершено."
22:52:51 - инфо.событие 1002 "Соединители настроены."
22:52:51 - инфо.событие 16002 "Прочитана новая конфигурация транспортного сервера. Компоненты уведомлены."
22:52:52 - происходит дисконнект от КД
22:52:52 - создание 38 новых потоков
22:52:52 - 22:53:57 - подключение к КД и активная передача данных
22:53:57 - 22:55:50 - закрываются потоки, которые были созданы
22:53:23 - на этот момент ipv4 25 порт уже недоступен (система мониторинга проверяет доступность порта каждую минуту)

ну вот как то так, сейчас буду смотреть какие файлы / ключи реестра дергаются при этом.

по приблизительно такая картина была в последних 2ух случаях.  :-[
самое печальное, что служба не останавливается вообще, т.е. помогает только перезагрузка.

P.S. постепенно подготавливаюсь к установе exchange 2013 и миграции на него с 2007.  :)