Первое, что начинает тормозить в виртуальной (или в любой?) инфраструктуре – это дисковая подсистема.
В первую очередь по той причине, что сделать быструю дисковую дорого.
Один из важных параметров, указывающих что тормозят таки диск это Latency.
Посмотреть эту величину можно, в частности, в esxtop – там мы можем увидеть примерно такую картинку:
Выделены несколько столбцов:
- DAVG\cmd – это device latency, задержки между hba и системой хранения, т.е. за пределами хоста.
- KAVG\cmd – это kernel latency, задержка между hba и гостем, т.е. “внутри гипервизора”.
- GAVG\cmd – это guest latency, задержка между гостем и системой хранения, этот столбец является суммой первых двух.
А недавно со мной поделились ситуацией, когда ситуация была совсем другая.
Вкратце
1) были тормоза
2) на стороне системы хранения статистика была ок
3) на стороне esx обнаружили что именно kernel latency была неприлично большой (вот тут я удивился – почему?)
4) проблема была решена путем увеличения глубины очереди hba контроллеров с 32 до 64 (вот тут я удивился второй раз – известная мне теория не объясняет почему это так).
Имейте в виду. Как делали: VMware : Increasing the HBA / Device Queue Depth.
thx 2 Сергей Щадных
Привет.
ОтветитьУдалитьБыла аналогичная проблема с производительностью, те же симптомы.
Решением была маскировка LUN с ID 0 - того, что EVA презентует как array controller.
ага, буквально на прошлой неделе обсуждали такой момент. afaik у них не EVA.
ОтветитьУдалитьKAVG\cmd – это lernel latency
ОтветитьУдалить*k
спасибо, поправил
ОтветитьУдалитьДа, иногда увеличение очереди на адаптере помогает.
ОтветитьУдалитьА вот, что делать когда периодически возникает высокая задержка счётчика QAVG?:)))
>высокая задержка счётчика QAVG
ОтветитьУдалитьскорее всего вопросы к контроллеру стораджа
где еще может быть затык в latency - если со стороны evaperf - всё хорошо (eva6100), а со стороны хоста esxi - DAVG большой периодически, доходит иногда аж до сотен ms.
ОтветитьУдалитьпри этом KAVG в норме остается, тоесть не в очереди hba дело, к слову veeam мониторинг тоже кажет большие latency - от него и заинтересовался проблемой.
ув. Corochunро, а про маскировку нулевого луна можете подробнее описать - логику за счет чего влияние на latency идет - не совсем понял.