5 мин.

Иной взгляд на продвинутую статистику. Часть 2

При подготовке материалов к написанию первой части для расчета показателей Фенвика, Корси, ПДО по КХЛ было затрачено много усилий на ручную обработку протоколов матчей. Но это не прошло впустую. Это дало наглядное прослеживание колебаний показателей в зависимости от результатов. Помимо этого, появилась возможность расчитать побочные цифры. Такие как: общее количество бросков и броски мимо створа для обоих сторон поединка. В связке с бросками в створ и заблокированными это можеть дать дополнительную пищу для размышлений. 

Но вернемся к первой части, где мы просчитали синтетический показатель FF+PDO "All Situations" и убедились в его достоинствах относительно  других метрик. 

Чтобы удостовериться в правильности методики посмотрим как изменилось положение дел в КХЛ и насколько она предсказательна, благо есть повод в виде завершившегося регулярного чемпионата и плей-офф Кубка Гагарина не набрал еще обороты. 

В лучшую сторону изменился  показатель корреляции (с 0,9 до 0,914). Из топ-16 команд по показателю FF+PDO "All Situations" лишь  ХК "Сочи" и "Амур" не удостоились  честь  попасть в свои кубковые восьмерки. Вместо них оказались "Барыс" и долгожданный "Витязь" с 12,55 и 25,23 очками перебора (3-е и 1-ое место в этой номинации). Любопытно, что у "Магнитки" 13,31 очка перебора. Рядом расположился "Трактор" с "лишними" 10,75. На другом полюсе обиженных фортуной расположились "Динамо" Рига, Амур и Спартак . Соответственно: 18,29; 14,77 и 13,97 очков недобора. Среди  участников кубковых баталий необходимо ответить "Салават Юлает" с "недосдачей" -7,61 очка. Как и говорилось, в первой части перебор/недобор очков на длительной дистанции должен потихоньку устраняться на длинной дистанции взаимного сближения показателя качества и набранных очков в соответствии с линейной моделью. Одностороннее движение, возможно, но крайне затруднительно, поскольку много факторов со стороны результатов других команд оказывают влияние. В результате чего в модель приходится каждый раз вносить коррективы.  

По НХЛ ситуация вышла следующая (данные на 25 февраля):

Коэффициент корреляции FF+PDO "All Situations"  снизился с 0,84 до 0,79, FF "All Situations" c 0,46 до 0,29 (!!!), PDO “All Situations” осталось прежним - 0,87.  Но как показывает практика по предыдущим сезонам, суммарный показатель должен быть точнее взятых по отдельности. Вся "надежда" на рост Фенвика, ввиду того, что лидеры по этому критерию "Кингс","Брюинс" и "Флаерз "лишь на грани попадания в ПО, а "Эвеланш" не дотягивает даже до своих скромных показателей.

Показатель FF+PDO "All Situations" хорошо оцениваеи эффективность комманд в срезе "инициатива-реализация". Чтобы как-то описать качество потенциальных угроз вблизи ворот можно дополнительно отсортировать броски на те которые дошли в створ, прошли мимо створа и были заблокированы. Посчитать их долю от общего числа. Так можно и оценить на чем сосредотачивается защита.  Это занятно еще тем, что про количество бросков соперника мимо створа почти не говорят. А это во многом созданная помеха атакующим игрокам, а не просто акт "прощения". 

Важным моментом игры являются заблокированные броски. Ловля шайбы на себя не только позволяет напрямую отвести шайбу от своих ворот, поберечь лишний раз вратаря, но и организовать переход из обороны в атаку: как мгновенный, так и неторопливый с длительным контролем шайбы. Но подобная самоотверженность чревата травмами, а также лишними  рикошетами и дезориентацией вратаря

Важно понимать, что блокировать приходится то, что предложит атакующий соперник. Поэтому необходимо соотносить блокированные броски с тем как нагружает противник. Для этого попробуем отследить свяь между соотношением блокированных бросков в защите и нападении с общими бросками  в сторону ворот.

 Оказалось, что в КХЛ четко прослеживается обратная зависимость. Корреляция равна -0,8. Выходит, что команды просто вынуждены не допускать лишних бросков в створ своих ворот, дабы сохранять не самые высокие шансы на победу. Особняком стоит "Слован", координаты которого лежат вне основного облака. Команда не так много блокирует (0,62) относительно других команд, но при этом владеет инициативой (1,07). 

Из распределния по НХЛ видно, что блокирование бросков напротив уравнивает шансы команд в игре.

Возможно, причина кроется в узкой площадке, где плотнее игра у ворот и более вертикальном переходе из обороны в атаку. Тяжело сразу дать этому объяснение. Но, то что не все так одначно вышло на графиках - факт примечательный.

Вернемся к нашей классификации угроз воротам. Рассмотрим их долю от обшего количества бросков. Заодно и посчитаем корреляцию с процентом набранных очков.

SF/SA (shots for/against) - общее число бросков нанесенные/пропущенные

SOGF/SOGA (shots on goal for/against) - броски в створ нанесенные пропущенные

SBF/SBA (shots blocked for/against) - заблокированные броски в защите/в атаке

SMF/SMA (shots missed for/against) - броски мимо в атаке/в защите

Для КХЛ абсолютные цифры приведены в среднем за игру.

Хоть и низкие показатели корреляции говорят о независимости с результатами команд этих процентов. Зато наглядно видно, что командам легче всего удается при игре в атаке и защите в сравнении с другими командами при помощи дополнительной цветной визуализации. Тот же "Слован" хоть и слабо блокирует броски, но преуспел в создании помех бросающим  (второй SMA%).

Данная работа из двух частей, показало, что можно выжать в плане продвинутой статистики  из того, что дает КХЛ в открытом доступе, ориентируясь на опыт НХЛ. Использовать синтетические показатели данные лучше всего ориентируясь на корреляцию с процентом набранных очков, а если связь не так прослеживается, то объяснить как тактический рисунок объясняет всю специфичность цифр.