Продвинутая статистика: как разница в счете влияет на Corsi
Всем хорошего воскресного вечера! Поздравляю с началом предсезонных турниров в КХЛ, побед вашим командам. Всю неделю читал различные новости, статьи и интервью, посвященные прошедшим матчам, и несколько раз встретил упоминание о Corsi. Если специалистам оно знакомо, то далеко не все любители хоккея понимают его значение.
Corsi For (CF) – это количество бросков (броски в створ, броски мимо ворот, заблокированные броски), нанесенных командой. Corsi Against (CA) – это количество бросков (броски в створ, броски мимо ворот, заблокированные броски), нанесенных соперником команды. В качестве результирующего показателя используют CF%=[CF/(CF+CA)]*100%. Когда он больше 50%, команда бросает больше соперника, то есть имеет преимущество в матче.
Сегодня я проанализирую CF% команд НХЛ в сезоне 14/15 с точки зрения 7-ми разных состояний счета (ничья, разница в счете в 1 шайбу, 2 шайбы, 3 и более шайб) и покажу, что бросок при -3 имеет большую угрозу, чем бросок при +3.
Пока смотрим только на расположение групп CF%, не обращая внимания на размер и цвет кружков. Мы все видим семь "ступеней", которые спускаются вниз. CF% наиболее высок, когда команды уступают 3 и более шайбы, и наименее высок, когда команды выигрывают 3 и более шайбы. Это подтверждает, что проигрывающая сторона отправляет все силы в атаку, обстреливает чужие ворота с любых позиций и получает серьезное преимущество по броскам. Наиболее тесно отметки расположены в ситуации "ничья", значит, в этот момент команды примерно равны между собой по количеству нанесенных и пропущенных бросков.
Кстати, замечательные отметки, которые вечно оказываются намного ниже основной группы и говорят о полном проигрыше по броскам, принадлежат одной и той же команде. Нет, не "Эдмонтону". Они принадлежат "Баффало" и подтверждают, что уже с середины сезона (если не раньше) эта команда начала сдавать все и вся в надежде получить право первого выбора на драфте-2015. Фортуна сполна наказала "клинков".
А теперь – сюрприз, изюминка Corsi и продвинутой статистики, о которой я говорил. Во-первых, диаметр кругов соответствует проценту реализованных бросков: чем выше процент, тем больше круг. Средний диаметр наиболее высок в ситуациях, когда команда выигрывает 2 и более шайбы, и это логично: при солидном преимуществе хоккеисты атакуют реже, но тщательнее. При большом отставании, наоборот, все звенья летят вперед и делают ставку на количество, а не качество, часто уступая вратарям. Средний размер кругов минимален.
Во-вторых, цвет кругов соответствует проценту отраженных бросков: чем выше процент, тем ярче круг. Наиболее ярко выглядят группы в ситуациях, когда команды ведут в счете. Значит, в этот момент вратари более собраны, а соперники наносят наименее качественные броски. Тусклыми же получились результаты, которые хоккеисты показывают в роли догоняющих.
Различный уровень реализации говорит о том, что броски имеют различную ценность. Просуммировав количество бросков и взяв средний процент реализации, можно рассчитать коэффициенты для корректировки бросков во всех семи ситуациях. Так, при отставании в 3 и более шайбы ценность броска дома составляет всего 0.850 от броска при равном счете, а ценность броска на выезде – 0.895. В приведенной ниже таблице все коэффициенты для домашней команды (ДК) и гостевой (ГК). Заметим, что при ничейном состоянии счета бросок ДК менее ценен, чем бросок ГК. Это обусловлено тем, что существует минимальный статистический перевес у команды, которая играет дома из-за так называемого "фактора домашней арены".
Значит, при расчете CF% нужно корректировать броски на коэффициент, который соответствует ситуации на площадке. Я проанализировал обычный и скорректированный CF% команд НХЛ в сезоне 14/15 и сравнил с показателем "шайбы заброшенные" (ШЗ%). ШЗ%=[ШЗ/(ШЗ+ШП)]*100%. ШЗ – шайбы, заброшенные командой. ШП - шайбы, пропущенные командой. Если ШЗ%>50%, то цель достигнута: заброшено было больше, чем пропущено.
Как можно увидеть, между двумя видами CF% есть небольшое расхождение. Коэффициент корреляции (R^2) обычного CF% и ШЗ% составляет 0.297, а скорректированного CF% и ШЗ% - 0.308. Значит, скорректированный CF% лучше предсказывает разницу заброшенных шайб и именно его нужно учитывать в вашем анализе.
Получился лонгрид, но надеюсь, что он был для вас интересен и полезен. Теперь мы знаем многое о Corsi. Стоит или нет оценивать команды и хоккеистов по CF% – делитесь мнением в комментариях, анализируйте предсезонные матчи, публикуйте выводы. Всем хоккей!
Во-первых, они сильно зависят от счёта. То есть если команда при -1, -2 или -3 много бросает, это вовсе не обязательно означает, что она имеет преимущество. Соперник ведь может сознательно отдать территорию.
Преимущество в игре - это то, что взято силой и/или мастерством независимо от желания и воли соперника.
Надеюсь, система, о тестировании которой в НХЛ писали в прошлом сезоне, прошла эти тесты успешно и будет внедрена на постоянной основе и появятся новые интересные статистические показатели.
В этом смысле хорошим примером может служить футбол, где существуют различные классификации пасов и ударов, которые много говорят о классе, манере игры команды и о её настрое.
Кроме того, в футболе считают все единоборства (в Германии на этом вообще пунктик). В хоккее считают только единоборства на вбрасываниях. По крайней мере, только они есть в открытом доступе. А ведь это гораздо более силовая игра и статистика единоборств может многое сказать как о каждой отдельной игре, так и вообще о команде и игроке.
Ещё помимо бросков важен подсчёт моментов (это ведь не то же самое, что броски). Их можно тоже в разных плоскостях классифицировать.
Известно, что сами команды НХЛ их для себя считают и анализируют, но в открытом доступе их нет или такие сайты не очень популярны.
Ещё подсчёт количества движения. В хоккее это наверно будет самый последний показатель, который начнут считать - слишком сложно в силу динамичности игры и постоянных смен..
Если бы всё это можно было качественно считать, никакие корси и фенвики не нужны были бы, потому что они слишком обобщённые и не конкретные.
блин, в схемах Ваших я ничего не понял, если честно. кружочки и кружочки. эээ ааа но надо разобраться уже с этой продвинутой статистикой, а то чувствую себя отсталым каким-то))
http://www.sportingcharts.com/articles/nhl/projecting-2014-15-nhl-standings-using-fenwick-corsi-possession-statistics.aspx
Какова на ваш взгляд ценность такого анализа?
А так же можете ли Вы, основываясь на любой, выбранной по вашему усмотрению, продвинутой статистике, сделать подобный прогноз на следующий сезон?