«У нас лига бизнесменов. Готовы бросать откуда угодно, лишь бы поднять себе Корси». Статистика, которая говорит об игре лучше, чем счет
От редакции Sports.ru: вы находитесь в блоге Hockey Books, который полностью перевел две огненных автобиографии – Фила Эспозито и Шона Эйври. Он вернулся с новой книгой – на этот раз про хоккейную аналитику, которая гораздо интереснее, чем вы думаете! Поддержите авторов плюсами, подписками и комментариями, чтобы интересные переводы чаще появлялись на Трибуне и в вашей ленте.
Пятница – время новой главы.
Сегодня авторы Стивен Шэй и Кристофер Бэйкер объясняют, почему бессмысленно накручивать себе Корси (пора уже вводить термины, книжка про аналитику все-таки).
Что касается печатного тиража книжки Шона Эйври, у нас есть плохие новости. Нам не удалось договориться с типографией, где мы печатали крохотную партию книжки Фила Эспозито, и поэтому сейчас мы находимся в поиске новой (вроде есть пара зацепок). Однако на это все равно уйдет какое-то время – трудно сказать, сколько конкретно. Будем надеяться, что не очень много.
Но есть и хорошие новости. Среди вас были те, кто спрашивал про книжку в электронном формате. Поскольку здесь не надо бодаться с типографией, то тут все проще. Еpub книжек Шона и Фила у нас готовы, и если они вам нужны – напишите мне в личку здесь, на Sports.ru.
Если хочется помочь проекту материально, то внизу есть номер нашей карты.
Глава 3. Результат может быть обманчив
Руководство «Бостон Ред Сокс» решило сделать разовое промо для своих болельщиков. Победил Джонни – в награду ему полагалось в одном матче заменить бэттера в девятом иннинге. Прежде чем Джонни взял в руки биту, лидера «Ред Сокс» и будущего члена Зала славы Давида Ортиса, обладающего сумасшедшим ударом, выбили непростым «слайдером», до которого он чуть-чуть не дотянулся. И вот Джонни, державший последний раз биту в руках еще в детской лиге, выходит на домашнюю базу. Не придумав ничего лучше, он закрывает глаза и вслепую взмахивает без особой надежды отбить «фастбол», летящий на него со скоростью 150 км/ч. Мяч ломает биту Джонни и медленно катится к третьей базе. Несмотря на шок от такой невероятной удачи, что бита вообще попала по мячу, Джонни кое-как успевает добежать до первой базы, прежде чем ее закроют.
Джонни взял базу после того, как Давида Ортиса выбили в аут! Это не значит, что Джонни должен заменить Ортиса на позиции ведущего бэттера команды. Иногда результаты могут быть обманчивы. Важен сам процесс, а у Джонни в этом плане хватало недостатков.
Можно играть хорошо – и уступить. Можно играть плохо – и одержать победу. Это справедливо для всех видов спорта, но малая результативность хоккея (да и футбола, раз уж на то пошло) повышает вероятность таких извращенных результатов. Но та же малая результативность отчасти и привлекает болельщиков. Все может перевернуться с ног на голову за считанные секунды. Команду могут переигрывать два периода, но один удачный отскок – и она снова в деле. С другой стороны, команда может делать все как надо, но пара неудачных эпизодов – тут попали в перекладину, там в штангу – и она проигрывает 1:2 в упорной борьбе. Забавно, как всего пара дюймов на одном броске может стать разницей между послематчевым отчетом в прессе, где будут расписаны все недостатки местной команды, и статьей в комплиментарных тонах о претендентах на кубок.
В любом матче команда, которая играет лучше, может в итоге уступить, но это не значит, что турнирная таблица в конце сезона совершенно не отображает истинного положения дел. На отрезке в 82 матча значимость случайных отскоков, как правило, нивелируется, а побеждает чаще всего достойнейший. Команду, одержавшую 50 побед, не спутать с той, которая выиграла 30 раз. Но если в одном отдельном матче счет может быть обманчив, то как определить, насколько хорошо играла команда? После игры отличным источником информации становится тренер. Однако если мы хотим провести обширный анализ – например, пятилетнее исследование на тему влияния длительных переездов на результаты команды – тренеры уже не помогут.
Хоккей, как и все другие виды спорта – но более многих – нуждается в хорошим измерении процесса. Ему нужен инструмент для определения выступления команды, который копнет дальше итогового счета. Именно для этого создали Корси.
Для команды Корси – это соотношение своих бросков против бросков соперника. Для игрока – то же самое, но исключительно в рамках его времени на площадке. Корси включает в себя броски в створ и мимо ворот, а в некоторых версиях и заблокированные броски (Корси включает в себя и заблокированные броски тоже. Показатель Фенуик – тот же Корси, но без заблокированных бросков; однако некорректно называть его версией Корси – прим. ред.). Идея заключается в том, что если команда играет хорошо в нападении, она будет наносить больше бросков, а если все ладится в обороне, то ее ворота будут реже атаковать (чуть более развернутое объяснение: чтобы наносить броски, необходимо владеть шайбой, а кто больше ей владеет – тот и играет лучше – прим. ред.).
Выяснилось, что на маленькой выборке (а один матч именно таковой и является) Корси, как правило, лучше отображает игру команды, чем счет.
Сразу поясним. Корси – не идеальный показатель уровня игры. Анализировать спорт, прибегая исключительно к статистике – это все равно что судить о фильме, основываясь лишь на прочтении сценария. Опираться только на послематчевый протокол – это все равно что читать сценарий, в котором из каждых пяти слов убрали четыре. А в случае с хоккейным протоколом – не только из каждых пяти слов убрали четыре, но еще и перемешали все оставшиеся. Корси стал находкой в том плане, что он извлек максимум из весьма ограниченной информации.
Чтобы понять значимость Корси, давайте представим, что после первых трех месяцев сезона-2015/16 вам поручили предсказать результаты команды на три месяца вперед. Поскольку задача в хоккее заключается в том, чтобы забросить больше шайб, чем соперник, давайте оценивать игру команды в следующие три месяца по разности шайб за матч. Иными словами, мы оценим игру команды в следующие три месяца сезона по положительной (или отрицательной) разности шайб в среднем за матч (нижеизложенное – лишь неформальное обсуждение. Вся статистическая веселуха типа диаграммы разброса данных и коэффициенты детерминации находится в Приложении Б: Пример исследования Корси).
Можно предположить, что лучшим индикатором разности шайб во вторые три месяца будет этот же показатель первых трех месяцев. Но это совершенно не так. Между ними не было практически никакой корреляции.
Поскольку в хоккее невысокая результативность, команда запросто может играть хорошо, но ей «не будет везти». Именно так происходило с «Анахаймом», у которого была одна из худших разностей шайб в первые три месяца и одна из лучших в лиге – в следующие три. Здесь Корси нам здорово поможет.
Процент Корси (Corsi %) показывает соотношение бросков команды от общего количества бросков. У «Анахайма» он составлял в первые три месяца 50,5 %. Но несмотря на то, что «Утки» перебрасывали соперников, в среднем они пропускали за игру на 0,53 шайбы больше, чем забивали.
Процентное соотношение Корси лучше отображает картину, чем разность шайб, но все равно крайне ограничено в плане способности предсказывания будущего. Одна из причин заключается в стиле игры, который работает против Корси в данном примере.
Если команда играет хорошо, она, как правило, ведет в счете. Когда команда вырывается вперед, ей свойственно играть более консервативно в обороне. В свою очередь команда, которая уступает в счете (как правило – потому что играет плохо), начинает играть в более агрессивный хоккей. Команду, ведущую в счете, как правило, перебрасывает та, которая уступает. Таким образом у выигрывающей команды Корси идет вниз, а у проигрывающей – наоборот растет.
Чтобы справиться с этой трудностью, мы можем обращаться к Корси только тогда, когда идет примерно равная игра – а именно при разрыве в одну шайбу в первых двух периодах или же при ничейном счете в третьем. Этот показатель называется процентным соотношением Корси равных матчей (Corsi Close %), и он лучше коррелирует с будущими результатами, чем простой Корси.
В первые три месяца сезона «Анахайм» пропускал в среднем на 0,53 шайбы больше соперника за матч. Из этого можно сделать вывод, что команда играла слабо. Однако если мы копнем глубже итоговых результатов, у нас получается другая картина. «Анахайм» перебрасывал соперников. При равной игре «Дакс» наносили 55,2% от общего количества бросков и были вторыми по этому показателю в НХЛ. Разность бросков говорила о том, что «Анахайм» играл очень хорошо, и, возможно, что-то независящее от хоккеистов негативно сказывалось на разности шайб.
Если «Анахайм» действительно играл хорошо, о чем говорила статистика их бросков, можно было ожидать, что вскоре это положительно скажется и на разности шайб. Так и произошло в следующие три месяца. «Анахайм» вырвался в лидеры НХЛ, забрасывая в среднем за игру больше соперника.
Хоккей – малорезультативная игра, и в связи с этим разность шайб на маленькой выборке может оказаться обманчивой. Броски – неидеальное средство измерения процесса, но они эффективны и случаются достаточно часто, чтобы обладать серьезной предсказательной силой. Корси не делает разницы между бросками, но предсказательная суть этого показателя не значит, что все броски одинаковы. Качество бросков имеет значение.
Предсказательная сила и важность не синонимы. Допустим, разводчик лошадей дал объявление, что ищет жеребца для скрещения со своей породистой кобылой. Ему поступает 100 предложений. Которое выберет разводчик? Информация о том, кастрирован жеребец или нет, не поможет нам предсказать его выбор. Все 100 жеребцы-производители, а не мерины. Однако это очень важное качество. Все-таки нет яиц – нет детей.
На этом примере очень хорошо видна разница между предсказательной силой и важностью. Однако когда факторы в задаче не столь белые и черные, это может значительно осложнить дело.
Качество бросков всегда заботило команды НХЛ. Они приобретают и развивают игроков с хорошим броском и выстраивают игровую стратегию таким образом, чтобы выводить их на позицию для качественного броска. Если команда искренне пытается наносить хорошие броски, то чем больше попыток она делает – тем лучше. Если же команда старается искусственно повысить свой Корси некачественными бросками… Что ж, это будет столь же эффективно, как взять мерина для разведения лошадей.
Корси работает относительно хорошо, как средство оценки прошлых событий. Но в идеале цель аналитики состоит в том, чтобы дать больше, чем просто оценку прошлому. А именно – предоставить инструменты для будущего успеха. Корси может оценить прошлое, но будет ужасно, если команда поставит это себе целью на будущее.
Допустим, мы оценили усвояемость учебного материала в местных школах по количеству учеников в классе. Чем меньше класс, тем – как мы предполагаем – лучше для учеников. Одна из местных школ узнала про эту метрику, и обнаружила, что шла на последнем месте при среднем количестве 38 учеников на класс. Школа решила исправить эту метрику. Лучше всего в данной ситуации было бы нанять больше учителей, но это дорого стоит. Вместо этого школа сократила занятия в два раза, поделив классы примерно пополам. Метрика улучшилась, но усвояемость учебного материала у школьников при этом не выросла.
Если вы сомневаетесь в том, что хоккеисты порой накручивают себе Корси, заискивая перед тренером или чтобы использовать этот показатель как аргумент в контрактных переговорах, просто спросите самих тренеров и игроков. Тренер «Вашингтона» Барри Троц как-то заметил: «У нас тут лига бизнесменов. Они готовы бросать откуда угодно, лишь бы поднять себе Корси». А центрфорвард «Каролины» Джордан Стаал признался: «Возможно, некоторые игроки иногда специально наносят пару лишних бросков, чтобы подвинтить себе Корси». (6)
В погоне за Корси легко снизить качество бросков, поэтому директор хоккейных операций Федерации хоккея США Джи Джохэннсон заявил: «Я не хочу, чтобы дети думали, что мы оцениваем их по этому критерию». (6) Более того, Корси совершенно не показывает, как наносить больше бросков сравнимого или лучшего качества. Отслеживание бросков лишь измеряет температуру команды, но никак не лечит болезнь. Наставник «Детройта» Джефф Блэшилл прекрасно выразился по этому поводу: «Броски – это скорее сопутствующее явление игры, а не ее основа». (6)
Хоккею нужен хороший измеритель процесса. А хороший измеритель процесса выделяет хоккейные активности и контекст, которые ведут к хорошим возможностям для броска, таким образом ставя перед клубами практические задачи и предоставляя необходимые основания для грамотных тренерских стратегий.
Понравилось? Поддержи проект рублем! Наша карта – 4274 3200 3863 2371.
Часть 1. Почему Овечкин постоянно проигрывал «Питтсбургу»? Все думали, что просто не везет – на самом деле, есть конкретные ответы (Предисловие, вступление, первая глава)
Автобиография Фила Эспозито. «Вид на нудистский пляж? Отлично. Я там прямо в центре и встану». Последняя глава автобиографии Эспозито (и ссылки на все предыдущие)
Автобиография Шона Эйври. Закончил карьеру из-за Тортореллы, женился на супермодели и стал актером. Последняя глава книги Эйври (и ссылки на все предыдущие)
Фото: Gettyimages.ru/Victor Decolongon, Sean M. Haffey; globallookpress.com/Bryan Smith; wikimedia.org
Так что xG это не столько статистический показатель, сколько математическая модель остроты игры, основанная на статистике.
Вообще, в Сев.Америке всеми этими моделями занимаются вплотную. Если интересно, то можно посетить сайт Hockey-Graphs (hockey-graphs.com/2019/08/12/expected-goals-model-with-pre-shot-movement-part-1-the-model/)
Ну, и в добавок, как иллюстрация, насколько всё серьезно в плане статистики у них там:
rpubs.com/evolvingwild/395136/
...и насколько убого у нас здесь.
А на счёт воды в тексте, я с Вами полностью согласен.