NHL. Продвинутая статистика. Часть 1 - Погружение
Форварда Виннипега Блэйка Уилера спросили недавно, обращает ли он внимание на такие показатели продвинутой статистики как Corsi и Fenwick. Его взгляд выразил полнейшее непонимание, будто бы его спросили про пару игроков с Марса.
"А?", ответил Уилер. "Я даже не знаю, что это такое. Мой ответ будет - нет. Я никогда не слышал об этом, что вы такое говорите?"
Не будем откладывать эту тему в долгий ящик, ведь сезон подходит к концу, а нам с вами многое ещё стоит обсудить. Давайте поможем Блэйку Уилеру разобраться, что к чему, в такой непростой хоккейной науке, как продвинутая статистика. Хотя сложной она кажется только на первый взгляд.
В материале "NHL. Сезон 2013-2014 через призму командного Fenwick'а" мы уже коснулись тех самых показателей, столь озадачивших уважаемого хоккеиста. Давайте ещё раз повторим их, а так же дополним новыми терминами наш глоссарий:
1. Corsi = shots on goal (броски в створ) + missed shots (броски мимо ворот) + blocked shots (заблокированные броски)
Corsi - статистика, первоначально введённая Джимом Корси, тренером вратарей Баффало. По своей сути Corsi похожа на хорошо всем знакомую +/- статистику, но только в рассчёт берутся не забитые комадами шайбы, а броски в створ ворот, броски мимо ворот и заблокированные броски.
Возможные виды Corsi:
Corsi-For (CF) - Corsi-броски нанесённые командой. Такой же показатель встречается и для игроков, но отражает только броски конкретного игрока, без учёта бросков, которые наносились его партнёрами по звену, в момент когда тот находился на поле.
Corsi-Against (CA) - Corsi-броски нанесённые командой соперника.
CF% - процент, который составляет Corsi-For от суммы Corsi-For и Corsi-Against.
CF60 и CA60 - показатели CF и CA в среднем на 60 минут игрового времени. Для игроков так же встречаются показатели на 20 минут - CF20, CA20.
Corsi On - результирующий Corsi между CF60 и CA60, разница этих показателей. Демонстрирует нам баланс Corsi, производимый командой за 60 минут игрового времени, когда конкретный игрок (для которого производится расчёт) находится на поле.
Corsi Off - в противовес Corsi On отражает среднее значение Corsi, производимое командой за 60 минут, когда заданного игрока нет на поле.
Relative Corsi (Относительный Corsi) - выражен разностью Corsi On и Corsi Off. Является способом измерения эффективности владения шайбой игрока, относительно остальной команды.
Читать как: При нахожении Эрхоффа на поле, команда наносит за 60 минут на 12.7 в среднем бросков больше, чем без него. Кори Конакер единственный с положительным Corsi On, так как у него преобладает статистика полученная ещё в Оттаве.
Всё просто, Corsi это всего лишь броски, но за счёт того, что в расчёт идут не только точные попадания в створ, идёт рост количества данных, а чем больше данных, тем лучше будет наша итоговая выборка. Что мы получаем в итоге, как можно трактовать Corsi?
Ответ: Через призму Corsi мы можем оценить давление, создаваемое командой/игроком на поле, владение инициативой. Команда заинтересована в том, чтобы владеть шайбой, ведь зачастую выигрывает именно тот, на чьей стороне находится инициатива. Это звучит убедительно на большой дистанции, такой как целый сезон.
2. Fenwick = shots on goal + missed shots
Вместо Corsi в любом месте можно точно так же рассматривать Fenwick (показатели FF, FA, FF60, FA60, FF%). Данный вид статистики отличается лишь тем, что не учитывает заблокированные броски. По моим соображениям, при сравнении команд предпочтительней использовать именно этот показатель, а для игроков логичней использовать Corsi.
3. Quality of Competition
QoC или качество противостояния. Ряд показателей, через которые в численном виде нам представляют условную силу соперников заданного игрока. Как правило, наивысший QoC имеют лучшие оборонительные игроки команды, это либо самые ответственные защитники, либо лучше shutdown-форварды. С одной стороны, это те парни, на которых тренер соперника натравливает свои лучшие силы. С другой, это те бойцы, которым тренер их команды доверяет противостояние с этими лучшими силами противника.
Не буду вдаваться в тонкости расчётов, просто перечислю какие именно бывают показатели:
+/- QoC - выражение QoC через относительный +/- соперников.
Corsi QoC - выражение QoC через средний Corsi соперников.
Corsi Rel QoC - выражение QoC через средний относительный Corsi соперников.
Лидеры по этим показателям в лиге: среди защитников - Дион Фанёф и Карл Гуннарсон; среди нападающих - Логан Кутюр и Патрик Марло.
4. Quality of Teammates
QoT или качество партнёров. Всё то же самое, что и Quality of Competition, но уже по отношению к партнёрам по звену заданного игрока. Показатели точно такие же: +/- QoT, Corsi QoT, Corsi Rel QoT.
5. Зона старта
Off Zone Start % - единственный показатель, который нам понадобится. Процент выхода игрока на вбрасывание в зоне соперника. Подразумевается не выход на саму точку вбрасывания, а лишь выход на смену, когда назначено вбрасывание в зоне нападения.
Применение полученных знаний
К чёрту теорию, Блэйк Уилер уже утомился. Давайте перейдём непосредственно к одному из вариантов применения хоккейной продвинутой статистики, а именно к Player Usage Charts или Диаграммам Использования Игроков, ведь вы уже поняли, что по отдельности все эти показатели мало что значат, зато когда они вместе, можно натворить много дел.
Данные сайта Behind the Net приведены, к сожалению, пока только на 24.03.2014, не совсем свежие, но для анализа текущего сезона более чем достаточные.
И так, для интереса предлагаю рассмотреть несколько пограничных команд. Условия:
1) Минимум игр в сезоне - 30
2) Ось X - Off Zone Start %
3) Ось Y - Corsi Rel QoC (Чем выше игрок находится на диаграмме, тем сильнее соперники, которым он противостоит)
4) Размер круга - среднее игровое время за матч
5) Цвет круга - Corsi On или Corsi Rel (Синий цвет - наибольший уровень Corsi, коричневый - наименьший)
1. San Jose Sharks - как самая доминирующая команда лиги по абсолютному показателю Corsi-For в равных составах
(цвет круга - Corsi On):
(цвет круга - Corsi Relative):
Трудно разобрать фамилии в центре, вы это сами сможете сделать на сайте, нас же больше интересуют пограничные случаи.
Удивительно для меня, что эта команда, при абсолютном лидерстве по Corsi-броскам, не обладает особым территориальным преимуществом. Весомая часть важнейших игроков располагается по левую сторону от отметки 50%, отвечающей за зону старта.
Какие тренерские решения нам становятся видны? Очень берегут Мартина Гавлата, выставляя его чаще в зоне атаке - очень резкое отличие от остальных. Так же небольшие поблажки в этом плане делались и для молодого дарования - Томаша Хертла. И напротив, лидеры команды, Кутюр, Торнтон, Марло, Павелски активнее остальных используются МакЛелланом для выходов в зоне защиты. Сан-Хосе явно придерживаются мнения, что лучше всего будет, если самых сильных игроков соперника будут закрывать лидеры команды. Сильно выделяется и shutdown-защитник Джастин Браун, его активнее остальных выпускают в своей зоне.
Как я уже говорил, Логан Кутюр, абсолютный лидер лиги по показателю QoC среди нападающих, но кроме этого, он обладает ещё и очень высоким уровнем самого Corsi, при этом выходит глубже всех нападающих команды.
Джо Торнтон, обладатель самого синего кружка диаграммы, даже на фоне мощных лидеров Сан-Хосе выглядит неким Corsi-монстром.
Диаграмма демонстрирует нам, что лидеры Сан-Хосе доминируют над лидерами других команд на площадке. 3-4 звенья в целом так же играют в плюс со своими визави.
2. Toronto Maple Leafs - как команда, получающая наибольшее количество Corsi-бросков
(цвет круга - Corsi On):
(цвет круга - Corsi Relative):
Ожидаемый дичайший контраст между самой бросающей и самой получающей командами лиги. Полностью синие в абсолютных значениях Сан Хосе против полностью бурого Торонто. Трудно разглядеть что-то интересное среди коричневой кучи, Relative Corsi нам здесь больше поможет.
С одной стороны Фанёф с Гуннарсоном лидеры лиги по уровню соперников (QoC), а с другой стороны у них ужаснейший Corsi On - меньше -20 у обоих, что так же близко к лидерству в лиге, но уже с отрицательной стороны. Так оправданно ли их использовать против лучших соперников, если в итоге они с ними не справляются и это приводит к таким результатам. Трудно сказать, смогли бы это сделать Гардинер с Франсоном, но попытаться бы стоило, хотя бы чуть-чуть разгрузить первую пару защитников.
О какой повышенной результативности Кларксона и Кулёмина может идти речь, когда оба исполняют роли shutdown-игроков (роль защитного нападающего), и поэтому чаще всего начинают смены в своей зоне. Плюс, ещё Джей МакКлемент стартует в полном shutdown.
Среди нападающих довольно ровно распределяются соперники по силе, чуть выделяется Бозак, за ним уже Ван Римсдик с Кулёминым и Кесселом. Из лидеров, в чуть большей степени берегут Кадри, но он при этом оправдывает ставку лучшим в команде Corsi. Выпадающие вниз Эштон Картер и Орр слишком мало времени проводят, чтобы их имело смысл как-то оценивать, и получают таких же парней из 4-го звена себе в соперники.
То ли дело в плохом подборе лидеров, то ли Карлайлу пора на пенсию, очевидно, что сейчас эта команда не играет, а страдает на поле. Удивительно как долго они давали хороший результат и занимали высокие места. Я вовсе не хотел глумить Торонто вторую статью подряд, ведь статистика в хоккее даёт далеко не полную картину, всё же тут не учитывается ни исполнительское мастертсво талантливых нападающих (Кессела, Ван Римсдайка, Лупула), ни игра спецбригад, ни отличная игра Бернье, но в плейофф команду, столь уступающую позиционно, видеть бы очень не хотелось.
UPDATE - Забавная картинка про Торонто и их Corsi:
Подведём итоги
Надеюсь теперь у Блэйка Уилера появилось ещё больше вопросов. К Виннипегу и личной статистике Блэйка мы обратимся в следующий раз, а пока сделаем какие-то краткосрочные выводы.
Мы рассмотрели 2 противоположные команды, и увидели, что ни в коем случае не можем сравнивать их игроков между собой. Внутри команды - да, это можно сделать куда проще и объективнее. Но, в первую очередь, продвинутая статистика нацелена на понимание модели игры команды, на тренерские установки, которые трудно уловить по ходу матча, на оценку использования того или иного игрока.
Продвинутая хоккейная статистика не универсальная пилюля от всего, а одна из призм восприятия игры. Вряд ли она сравнится когда-нибудь с бейсбольной сайберметрикой, но и отвергать это учение не стоит. Какие-то аспекты этой теории можно подвергать сомнению, но учиться правильно использовать и трактовать её стоит.
Интересные сайты по этой теме:
САШАОВЕЧКИН, КУЗЯ, ГАНЧАР, СШАУБИВАЕТ, КРОСБИ СОСЕТ
Дело не в самих бросках, расчёт на корреляцию количества этих бросков с осмысленными действиями команды в атаке-защите, с инициативой на поле, с давлением, которое создаётся на площадке, если конкретный игрок/звено вышло на поле.
Сильные по Корси игроки не напрямую мешают сопернику бросать, они сами проводят большую часть времени в нападении, сами бросают.
Бержерон выходит практически глубже всей команды в поле, имеет наивысший QoC среди нападающих Бостона и при этом он самый синий кружок в команде (Лидер по Corsi On). Наверное, это что-то да говорит о качествах Бержерона? Да, можно всё свести к силе партнёров, но мы и их можем оценить? Его основые партнёры на диаграмме даже не близко к нему находятся. Совершенно очевидно, что Бержерон особенный игрок, который подтверждает Corsi-теорию.
Тарасенко на диаграмме Сент-Луиса выходит на >60% в зоне нападения, то есть тренер с одной стороны оценивает его как очень острого нападающего, с другой стороны не очень доверят ему игру в своей зоне. Далее смотрим Корси (Corsi On = 19), он у Тарасенко абсолютно лучший в команде. То есть он полностью оправдывает ожидания тренера, выжимает максимум пользы из своего времени на площадке. Нельзя сказать, что для команды он значит больше, чем Стин, к примеру, у того так же внушительный Корси при значительно меньшем количестве выходов в зону нападения, и большем игровом времени. Но значимость Тарасенко для нападения Сент-Луиса не стоит недооценивать.
Если бы такой текст пустить в популярном блоге, уже давно бы всё опошлили)
Интересные сайты по этой теме:
http://www.extraskater.com
http://www.behindthenet.ca
http://www.secondcityhockey.com
http://www.hockeyabstract.com
http://stats.hockeyanalysis.com
По защитникам Чикаго прекрасно видно, что бывает, если игроки имеют постоянных партнёров на поле. Хьяльмарсон с Одуйей вместе наверху и в шатдауне небольшом, затем посередине парочка Кит-Сибрук, и внизу все остальные. Чёткое разделение между шатдаун-парой, выходящей соперничать с лидерами соперников, созидающей парой, которая за счёт своего громадного игрового времени успевает переиграть с разными по силе соперниками, и 3-ей парой слабых защитников, которым тренер не доверяет. Да, все имеют положительный Корси за счёт силы Чикаго. Да, верхняя парочка уступает в Корси остальным защитникам, но делаем скидку на частые выходы в своей зоне и на силу соперников.
Сколько информации можно почерпнуть человеку со стороны, который даже ни одной игры Чикаго не видел? И это всего-лишь одна маленькая диаграммка.
Может не столь продвинуто, но здесь я пытался оценить игру спец бригад в целом по команде, учитывая голы в большинстве, в меньшинстве, а также забитые голы при меньшинстве http://www.sports.ru/tribuna/blogs/nhlanalysis/597095.html
Конечно, если игрок получает большую поддержку тренера позиционную, имеет низкий уровень соперников и при этом имеет отрицательный Corsi On, то он очень вероятно, что паршивый игрок. А отрицательный Corsi Rel, как у Марло, значит лишь то, что его парнёры по команде - звери. Всё же большинство игроков находятся в очень неоднозначных позициях на диаграмме, и нужно учитывать всё, вплоть до силы их партнёров по звену, хотя бы через QoT.
Тема очень обширная, а я пытаюсь хоть начальный уровень показать. Да и самому мне пока сложно давать более ёмкие оценки.
Но по поводу различий могу сказать, в Corsi QoC за основу берётся абсолютный Корси соперников, то есть эти дикие минусовые Corsi On таких команд как Баффало, Торонто, с которыми Бостон часто встречался. Особенность формулы и общая слабость восточных команд приводит к таким результатам. Представляешь сколько раз за 1 матч с Торонто лидерам Бостона приходится встречаться с такими парнями как Фанёф и Гуннарсон, обладающими Corsi On в -20.
Corsi Rel QoC, в свою очередь, основан на Относительном Корси соперников, а он уже априори не может быть таким минусовым.
Из того что я читал, и из собственного понимания, я сделал вывод, что лучше смотреть именно Corsi Rel QoC. Потому что, в первую очередь, нам важно положение игроков команды относительно своих же партнёров, а не абсолютные значения.