Продвинутая статистика: почему нужно выкинуть показатель «плюс-минус» в мусорное ведро
Всех любителей хоккея поздравляю с воскресеньем! Предсезонка завершается, до старта чемпионата КХЛ осталась всего лишь неделя, после чего понесутся победы, поражения, голы, передачи, отраженные броски, коэффициенты полезности. Об одном из них я и хотел бы поговорить сегодня - о коэффициенте “плюс-минус”,а точнее о том, почему его нужно убрать из собираемой статистики, данные сжечь, пепел развеять по ветру и все забыть.
Вспомним позапрошлый регулярный чемпионат НХЛ, когда Александр Овечкин оказался в числе самых бесполезных игроков, заработав “-35”, и при этом набрал 79 очков. Хоккеисты вокруг не смогли преодолеть планку даже в 25 баллов. При этом результативность Ови была одной из лучших в Лиге, а почти все его конкуренты получили положительный "плюс-минус" (исключения – Кессел из "Торонто" и центрфорвард все того же "Вашингтона" Бэкстрем). И такие примеры есть каждый сезон. Почему так происходит? Давайте разбираться.
Итак, коэффициент полезности по итогам сезона формируется как сумма коэффициентов в каждом матче. "Плюс-минус" игрока в матче - это разница между шайбами, которые команда забросила и пропустила при нахождении игрока на площадке. В расчетах не учитывают среднее время на льду – и это первая причина, по которой показатель считают необъективным. Если игрок в среднем находится на льду больше времени, его плюс (или минус) будет выше (или ниже), чем у игрока с идентичными характеристиками и меньшим игровым временем.
Также, как показало исследование последних пяти сезонов, лишь в 70% случаев игрок, получивший “плюс” за конкретный гол, внес хоть какой-то вклад в него. С голами пропущенными (“минусами”) дело обстоит еще хуже: лишь в 50% случаев игрок, получивший “минус”, был хоть сколько-нибудь виновен в голе. Хороший пример - Алекс Киллорн из “Тампы” и Колтон Сивиор из “Далласа”. Оба провели по 71 матчу, получили практически одинаковый PDO, но Киллорн в среднем за матч находился на льду на 2:20 дольше, то есть сыграл на 163 минуты или на 2 часа 43 минуты больше, чем Сивиор. Так действительно ли Киллорн в 2 раза лучше Сивиора как показывает показатель “плюс-минус”?
Еще одна причина - это PDO. Разницу шайб можно разложить на элементы. Шайбы заброшенные (ШЗ)=(БВЗ*ВНЛ/60)*БВ%. БВЗ – среднее количество бросков в створ, нанесенных командой за 60 минут нахождения игрока на льду. ВНЛ – среднее время игрока на льду. БВ% – процент реализованных бросков. Шайбы пропущенные (ШП)=(БВП*ВНЛ/60)*(100-ОБ%). БВП – среднее количество бросков в створ, пропущенных командой за 60 минут нахождения игрока на льду. ВНЛ – среднее время игрока на льду. ОБ% – процент отраженных бросков.
Среднее время игрока на льду зависит от разницы в счете. При числовом преимуществе играет сдерживающее звено, а шансы бомбардиров забить снижаются. С другой стороны, именно бомбардиров выпускают на лед, когда команда проигрывает, и в пылу атак они часто пропускают шайбы.
Количество нанесенных и пропущенных бросков напрямую зависит от всех партнеров по звену. Можно поставить Овечкина в звено с двумя молодыми форвардами и защитниками-домоседами, в результате чего на ворота будет "заряжен" только сам Александр. А можно условного Наместникова на одну смену отрядить в первое звено "Тампы" (не будем забывать, что при травмах запасных приходится ставить на место лидеров, чтобы не ломать остальные сочетания) и наблюдать за ростом показателя БВ%.
БВ% и ОБ%, как нам понятно, серьезно зависят от вратарей. Одному сегодня везет, он удачно позицию выбирает, угадывает с бросками – все, шайба в сетку не зайдет. А другой вышел, не настроился, пропустил после рикошета, пропустил "бабочку" - и коэффициент полезности его партнеров упал так, что до конца матча не поднять. Приведем хороший пример. Джером Игинла и Эрик Стаал провели почти одинаковое количество матчей с почти одинаковым средним игровым временем, но их полезность диаметрально противоположна - “+6” и “-6”. Так почему один настолько хорош, а другой настолько плох, несмотря на более высокий CF%? Смотрим на показатели продвинутой статистики и получаем ответ: PDO Игинлы намного выше PDO Стаала. Форварду “Каролины” просто тотально не везло, как впрочем и всей команде.
Итак, мы увидели, что на заброшенные и пропущенные шайб влияют сотни элементов: выходы защитников из своей зоны, число голевых моментов, количество (а также качество) пасов перед броском и, конечно же, качество партнеров по звену. Большей частью они не зависят от игрока, но при этом определяют его "плюс-минус". Так насколько точно коэффициент +/- характеризует мастерство хоккеиста? Стоит задуматься об объективности оценки по данному показателю.
Так же еще отмечу по плюс/минус его беда в том, что он практически не учитывает игру в неравных составах, а это очень серьезный момент современного хоккея, зачастую именно в неполных составах решается судьба матча. В целом +/- показатель очень командный, множество случаев когда игрок по ходу сезона переходит из клуба А в клуб Б и его +/- в новом клубе кардинально отличается от того, что был в старом и очень наивно полагать, что игрок за время переезда вдруг стал гораздо полезнее.
Единственное для чего +/- хоть как-то подходит это для анализа внутри одной команде, скажем если у всех игроков клуба он +10 и больше, а у Васи одного -5, то видно стоит спросить с Васи, что за нафиг. Или если у всех минимум в клубе минус 15, а у Пети -3 при солидном айстайме, то пожалуй Петю стоит погладить по голове.
В идеале надо вводить какое-то глобальный коэффициент полезности игрока, где каждый из показателей будет иметь свой вес и все будет суммироваться. Скажем забитый гол это 1, передача голевая это 0,8, секондари передача 0,7. Если гол был забит в ПП 5 на 4, то множим эти пункты на условный коэффициент 0,8, если в ПП 5 на три то множим 0,6 (так как забить в такие моменты проще). Если команда забила в меньшинстве то множим скажем на 1,5. Придать вес остальным показателям выигранные вбрасывания, силовые приемы, блоки, потери, отборы, броски, обводки умножать их на коэффициенты, скажем вбрасывание в нейтральной зоне при равных составах менее ценно, чем вбрасывание в своей или чужой зоне при игре в меньшинстве и большинстве. Это и обводок касается одно дело обвести в средней зоне играя в ПП, а другое дело в равных составах и в зоне атаке. И далее в том же духе. Разработать такую методику дело очень непростое, крайне сложно определить вес того или иного показателе и коэффициента, но это будет интересно.
Так же оценивать и игру вратарей, не просто считать броски, а делить а учитывать силу и точку броска (что уже реально), следующим этапом анализировать ситуацию у ворот, наличие траффика и так далее.
В любом показателе есть командная и индивидуальная составляющая. Не только в +/-.
Возьмём пример из текста - Овечкин. С одной стороны голы - прямое следствие его мастерства. Такого броска нет ни у кого. С другой стороны, без точных пасов Грина, Бэкстрёма и всех прочих у него не было бы возможности штамповать голы из своего "офиса". Естественно, я сейчас чуть-чуть утрирую и голы он забивает не только вантаймером из круга вбрасывания. Естественно, что-то он и сам создаёт. Точнее создаёт довольно много. Но никто же не будет спорить, что эти вантаймеры составляют значительную часть его актива? То есть гол тоже командный показатель в какой-то части.
Так что этот упрёк в адрес +/- не корректный. Главный вопрос, сколько в этом показателе командного, а сколько личного?
Как и любой другой статистический показатель, +/- нужно рассматривать в комплексе с другими показателями. Другими словами провести многомерный статистический анализ. Плюс к этом, так как +/- показатель синтетический (является расчётным, а не первичным), можно проанализировать его составляющие. А выбрасывать его никуда не надо. Очень важный показатель.
Не знаю, откуда взяты +6 и -6 Игинлы и Стаала. В реальности у них в прошедшем сезоне было 0 и -13 (а год назад +24 и -13). Так вот, когда Джером был на льду, в ворота соперников и его команды было забито 118 голов (не сложно догадаться, что по 59 в ту и другую сторону), а когда Эрик - всего 99. Из них 56 в ворота Каролины (то есть очень близко к Игинле) и всего лишь 43 в ворота соперников.
Результативность их команд в равных составах.
Колорадо 163 гола, Каролина 128 голов.
Личная результативность в равных составах.
Игинла - 21+25=46
Стаал - 16+21=37
Для того и другого это почти 29% от результативности команды.
На основе этого можно предполагать, что Эрик, может быть, не так уж и виноват со своими -13. Вероятно, Александр Сёмин его подвёл, развалив своей плохой игрой звено Стаал-Сёмин-Тлусты, а заменить его оказалось некем и получилось то, что получилось.
Теперь про игру в обороне и разделение +/- на командный и личный. Снова Овечкин. Конечно, в одном конкретном матче можно свалить вину на вратаря, защитника, другого нападающего или даже поаплодировать мастерству оппонентов. Но ведь команды играют в сезоне 82 матча. И вот на такой дистанции начинают проявляться как командные, так и личные косяки. Где-то партнёры привезли минус Овечкину, но где-то и он им. Нелепо ведь утверждать, что все минусы привезли Овечкину партнёры, а все плюсы он единолично привёз им.
Тут две составляющих.
1. Нежелание отрабатывать на своей половине. Самый яркий пример из того -35 сезона для меня матч против НДД. Овертайм, идёт атака Нью-Джерси на ворота Вашингтона, Овечкин бежит рядом с Жидлицки (а с шайбой бежит емнип Ягр) и вдруг перестаёт бежать. Просто так. Никакой травмы, никакого падения, никакого оправдания. Через пару секунд Жидлицки замкнул пас на пустые ворота. Естественно, это был не единственный момент в сезоне, но самый вопиющий. А до этого весной-2013 в серии против рейнджеров случился известный мем с "отказом контроллера".
2. Неумение играть на своей половине поля. Это уже выражается в конкретных ТТД. Отборы, блоки. Плюс понимание игры (то есть понимание, где нужно быть в данную секунду, чтобы наилучшим образом помочь партнёрам). Уже в легенды вошло катание Овечкина по своей зоне на прямых ногах. Попросту он не участвовал в оборонительных действиях, а лишь ждал, когда шайба окажется у партнёров и можно будет бежать вперёд.
В общем, ничего удивительного в -35 в том сезоне нет. Этот показатель прекрасно отразил игру Овечкина без шайбы. Как нет ничего удивительного и в том, что при Троце он скакнул к +10. Команда в целом играла лучше, но и сам Овечкин играл совсем по-другому, чем при Оутсе.
Ну и в качестве ЗЫ
Конечно, этот показатель нельзя называть показателем полезности, иначе возникает вопрос, что такое, например, голы и передачи - показатели бесполезности?
Показатель надёжности? В свете сравнения Игинлы и Стала это не совсем верно. Разница возникла не из-за пропущенных голов, а из-за забитых.
Показатель сбалансированности? Может быть.
Ну а можно просто плюс/минус - в самом названии уже частично отражается смысл показателя.
Это что за бред. А если это прошлогодняя Аризона или Баффало. Такое высказывание применительно только к игрокам из команд- фаворитов, и то не всегда.
А применительно к чекерам из 3-4 звеньев так можно вывести и явно противоположную формулу.
Я не оправдываю минус Овечкина, и не говорю, что он игрок лучше, чем Крейчи (хоть так и считаю). Я лишь говорю о необъективности самого показателя. Посудите сами - PDO Крейчи в том сезоне 104.4 (при ОБ% =94.8%), Овечкина 96.5 (при ОБ% = 90.5%) Почему Крейчи, играя в феноменальный год Раска (а 94.8 это нереальное число), должен получать с этого какие-то дивиденды? Это разве объективно оценивает его как индивидуального игрока? Ваш тезис по поводу виновности всех игроков при игре в большинстве за ВСЕ шайбы тоже довольно спорный (могу скинуть в личку пару скринов, где виновен какой-то конкретный игрок, а не вся бригада большинства). И тогда встает логичный вопрос, почему за пропущенные шайбы в большинстве вы минусы получаете, а за забитые нет? Как я указал в статье, +/- объективно описывает лишь около 60% голов (70% голов забитых и 50% пропущенных), иными словами он не абсолютно бесполезен, но достаточно много иных показателей, которые более объективно описывают индивидуальное мастерство и в атаке и в обороне.