15 мин.

Гретцки vs. Овечкин: сравниваем несравнимое методом Шарикова. Или почему Горди Хоу всё равно круче

 

Долго думал, что бы вынести в эпиграф данного поста, и в конечном итоге остановился на классике от Михаила Афанасьевича. 

- Да что тут предлагать?.. А то пишут, пишут… Конгресс, немцы какие-то… Голова пухнет. Взять все, да и поделить… 

За последние годы споры о том, кто же всё-таки более великий снайпер в истории НХЛ - Уэйн Гретцки или Александр Овечкин разгораются мгновенно по любому поводу (чаще всего по поводу очередной заброшенной Овечкиным шайбы) и читая эти жаркие дебаты и аргументы каждой из сторон у любого, даже хорошо подготовленного, стороннего наблюдателя голова начинает пухнуть не хуже, чем у Полиграфа Полиграфовича от немцев и конгрессов. В связи с этим я решил предложить поистине Шариковское решение данных дебатов - пусть и игнорирующее массу аргументов любой из сторон, зато простое, очевидное и, главное, основанное не на эмоциях и личных пристрастиях, а сугубо на математическом подходе (математических подходах, ибо предложено их будет три на выбор, хотя лично я считаю наиболее объективным один). Более того, в конце текста будет ссылка на реализацию предложенных простых математических моделей в формате MS Excel, в котором любой желающий может сравнить хоть Джо Мэлоуна (лучшего бомбардира НХЛ в первом сезоне в истории Лиги, если вдруг кто не знает) с его однофамильцем Райаном Мэлоуном (ну, нужно как-то приплести игрока Тампы, если это всё-таки клубный блог).

Но для начала побольше теории, и почему предложена именно такая (такие) математическая модель, в чем их преимущества и недостатки и почему лично я считаю одну из трех предложенных математических моделей наиболее приближенной к объективной (говорить о полной объективности в принципе нельзя - я надеюсь, вы приступаете к чтению этого текста с однозначным пониманием того, что сравнивается всё же несравнимое, поэтому любые сравнения могут быть объективны лишь частично).

Итак.

В чём в принципе проблема подобных сравнений?

Думаю, почти все ответят на этот вопрос однозначно: в том, что все игроки играют в разных условиях. По хорошему, некорректно сравнивать даже Овечкина самим с собой из временного периода, когда Вашингтоном рулил Брюс Будро (со средней результативностью команды 3,787 шайб за игру в сезоне 2009-10) и когда командой рулил Дэйл Хантер (2,707 шайб за игру в среднем в сезоне 2011-12) или Уэйна Гретцки из Эдмонтона 1983-84 (5,575 шайб за игру) с Уэйном Гретцки из Рэйнджерс 1997-98 (2,406 шайб за игру). А тут ещё и сравнить их между собой, когда у одного пик карьеры пришелся на 1980-е, а у второго - на 2010-е.

Собственно, эти абсолютно верные аргументы и звучат с обоих сторон в спорах о том "кто всё таки круче". Причем эти аргументы в споре использует и та и другая сторона в зависимости от личных пристрастий. 

И как с этой проблемой справиться?

Совершенно верно. Как сказал Полиграф Полиграфович из эпиграфа к посту - "взять всё, да и поделить!".

Иными словами, сделать математическую модель, которая на бумаге (в нашем случае - в Экселе) приводит сравниваемых к единому знаменателю. Ставит их в равные условия (условно равные).

И вот, давайте попробуем построить такую модель. Я сначала построил такую модель (три модели), а потом уже сел за написание данного поста. Основной упор в данном тексте я сделаю на модель, которую считаю наиболее приближенной к объективности и на чем она основывается, но остановлюсь и на двух других "ответвлениях" от этой модели, благо они в том или ином виде включены в основную.

Какова наша цель в данном упражнении? По сути провести "статистическую уравниловку". "Уравнять" между собой команды внутри одного отдельно взятого сезона и в дальнейшем "уравнять" между собой сезоны. Иными словами создать "сферического коня в вакууме", при котором все команды (мы говорим сейчас именно о командах) абсолютно равны между собой. При этом, я бы сразу хотел бы отметить, что есть статистический показатель, которого критически не хватает (за большую часть истории НХЛ, его фиксируют последние лет 25 только) для ещё более точной "уравниловки".

О чём речь? Чтобы сравнить игроков разных команд и разных поколений нам необходимо сделать достаточно суровое допущение, не сделав которое, никакая математическая модель работать не будет. Мы допускаем, что если мы говорим о чистом таланте хоккеиста, то он его проявляет в полной мере всегда, а единственным, что его сдерживает - являются внешние условия в виде команды в которую он попал. Да, реальная жизнь - совершенно о другом и подобных сдерживающих факторов может быть масса, но в данном случае мы ими пренебрегаем. 

Более конкретно рассмотрим на примере сезона 1983-84. В таблице ниже - результаты всех команд, участвовавших в том регулярном чемпионате (да, ещё одна оговорка - считаем только по регулярным чемпионатам, ибо плей-офф - это совершенно иной зверь):

Из этой таблицы видно, что результативность Эдмонтона в том сезоне была 5,575 голов за игру, в то время как Нью-Джерси (да-да, "Команда Микки Маусов") забивали только 2,888 голов за игру. 

Теперь реальный исторический факт (вкратце, более подробно можно почитать на английском, например здесь, а вообще эту историю в разных источниках рассказывали тысячу раз, так что за подробностями - гугль в помощь). Уэйн Гретцки не был задрафтован. Это все знают. Почему? Потому что у него был "персональный контракт" с Питером Поклингтоном (владельцем Эдмонтона), а не с самой командой и благодаря этому, в то время как юниоры, игравшие в сезоне 1978-79 в WHA вместе с Гретцки, вышли на драфт 1979 и многие из них сменили клубы, в то время, как Гретцки остался с Ойлерс. Подписать такой контракт Поклингтон уговорил Гретцки использовав всего один аргумент: "если ты выйдешь на драфт, то тебя возьмут под общим первым номером и ты будешь играть в Колорадо Рокис". Колорадо Рокис на тот момент были ужасны (последние в Лиге и, соответственно, общий первый номер на драфте 1979) и беспросветны. Под первым номером они в итоге вместо Гретцки взяли Роба Рэмэджа, а перед сезоном 1982-83... Переехали в Нью-Джерси и стали Дьяволами. 

Таким образом, представленная выше табличка в свете этого исторического факта начинает сверкать несколько иными красками: Эдмонтон с Уэйном Гретцки - самая результативная команда сезона, в то время как Нью-Джерси, команда, где Уэйн Гретцки мог бы оказаться, если бы не хитроумие и изворотливость Поклингтона - худшая по результативности команда. Соответственно, если рассуждать в сослагательном наклонении (а у нас сегодня весь пост именно в нём), то по идее, если бы не "персональный контракт", то скорее всего в сезоне 1983-84 Эдмонтон бы был существенно менее результативной командой, в то время как Нью-Джерси - существенно более результативной. При этом, мы также понимаем, что в Нью-Джерси у Гретцки бы скорее всего не оказалось в партнерах Ярри Курри, Марка Мессье, Пола Коффи, Гленна Андерсона и далее по списку, а значит команды не просто поменялись бы местами в списке результативности. Скорее всего результативность Эдмонтона без Гретцки бы снизилась, но не так катастрофически, чтобы стать худшей командой НХЛ в этом контексте, в то время как Гретцки поднял бы результативность Дьяволов, но не сделал бы её самой результативной командой НХЛ в одиночку. И логичным образом, сам Гретцки не набрал бы Нью-Джерси 205 очков в том сезоне, 87 из которых - голы.

Гретцки в том самом матче против &quout;команды Микки Маусов&quout; (фото Брюса Беннетта, GettyImages)

Именно об этом мы и говорим, когда делаем это ключевое допущение для нашей математической модели, чтобы перейти к "статистической уравниловке". Наша модель по умолчанию основана на сослагательном наклонении "если бы", которое, как известно, не терпит история. Но без которого мы никак не обойдемся, если мы хотим сравнивать несравнимое. 

Вывод, что в этой ситуации следует технически сделать с нашей статистической моделью напрашивается сам собой и он достаточно очевиден. Нужно взять среднее количество шайб, забивавшихся в рамках одного сезона всеми командами и сравнить со средним количеством шайб, забивавшихся в рамках этого же сезона отдельно взятой командой. 

Для сезоне 1983-84 это значение получится 3,945. Иными словами, Эдмонтон забрасывал на 1,630 гола больше, чем "статистически уравненная" команда, а Нью-Джерси на 1,057 шайбы меньше

Следующий шаг тоже чуть более чем очевиден и вытекает из ранее написанного (сейчас в мой адрес полетят помидоры, не дожидаясь полученных значений, потому что все уже поняли, что будет дальше), но я тем не менее продолжу.

Чтобы понять как отдельно взятый хоккеист в отдельно взятом сезоне сыграл бы "статистически уравненной команде", нужно вычислить его среднюю результативность, а затем соотнести этот показатель со средней результативностью его команды и средней результативностью всего сезона. 

На примере Уэйна Гретцки, если бы он играл в сезоне 1983-84 не в Эдмонтоне, а в "статистически уравненной" команде. Его фактическая результативность была 1,176 голов за игру в Эдмонтоне с результативностью 5,575 голов за игру. Соответственно, в команде со средней результативностью 3,945 голов, Гретцки забивал бы 0,832 гола за игру. И забил бы таким образом не 87 голов, а "всего лишь" 62 (с учетом округления до целого по правилам округлений).

Богохульство, да, я знаю. Я с самого начала предупреждал, что мы пытаемся сравнить несравнимое при помощи математики. А значит вынуждены вторгаться на территорию альтернативной истории и сослагательного наклонения в попытке "взять всё и поделить" во имя всеобщей коммунистической уравниловки. 

В данном случае автоматически учитывается вклад отдельного игрока в результат команды. Ведь 1,176 от 5,575 - это 21,09% и 0,832 от 3,945 - те же самые 21,09%. Т.е. мы "ослабляем" не роль Гретцки в Эдмонтоне, а самих Ойлерс того сезона, опуская их с недостижимых высот (если вы вернетесь к табличке выше, то обратите внимание, что больше ни одна команда не пробила рубеж в 5 голов за игру, в то время, как Нефтянники приблизились к 6 голам - и при всём уважении к Великому, это не только его индивидуальная заслуга) на более человеческий уровень. Впрочем, я оправдываюсь, тратя на это время и буквы текста.

Следующий шаг нашей "всеобщей уравниловки", чтобы получить возможность сравнить Гретцки и Овечкина тоже вполне очевиден. Мы привели все команды в рамках одного сезона (1983-84) к единообразию результативности, но мы при этом понимаем, что на период "золотых" Ойлерс пришелся расцвет результативности хоккея (на самом деле - нет, были короткие периоды, когда хоккей был ещё более результативным - это во-первых самые первые годы НХЛ, во-вторых период во время второй половины Второй Мировой Войны, но ни были по времени короче, чем десятилетие династий Айлендерс и Ойлерс). В то время как существовала и "Dead Puck Era" или "эпоха капканостроения" на стыке 90-х и 00-х, с провалом результативности (на самом деле - тоже нет, были в истории НХЛ периоды, в том числе более длительные, когда результативность была ниже). 

 

На картинке выше по сути вся история НХЛ, построенная по средней результативности сезонов. Толстая красная линия с маркерами - непосредственно сезоны и их средняя результативность (тот самый "уравнитель"), который мы выбрали в качестве такового в предыдущей части. Тонкая пунктирная красная линия со стрелкой на конце - линия тренда результативности. И как мы видим, если брать исторически в контексте 105 лет (с 1917 по 2022), тренд идёт почти параллельно оси, что означает, что "средняя температура по палате - почти 36,6" все эти 105 лет. Небольшой рост, конечно, наблюдается, но в основном, как и с ледниковыми периодами и периодами глобальных потеплений в истории земли, результативность НХЛ развивается приблизительно по синусоиде вокруг почти прямолинейной функции средней результативности. Правда, у данной линии тренда очень невысокое значение критерия Фишера - достоверности аппроксимации (если считать функцию линейной). Гораздо лучше критерий Фишера показывает себя (в что раз точнее линейной) в случае если задавать описание модели полиноминальной функцией в шести степенях, но для наших целей - это слишком сложно, хотя нет ничего невозможного. Поэтому желающие могут попробовать перестроить модель в предложенном ниже файле с линейной на полиноминальную (хотя бы в третьей-четвертой степени).  

Фактически эта средняя результативность и есть наше "искомое" в задачке по "уравниловке". 

Уравняв все команды внутри отдельно взятого сезона, мы теперь уравниваем все сезоны в истории НХЛ, приводя эту историю к одной линейной функции. Если не углубляться во всю эту математику, то средняя результативность НХЛ за всю её историю составляла 3,025 гола за игру. Поскольку, как я написал выше, критерий Фишера для линейной функции в достаточной степени низкий, в файле ниже я, основываясь на графике средней результативности, на который я нанес "исторические эпохи" (см. выше) разделил эту историю на четыре условно независимых линейных функции. Это, конечно, не полиноминальная функция четырех степеней, но это дает чуть более достоверный результат в исторической перспективе, правда... Не позволяет использовать полученную модель "в лоб" - вы получите четыре различных "статистически уравненных" периода для каждого сравниваемого игрока, приведя их "сослагательную" результативность к конкретному историческому периоду (т.е. "что бы было, если бы Гретцки и Овечкин играли в эпоху Original Six" vs. "что бы было, если бы Гретцки и Овечкин играли в эпоху до Original Six"). В файле ниже вы можете с этим поиграть, может придумаете, как это можно использовать для повышения достоверности всей исторической математической модели, а я пока продолжу рассказ на основе линейной функции, распространенной на всю историю НХЛ.

Собственно, наша модель уже готова. 

Если всё изложенное про нее выше, описать кратко, на пальцах и без математики, то получается следующий вариант сослагательного наклонения:

Предложенная модель позволяет рассчитать количество голов, которые забил бы любой игрок НХЛ на протяжение своей карьеры, если бы все команды на протяжении всей истории НХЛ показывали бы одинаковую результативность.

Мы сделали то, что грозился Полиграф Полиграфович: взяли всё, да и поделили, приведя всё к единому знаменателю и тем самым поставив всех игроков в "равные условия". Математически. На бумаге. В тысячный раз повторю, что задача сравнить несравнимое - в принципе некорректна сама по себе. Давайте об этом не спорить и не писать "автор, их нельзя сравнивать". Я знаю, что нельзя. Но ведь сравнивают. Каждый раз, когда Овечкин забивает очередную шайбу. Я лишь предлагаю математический метод вместо эмоционального, основанного на личных пристрастиях. 

Что в итоге делает модель? 

По сути она делает расчёт в два этапа. На первом этапе она для каждого игрока в проведенном сезоне усредняет его результативность относительно результативности отдельно взятого сезона, а затем полученный показатель усредняет относительно результативности за всю историю НХЛ.

Логичным образом, мы можем ожидать, что для игроков, которые играли в периоды, когда результативность была выше линейного тренда на графике выше - достигнутые результаты снизятся, а для тех, кто играл в периоды, когда результативность была ниже - вырастет. Расчёт выполняется как для голов, так и для передач, но с одной значимой оговоркой относительно последнего. Учет голевых передач был длительное время очень неточным, поэтому для игроков периода "Оригинальной шестерки"  (и уж тем более - раньше) пересчёт голевых передач будет настолько же неточным, насколько и исходные данные. 

Итак, к результатам. Возможно, глядя на график средней результативности НХЛ выше (а возможно и из заголовка поста), вы уже догадались, что в споре Гретцки и Овечкина в рамках данной математической модели побеждает... Горди Хоу.

Вот сравнительные показатели Хоу, Гретцки и Овечкина (по состоянию на окончание сезона 2021-22 - так просто проще считать по уже окончательно завершившимся сезонам, не учитывая текущий сезон, но вы можете дополнить базовую модель данными за 2022-23 и посмотреть как всё изменитсяпо голам (по передачам Гретцки впереди планеты всей был, есть и будет, видимо, по абсолютно любой математической модели):

Иными словами, Гретцки, за счёт того, что играл в команде, результативность которой в свои годы с точки зрения классического гауссова распределения, являлась статистически недостоверной, причём в годы, когда результативность НХЛ в целом была на одном из самых высоких уровней в своей истории не досчитался около 150 голов. В то время как Хоу и Овечкин из-за того, что играли в годы, когда результативность Лиги в целом была ниже исторически средней, наоборот, "приросли" 40-70 голами.

При этом, мы помним, что карьера Овечкина продолжается (и он уже почти достиг той планки, которую наша модель ему насчитала на конец прошлого года), так что шансы обойти Хоу в рамках этой модели, также, как и обойти Гретцки в рамках реальной жизни у него вполне себе хорошие.

Но в отношении Хоу есть один нюанс, который касается отсутствия одного статистического показателя, о чем я предупреждал в начале. Это время на льду. Его начали учитывать в качестве официальной статистики только 90-х. Поэтому, сделать пересчёт результативности игрока на 60 игровых минут (как это делают сейчас) на всю историю не получится. А здравый смысл подсказывает, что во времена, когда игра шла в три (а то и в два, если мы совсем про стародавние времена) звена, лучшие бомбардиры в пересчёте на 60 минут игрового времени забивали существенно меньше, чем лучшие бомбардиры дней сегодняшних. Но, к сожалению, учесть это в этой математической модели не получится по причине отсутсвия данных. Но, тем не менее, чисто интуитивно, получается, что Горди Хоу, игравший по 30-40 минут за игру в лучшие годы (как говорят), сильно просел бы в нашей модели, учитывай мы как-то этот аспект.

На этом, собственно всё. Вот файл, в котором находится описанная выше модель (если файл не открывается, то альтернативная ссылка на Яндекс.Диске - здесь). В файле открываем лист "Любой игрок", вносим туда его реальную статистику и получаем пересчёт.

Небольшая инструкция, как пользоваться файлом на примере Уэйна Гретцки:

 

На этом всё. И не забывайте, что всё это сделано Just For Fun и нельзя на полном серьёзе сравнивать несравнимое.