«Взять удачу за хвост». Почему АПЛ уже давно не самая непредсказуемая лига?
Хорошо, что перед матчем кидают монетку только, чтобы узнать, чьё начало.
Футбол - это тот вид спорта, где удача показывает своё лицо полностью, ничего не скрывая. Можно вкладывать миллиарды долларов в команду, но случайность никуда не денется. Конечно, если есть случайность то есть и обратная сторона. В эту неслучайную (будем называть её скилловую, от английского слова skill - навык, умение) сторону и вкладываются миллиарды, чтобы максимизировать импульс от этой сокровенной части футбола.
Вопрос о том, каким образом точнее всего измерить эту удачу, конечно, остаётся открытым, но некоторые вещи на данный момент можно проанализировать. Безусловно, для этого понадобятся несколько статистических навыков, а также навыков программирования. Данные же, которые понадобятся для качественных выводов есть в открытом доступе (ссылочки буду давать в самом конце поста).
Сенсации, которые происходят каждый месяц по несколько раз - есть ни что иное, как явления, бОльшей частью объясняемые удачей. Каждый матч содержит случайность, какой-то больше, какой-то меньше. Чтобы более качественно ощутить этот эффект, конечно, стоит взять намного больше информации, чем несколько отдельных матчей. Для анализа я собрал данные по играм в Английской Премьер-Лиге, Ла Лиге, Серии А, Лиге 1, Бундеслиге и Российской Премьер-Лиге, начиная с сезона 1995/1996 и по наше время. Лучшая лига мира оказалась настолько лучшей, что данным по ней в открытом доступе я, к сожалению, не нашёл.
Сразу скажу, что все регрессии, приведенные в этой статье основаны на маленьких выборках, поэтому скорее созданы для визуализации тренда, нежели несут предсказательную силу.
Каким образом оценивается удача?
«Это футбол, чёрт возьми!» - Алекс Фергюсон после победы над «Баварией» в финале Лиги чемпионов в 1999 году. Возможно, таким образом тоже можно оценить удачу, но я пошёл другим путем.
К примеру, возьмём чемпионат Англии сезона 2017/18. Для начала оценим реальную таблицу по итогам данного турнира:
Для того, чтобы проанализировать различие команд в скилле (пока мы предполагаем, что чемпионат зависит от навыков), посчитаем дисперсию набранных очков. Все расчёты, чтобы не засорять вам чтение, я положу в конце этой статьи. Кому интересно, добро пожаловать! В данном чемпионате дисперсия оказалась равной 349,15. Сам по себе этот показатель ничего нам не говорит, однако в сравнении с другими сезонами и лигами он будет представлять собой показатель разброса очков среди всех участников. То есть, чем больше будет дисперсия, тем больше будет разброс команд от среднего показателя очков за чемпионат, тем меньше плотность в итоговой таблице.
Давайте посмотрим, какие чемпионаты имели наименьшие и наибольшие разбросы в очках среди своих участников:
Как мы можем, заметить две таблицы являются отражением двух эпох в клубном футболе из Топ-5 Европы. На смену плотным, интригующим чемпионатам пришли лиги, в которых либо чемпион и компания знатно отрываются от остальных, либо отчаянный аутсайдер собирает несколько очков, либо оба события вместе взятые. Лига 1 99/00 характеризуется тем фактом, что между 5-м и 16-м (вылетевшим) местом было всего лишь 7 очков. Самый же неплотным является чемпионат Испании 14/15. Чемпионство "Барсы", между 1-м и 20-м местом 74 очка, и борьба до последнего тура между "Барсой" и "Реалом".
Также я вычислял дисперсию для чемпионатов нынешнего сезона, а именно для всех, кроме французского и испанского (так как первый круг в них ещё не закончился полностью на момент работы с данными). Для нынешнего сезона я брал очки после первого круга и умножал дисперсию на 4 (Очки умножаются на 2, а дисперсия умножается на число в квадрате).
Это может показаться удивительным, но, если все команды сыграют во втором круге, как в первом то в конце сезона мы сможем увидеть 2 чемпионата с наибольшими дисперсиями с 1995 года. Это АПЛ с потенциальным показателем равным 550,16! и Серия А (475,4). Вот вам и непредсказуемость АПЛ.
Если брать плотность чемпионатов, то в ТОП-10 входит сразу 5 сезонов Лиги 1 (помимо указанных в таблицах еще 01/02, 04/05 и 06/07), а также 3 Бундеслиги (еще 95/96) и 2 Ла Лиги (еще 01/02). Среди первых 10 чемпионатов с наибольшим разбросом очков сразу 4! сезона АПЛ (еще 07/08, 13/14) и Серии А (еще 13/14), а также 2 сезона Ла Лиги. Ради интереса можете сами посмотреть таблицы вышеперечисленных чемпионатов в указанные года. Олдфагам также рекомендуется напрячь память и вспомнить баталии тех времен.
Вы мне скажете, мол, так это ж выбросы, чего нам голову паришь. Хорошо, давайте посмотрим ситуацию по чемпионатам на дистанции всей моей выборки:
Вот он, суровый русский футбол! Прём против системы! Мы можем наблюдать положительный тренд (по морали он, конечно, не положительный) во всех лигах из Топ-5. В среднем с 1995 года в элитных лигах разброс увеличился примерно со 140 до 290, то есть в 2! раза. Конечно, всегда будут находится выбросы в ту или иную сторону, но на дистанции ситуация и правда печальная. Чемпионаты становятся менее непредсказуемыми, разрыв становится больше.
Насчёт относительно небольшой дисперсии в РПЛ можно сказать то, что там меньше команд. Однако на тренд укомплектованность лиги не влияет, поэтому очевидно незначительно увеличение плотности в нашей лиге, что не может не радовать. Я уверен, что даже если взять скорректированную дисперсию на количество команд, результаты значительно не изменятся. Но, как говорится: "Доверяй, но проверяй".
Корректированная дисперсия = (Дисперсия * 16) / (кол-во команд в чемпионате)
Как мы можем заметить, картины очень схожи, разве, что доминирование плотности РПЛ перестало быть таким громадным. Среднее изменилось с 120 до 240, что картины не меняет, то же двукратное увеличение.
В чем же удача, скажи, наконец?
Удача... Она рядом, стоит лишь заглянуть в средние очки за игру. Для определения навыка, который является полной противоположностью удаче, будем брать средние очки за игру (Общее кол-во очков/кол-во игр). Вполне себе адекватный показатель навыков команды (который можно легко достать в открытом доступе :) ).
Допустим у всех команд одинаковый скилл (то есть получается, что исход чемпионата будет решать только судейство Айтекина удача). Тогда посчитаем, какой окажется дисперсия очков в этом случае и затем поделим её на реальные результаты, который мы уже обсуждали выше. Все расчёты опять же в конце.
Возьмём для примера тот же Чемпионат Англии 2017/18. Итоговая теоретическая дисперсия оказывается равной следующему выражению:
Для того, чтобы найти данную дисперсию в численном выражении нам надо найти вероятности домашней победы, ничьей и гостевой победы для нашего выбранного чемпионата. Вероятность, на самом деле, - это ни что иное, как количество определенных случаев из всех возможных. То, что нужно. Возьмем все матчи АПЛ 17/18 и посчитаем (в процентах) сколько из 100% домашних, гостевых побед и ничьих.
Результат оказался таков: 173 домашние победы / 99 ничьих / 108 гостевых побед. В процентах это соотношение таково: 45,5% / 26,1% / 28,4%. Получается, если подставить все вероятности, дисперсия очков для данного чемпионата при равных силах команд будет равна 62,55.
Как мы помним, реальная дисперсия этого чемпионата равна 349,15. Если поделить теоретическую дисперсию на реальную, а ещё взять от этого корень (тем самым мы найдем среднеквадратичное отклонение, которое нам больше подойдёт для интерпретации), то получается 42,33%. Это есть наш показатель удачи. Иными словами, примерно 42% игр, событий, набранных очков в прошлой АПЛ были набраны случайным образом, никак не зависящим от навыков команд.
Результаты
По такому же принципу были рассчитаны проценты удачи для всех чемпионатов. Я не стал брать скорректированную дисперсию, потому что помимо реальной дисперсии мне надо было бы корректировать и теоретическую дисперсию, поэтому всё бы сократилось. Рассмотрим распределение удачи в динамике на нашей выборке:
Конечно, логична смена тренда относительно прошлых графиков, ведь, чем больше разброс в лиге, тем меньше соотношение теоретической и реальной дисперсий, то есть удачи. Сама удача в чемпионатах из Топ-5 постепенно убывает, доказывая, что навык играет все бОльшую роль в играх элитных лиг. Однако, данное изменение может быть связано с сильным увеличением навыка у богатых, сильных команд, а не у всей лиги в целом, что подтверждает увеличение разрыва в таблицах. Однако, всё же, чем меньше удача в футболе, тем оно и лучше с точки зрения прагматизма, но хуже с точки зрения романтики.
Взглянем на самые удачные и скилловые чемпионаты с 1995 года:
Таблицы, в целом, схожи с таблицами по дисперсиям. Конечно, это объяснимо простыми расчётами. Впрочем, на 4-е место среди скилловых лиг вышла АПЛ сезона 2007/08. "МЮ" по-научному доказан крутым, а "Челси" мастерски не выиграл чемпионат в последнем туре.
Среди 50 самых удачных чемпионатов с 1995 года АПЛ имеет всего лишь 5 своих сезонов (2-е место после Серии А - 3 сезона). Среди 50 самых скилловых чемпионатов АПЛ имеет 15! своих сезонов (1-е место с отрывом в 2 сезона от Серии А и 6 сезонов от 3-ей Ла Лиги). Так что, благодаря данному анализу, можно смело говорить, что АПЛ это не про удачу и непредсказуемость. Возможно, в отдельных матчах она проявляется, но скорее всего, это просто раскрученный факт, который всё же был опровергнут данными.
Будь-то рикошет или свист трибун, эти факторы мы наблюдать не можем. Удача действительно имеет место быть, и с очень хорошим процентом. И как же, чёрт возьми, приятно иногда насладиться очередной сенсацией, а ведь без удачи этого никак не может быть.
Смиритесь, а лучше наслаждайтесь этим прекрасным видом спорта!
Ссылки:
1. https://understandinguncertainty.org/node/61 - статья, которая помогла расчётами, они все там есть. Правда сама статья на английском.
2. http://www.football-data.co.uk/downloadm.php - данные.
Если есть какие-то вопросы, то вот он я: https://vk.com/nikitos7barbos
Фото: https://sport-express.ru/AFP, globallookpress.com