«Прогнозы — это такая вещь, которую лучше всего делать после матчей!». Вторая часть ловли удачи
Удача есть, и её больше, чем вы думаете!
Недавно я рассмотрел понятие случайности в футболе. К моему счастью, эта статья вызвала небольшой ажиотаж у читателей, который вызвал мнения с различных ракурсов. Это всегда хорошо, когда есть любые интересные обсуждения, мне приятно! Возможно, не всё было понятно, но тогда смело пишите об этом мне, я с удовольствием оформлю пост заново, еще больше упрощая его!
Однако перейдём к теме этой статьи. В этом посте я буду рассматривать удачу с точки зрения именно результатов игр. Я затрону одно понятие из экономики и приложу её на футбольные игры. Должно получится как минимум интересно!
Данные остаются такими же, как и в предыдущем исследовании, за исключением того, что у меня не было информации о матчах в РПЛ до сезона 2012/13. Поэтому рассмотрение удачи в РПЛ происходит именно начиная с упомянутого сезона.
Опять же, упомяну, что все регрессии используемые на графиках, выбраны, чтобы показать тренд, а не предсказать будущее, выборки малы, и предсказания могут запросто оказаться ошибочными.
Каким образом экономика может быть связана с футболом?
Для более простого объяснения всегда нужно давать пример. Возьмём, к примеру, чемпионат Испании 2017/18. Для того, чтобы преобразовать имеющиеся данные в нужные для исследования, мне потребовалось несколько махинаций. В итоге, я получил нужную для меня выборку, состоящую из так называемых триплетов. Для упрощения понимания будем называть их тройниками. Тройник - это 3 некоторые команды (например: Барселона, Реал Мадрид и Атлетико Мадрид).
Для каждого тройника в сезоне Ла Лиги 2017/18 я учёл результаты, которые были в игре между 1-ой и 2-ей командой, 2-ой и 3-ей командой и 1-ой и 3-ей командой из тройника.
В экономике, а ,если быть точнее, в теории рационального выбора есть такое понятие, как транзитивность. Сейчас всё объясню! Транзитивность - это на самом деле обычное логичное правило. То есть, допустим у нас есть 3 неких товара. Допустим, первый товар лучше второго, при этом также второй товар лучше третьего. Тогда, если соблюдается транзитивность, то первый товар должен обязательно оказаться лучше второго. Если же первый товар оказывается хуже третьего, то условие транзитивности не соблюдается.
Есть ещё одно важное понятие - полнота. Это означает, что мы можем любой товар сравнить с любым другим. Выполнение полноты обычно требуется вместе с выполнением транзитивности.
Таким образом, если заменить слово "товар" на слово "команда", мы приложим данные две аксиомы на футбольные матчи. Полнота соблюдается, так как каждая команда играет с каждой, и соответственно, сравнить их становиться возможным. Более важно даже то, что команды играют как дома, так и в гостях, что будет важно для данного исследования. А вот транзитивность - это главный камень преткновения.
Каким образом оценивается удача?
Общее количество всех возможных тройников в одном сезоне какого-нибудь чемпионата вычисляется по следующей формуле:
Кол-во = N * (N-1) * (N-2), где N - количество команд, участвующих в сезоне.
То есть, например, для той же Ла Лиги 2017/18, в которой участвуют 20 команд, количество всевозможных тройников = 20 * 19 * 18 = 6840. Всего таких тройников с 1995 года из 5 лиг получилось ровно 719472.
На картинке выше, например, показано как можно из 4 команд составить 6 пар (правда в нашем случае эти пары нужно удвоить, чтобы посмотреть, как бы команда арбузов сыграла с командой бананов у себя дома в Арбузии). В качестве пространства для юмора вам предлагается придумать названия для команд-фруктов самим.
Стоит также упомянуть, что некий тройник с командами, например, Барса, Реал и Атлетико рассматривался не один раз. То есть в списке были тройники с такими же тремя командами, но был поменян порядок записи команд в тройнике. Это важно, потому что команды играют друг с другом не только дома, но и в гостях, и результаты при этом могут различаться.
Так как я хотел бы рассмотреть строгое понятие транзитивности (то есть товар строго лучше другого, никакого равенства быть не может), для определения удачи я решил убрать все тройники, в которых была хотя бы одна ничья в результатах. Таких тройников оказалось 286840 (39,9% от всех тройников).
Мы можем утверждать, что, если все команды обладают какими-нибудь разными навыками, и никакой удачи вовсе нет, то все тройники должны давать транзитивный результат. Иными словами, во всех тройниках либо присутствуют только домашние победы, либо только гостевые. Ведь, если первая команда дома обыгрывает вторую, а вторая - дома третью, то логично утверждать, что первая команда дома обыграет третью (по поводу матча в гостях между первой и третьей командой утверждать не буду, возможно, следующий анализ будет по этому поводу). Также верно, что если вторая команда обыграет первую в гостях, а также третья обыграет вторую в гостях, то ожидается, что третья обыграет первую в гостях (опять же без утверждений о домашней игре!).
Тогда процент нетранзитивных (нелогичных) тройников из всех будет равен 0.
Теперь сосчитаем максимальную возможную долю нетранзитивных (удачных) тройников из всех. В каждом тройнике есть три результата (1-2,2-3,1-3). Обозначим домашнюю победы в матче буквой Д, гостевую - Г. Нетранзитивные тройники - это тройники с результатами Д,Д,Г и Г,Г,Д. Если во всех матчах играет роль только удача, то вероятность победы домашней команды равна вероятности победы гостевой команды равна 0,5 (так как мы убрали ничью из анализа). Вероятность того, что результаты в тройнике буду Д,Д,Г равна 0,5 * 0,5 * 0,5 = 0,125 (так как вероятность независимых событий, происходящих одновременно - это перемножение вероятностей этих событий). Такой же результат в случае результатов Г,Г,Д. Вероятность или первого события, или второго - это сумма их вероятностей. То есть, 0,25.
Получается, 25% - это максимально возможная доля нетранзитивных (удачных) тройников из всех.
Результаты
Такой процент удачных тройников из всех я посчитал для каждого сезона (всего таких получилось 115, 5 лиг по 23 сезона). Для удобства понимания будем умножать наши получаемые из сезонов проценты в 4 раза, чтобы было так:
0% - все решает навык, 100% - все решает удача. Таким образом будет решать, какой процент удачи присутствовал в том или ином сезоне.
Посмотрим на графическое отображении удачи в чемпионатах Топ-5 с 1995 года.
Конечно же, опечатка, в названии графика не Топ-6, а Топ-5.
Все лиги идут примерно одинаково, за исключением бросающейся в глаза Серии А, в которой транзитивность в играх между тремя командами выполняется наилучшим в плане логики образом. Также Серия А - единственная лига, которая имеет положительный тренд увеличения удачи в лиге, хотя и не такой значимый (в среднем за 22 года удача увеличилась примерно с 57 до 59,5; 4,4%).
АПЛ опять показывает одни из самых безудачных показателей среди Топ-5. К слову, средний показатель удачи у АПЛ равен 62,9%, что является 4-м показателем среди Топ-5 лиг. Выше: Бундеслига (70,5%), Лига 1 (69,5%), Ла Лига (68%), ниже только Серия А (58%). Это опять же является подтверждением предыдущей мысли о том, что АПЛ - не самая непредсказуемая лига уже с точки зрения другого критерия удачи.
Среди 5-и самых удачных сезонов стоит отметить присутствие сразу 4-х сезонов Бундеслиги (10/11, 95/96, 00/01, 97/98). Также есть Ла Лига 99/00.
Среди 5-и самых скилловых сезонов есть 2 сезона Серии А (05/06, 17/18), 2 сезона АПЛ (07/08, 16/17) и Ла Лига 16/17.
Как с удачей в России?
В России были рассмотрены матчи, начиная с сезона 2012/13. Рассмотрим маленькую выборку РПЛ вместе с прошлым графиком:
Хоть выборка и состоит из 6 сезонов, среднее в РПЛ оказалось равным 63,9%. Если брать только сезоны 2012/13-2017/18, этот показатель оказывается на 3-м месте после Лиги 1 (66,9%) и Бундеслиги (64,8%) и перед АПЛ (59,5%), Серией А (56,9%) и Ла Лигой (56,4%). Средние показатели упали, как и видно на линиях тренда. Как мы можем, видеть в последние годы АПЛ является только 4-ой удачной (случайной, непредсказуемой) лигой среди Топ-6.
Сразу скажу, что данные выводы делаются обо всей лиге/лигах в целом, но об отдельных командах или группы команд (конечно, я намекаю про топ-4/топ-6 в АПЛ), поэтому фактор отдельных сильных команд не рассматривается отдельно. Результаты получаются по всем командам из лиги.
Во второй раз доказано, что удача живёт рука об руку с футболом, и даже в больше, чем в половине случаев. Но разве было бы нам интересно наблюдать за этим действом, если бы не было элемента случайности? Если бы все команды, как запрограммированные роботы, обыгрывали бы всех по абсолютно логичным результатам, только благодаря уровню навыков, было бы нам интересно смотреть футбол? Думаю, что нет, поэтому пускай удача и дальше будет радовать нас неожиданными сенсациями, а вас, читателей, интересными обсуждениями и наблюдениями!
P.S.: Опять же, фидбэк очень важен, поэтом старайтесь плюсовать/минусовать, делиться мнение в комментариях или в личку в ВК: https://vk.com/nikitos7barbos.
Фото: https://www.matburo.ru/, https://pikabu.ru/ /Loneyjoi, www.uefa.com/, https://www.ua-football.com/,