Распределение Пуассона — прогнозируем количество голов в футболе
Наконец-то появилось свободное время и сегодня, как и обещал в предыдущей статье, я поделюсь с вами моделью вычисления вероятностей количества голов в футболе через распределение Пуассона.
Пуассон — это французский физик и математик, живший в 18-19 веках, который разработал то самое вероятностное распределение случайных величин в процентном соотношении из заданного спектра независимых друг от друга значений, которые мы сейчас и используем в прогнозировании футбольных матчей.
На первый взгляд тема может показаться сложной, но, если вы хотя бы поверхностно знакомы с высшей математикой, то суть модели будет для вас понятна достаточно легко. Как и в прошлый раз основной материал для своей статьи я взял с ресурса Prognoznado.ru, вот ссылка на первоисточник.
Не будем расписывать модель распределения Пуассона до мельчайших деталей, а обрисуем ее смысл максимально сжато и понятно.
Для вычисления вероятностей количества голов, которое может забить каждая из встречающихся в матче команд, понадобится:
статистика голов в домашних матчах и на выезде по чемпионату за прошлый полный сезон в котором выступают данные команды;
статистика голов в домашних матчах и на выезде для встречающихся команд;
формула распределения Пуассона.
Но сначала, в лучших традициях, небольшое отступление для рекламы :) Друзья! Все, кому хоть как-то интересен спортивный беттинг, хотел бы порекомендовать этот рейтинг надежности букмекерских контор. Помимо объективности самого рейтинга и подробного детального описания обзора каждого букмекера, отметил для себя большое количество фильтров, с помощью которых игроки могут подбирать для себя наиболее подходящие конторы.
И так продолжаем нашу тему. Для первого пункта статистика необходима для того, чтобы рассчитать среднее количество голов за игру в чемпионате, которое команда забивает в домашнем матче и на выезде. Рассчитывается этот показатель достаточно просто. Берется количество всех забитых голов хозяевами за полный сезон и делится на общее количество матчей в чемпионате. Аналогично с гостевыми командами.
Предположим показатели среднего количества голов за игру в прошлом сезоне АПЛ составили для:
команды-хозяев — 1.492;
команды-гостей — 1.207.
Соответственно, среднее количество голов, которое пропустила команда за игру в прошлом сезоне, составило для:
команды-хозяев — 1.207;
команды-гостей — 1.492.
Второй пункт аналогичен первому за исключением того, что подобный расчет нам нужно провести для команд, которые сойдутся в предстоящей игре. Период игр здесь стоит брать не сильно большой, но и не маленький, подойдет 35-40 последних игр.
В статье для примера берется матч между Тоттенхэмом Хотспуром и Эвертоном, прошедший 5 марта 2017 года. Игровой отрезок — 38 матчей, то есть каждая из этих команд сыграла по 19 игр. Рассчитываем среднее количество забитых и пропущенных голов за матч для данных команд.
Для Тоттенхэма Хотспура в домашних играх:
среднее количество забитых голов — 1.842;
среднее количество пропущенных голов — 0.789.
Для Эвертона в матче на выезде:
среднее количество забитых голов — 1.263;
среднее количество пропущенных голов — 1.316.
Для чего мы рассчитывали данную статистику? Это необходимо, чтобы рассчитать так называемые показатели силы атаки и силы обороны для каждой из команд. Данные значения понадобятся для прогнозирования вероятного количества голов, которое будет забито каждой командой исходя из статистики.
Рассчитываем силы атаки и обороны для Тоттенхэма Хотспура:
сила атаки — 1.235 (1.842 / 1.492);
сила обороны — 0.654 (0.789 / 1.207).
Аналогичным способом рассчитываем силы атаки и обороны для Эвертона:
сила атаки — 1.047 (1.263 / 1.207);
сила обороны — 0.882 (1.316 / 1.492).
Теперь прогнозируем количество голов для команд. Формула довольно проста — силу атаки команды умножаем на силу обороны ее соперника и умножаем на среднее количество голов за матч в сезоне хозяевами/гостями. Далее то, что у нас получилось:
Тоттенхэм Хотспур вероятнее всего забьет голов — 1.625.
Эвертон — 0.826.
Далее самое интересное — формула Пуассона. Не буду от себя ничего выдумывать, скопирую текст из статьи, как есть:
Формула распределения Пуассона: P(x; μ) = (e - μ) * (μ * x) / x!, где
х – случайная переменная, вместо которой необходимо поочередно указывать количество голов от 0 до 5.
μ – величина вероятности, которую мы вычислили ранее для Тоттенхэма Хотспура (1.625) и Эвертона (0.826).
e – число Эйлера, приблизительное значение 2,71828.
x! – факториал числа х.
В статье подробно приведены расчеты для данного примера, кому интересно переходите по ссылке. У нас получилось, что самый вероятный счет в матче между Тоттенхэмом Хотспуром и Эвертоном, это 1:0, вероятность такого результата составила 14%.