8 мин.

CHANCE ANALYTICS. Сайт для футбольных аналитиков

Пока команды отдыхают и готовятся к новому сезону, аналитики не спят, разрабатывая новые модели учета статистики и совершенствуя свои старые модели. Авторы статьи тоже не дремали, разрабатывая новый показатель для оценки игроков.

Речь пойдет о создании модели рейтинга футболистов (pELO). Надеюсь, что тем, кто только пытается разбираться во всевозможных рейтингах, данный пост принесет пользу. А ставочникам может быть даже практическую (хотя я воздержусь).

Для любого составления рейтингов необходимы две составляющие.

  1. Точка отсчета

  2. Учитываемые показатели

К сожалению, для создания игрового рейтинга существуют проблемы, которые новая модель постарается учитывать.

Любые оценки футболистов грешат погрешностями. Часто из-за того, что многие статистические характеристики либо связаны друг с другом (и могут даже перекрывать и дублировать одна другую), либо связаны с общекомандной тактикой и не зависят от конкретного игрока. Наибольшие погрешности связаны с игрой голкиперов и защитников.

Как пример. Статистический подсчет отборов прошлого сезона Эрика Питерса из "Стока": попыток - 106, успешных - 81 (76,4%). У него лучший показатель отборов среди всех защитников Премьер-лиги. Однако любой футбольный болельщик вам скажет, что Эрик Питерс - не самый лучший защитник. В лучших командах нет нужды игрокам обороны на всем протяжении 90 минут матча постоянно вступать в силовое взаимодействие с игроками атаки соперника. Гораздо важнее, насколько игроки обороны могут контролировать мяч, начинать и развивать атаки. И таких проблем в статистической оценке игроков множество.

Для расчета рейтинга было решено рассматривать вклад футболиста в разницу мячей в играх, когда он находился на поле. При этом будут учитываться такие факторы, как проведенное на поле время, сила своей команды и сила команды соперника. При составлении рейтинга игроков в сезоне 2016-17 использовались данные Stratabet по лучшим 5 лигам Европы, Чемпионшипа, Бундеслиги-2 и Эредивизии.

Player ELO (pELO) - рейтинг футболистов на основе модификации системы ELO. Данная система была разработана для того, чтобы оценивать шахматистов с учетом их силы: лучшие игроки имеют больше шансов победить более слабых. Допустим, если разница в рейтинге шахматистов более 200 баллов, то вероятность победы более сильного оценивается в 70%. Сейчас ELO адаптирован под многие виды спорта. Достоинство ELO в том, что он учитывает силу команд, играют они дома или в гостях, с каким счетом закончился матч (победа с преимуществом в один гол оценивается выше, чем разгром в пять мячей).

Как это работает, поясняем на примере. В последнем туре "Ливерпуль" встречался с "Мидлсбро". По ELO рейтинг хозяев - 1713, у гостей - 1396. Преимущество мерсисайдцев 317 баллов. "Ливерпуль" победил 3:0. Однако его рейтинг увеличился всего на 3 балла, а рейтинг "Мидлсбро" уменьшился на те же 3 балла. Если бы выиграл "Мидлсбро", то он получил бы за победу 27 баллов, а рейтинг "Ливерпуля", соответственно, уменьшился бы на те же 27 баллов.

Аналогично работает модель pELO. Однако, т.к. речь об отдельных игроках, можно вести речь о вкладе каждого игрока в конечный результат выступлений всей команды.

Вот график aPELO (актуальный рейтинг игрока по ELO) Кевина де Брюйне за прошедший сезон.

01

Точкой отсчета выбрано условное число в 100 баллов перед началом чемпионата. Это, конечно, представляет проблему: изначально силы участников соревнований не были равны. Решено было оставить условный начальный рейтинг для естественного развития системы с течением времени. По мере развития событий в сезоне рейтинги игроков менялись и к концу сезона стали отражать объективную ситуацию в Премьер-лиге. По конечным результатам aPELO такова лучшая двадцатка игроков.

02

В Топ-20 вошли, как и ожидалось, игроки "Челси" и "Тоттенхэма", учитывая финальную позицию их команд. Но можно пойти дальше. Вышеуказанный aPELO не учитывает командный рейтинг, поэтому, чтобы получить более глубокое представление, мы разработали новую модель, учитывающую ожидаемый результат.

Expected pELO (xPELO) - ожидаемый рейтинг.

В футболе конечный результат часто может не раскрывать положение дел на поле. Мы все видели игры, в которых доминировала одна команда, постоянно оказывая давление на ворота соперника и создавая опасные моменты, а потом соперник реализовывал свой единственный момент после рикошета и побеждал. Можно посчитать, что другая команда не заслуживала победы. Для этого и существует оценка по xG, которая сейчас представляет собой лакомый кусок в мире футбольной аналитики. xG оценивает опасность создаваемых командой моментов. За исходные данные берется очень много показателей (сейчас учитывается состояние поля и даже погода в момент проведения матча), но для наглядности просто сравните вероятность гола. Кто из игроков скорее забьет: игрок получивший мяч без помех в районе 11-метрой отметки и видящий перед собой только голкипера, или игрок, бьющий с 30 метров из-за штрафной и имеюший перед собой семерых защитников, перекрывающих все ворота. Соотвественно, если нападающий в сезоне постоянно получает пасы в удобном положении непосредственно перед воротами, он должен забить больше мячей, чем игрок, постоянно бьющий из-за линии штрафной. Хотя статистика исправно будет засчитывать обоим футболистам равное количество ударов по воротам.

Используя xG можно посчитать, насколько одна из команд больше заслуживала победу, чем другая, также можно посчитать возможности отдельных игроков забить гол. Например, в победном для "Лестера" сезоне, количество забитых голов Джеймсом Варди аномально превосходило показатель xG. На основе этой модели было предсказано, что его скорострельность понизится до "нормы", что и произошло в следующем сезоне. Это не значит, что модель xG никогда не ошибается: как и любая другая разрабатываемая модель, она продолжает совершенствоваться и, соответственно, уменьшать свои погрешности. Однако, пока это лучшее, что есть в анализе действий команд или отдельных игроков на настоящее время.

С учетом новых данных можно вновь посмотреть на рейтинг игроков и сравнить первоначальные показатели aPELO с предполагаемыми xPELO. Снова обратимся к графику де Брюйне.

03

Получается, что на самом деле Кевин де Брюйне выступил ниже ожидаемого. Таблица xPELO передвигала его на первое место в Топ-20.

04

В Топ-20 вошли футболисты "Челси", "Тоттенхэма" и "Манчестер Сити". Это понятно. Ну и?..

Эти рейтинги могут помочь, когда команды встречаются друг с другом. Посмотрите xPELO и aPELO каждой команды в матче конца сезона между "Тоттенхэмом" и "Манчестер Юнайтед". Можно сравнить вероятность исхода и то, что предлагается на рынке ставок.

05

Шпоры были фаворитами и выиграли 2:1. А если бы Ибра не был травмирован и смог сыграть вместо Руни, а Валенсия вместо Туанзебе? Можно внести в сравнительную таблицу этих игроков и посмотреть предполагаемый результат с учетом рейтингов pELO.

06

Оказывается, что выход этих футболистов только незначительно увеличил бы шансы гостей на победу.

pELO не только позволяет оценивать возможности той или иной команды. Можно на трансферном рынке рассмотреть вероятность закрыть у себя слабые места за счет игроков, имеющих более высокий рейтинг. Возможно на рынке присутствуют футболисты, которые просто недооценили?

Не следует, конечно, сегодня всецело довериться рейтингу pELO. Следует помнить, что его отсчет начинается со стартом сезона и в дальнейшем, с продолжением накопления статистики, точность будет возрастать. Рейтинг будет постоянно обновляться по всем восьми лигам. Обновления будут содержать таблицы, предварительные оценки результатов и вероятность совпадения. В блоге* будет серия статей, как использовать pELO в букмекерских ставках.

(с) По статье Peter McKeever and Raven Beale - "Introducing pELO Ratings" (Football, pELO, Player Performance Model). Peter McKeever, June 25, 2017.

P.S. Комментарий к статье. Arthur Oerip - One thought on “Introducing pELO Ratings”

Хотя метод расчета рейтинга pELO имеет четкие критерии оценки, которые непрерывно обновляются по ходу сезона, он не дает однозначного толкования, насколько хорошо играет тот или иной игрок. Он просто фиксирует вклад каждого игрока в итоговый результат встречи. Для первичных данных или для ставок такой метод может быть применен, однако он не показывает, насколько хорошо играют игроки. В pELO есть вероятность недооценки футболистов в команде, которая использует неподходящую для них тактику или вынужденых играть на непрофильных позициях.

При нынешнем развитии статистики гораздо важнее являются показатели действий игрока, когда он владеет мячом и его действий без мяча, когда его партнер владеет мячом и когда мячом владеет соперник. Такой анализ сейчас проводится в большинстве клубов. Применяя подобный анализ вместе с методом pELO можно создать наиболее точный рейтинг сравнения игроков.

(с) В статье использованы данные сайта StrataData, which is property of Stratagem Technologies.

__________

*CHANCE ANALYTICS  - это веб-сайт, предоставляющий шансы энтузиастам футбольной аналитики (отсюда и название) получить более широкое представление. В настоящее время мы работаем над попыткой получить доступ к подробным источникам данных, которые мы будем предоставлять тем, кто постоянно пишет для сайта.

CHANCE ANALYTICS (сайт), CHANCE ANALYTICS (твиттер), CHANCE ANALYTICS (фейсбук).