Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT
Введение
В футбол все сильнее проникают технологии, появляются новые метрики на основе машинного обучения, которые дают возможность проводить более качественную оценку действий футболистов на поле. Новые метрики охватывают все больше игрового контекста при оценивании того или иного игрового эпизода и позволяют выделять игроков, эффективность и качество игры которых зачастую невозможно измерять стандартными статистическими показателями, такими как голы или ассисты, и даже более продвинутыми метриками, такими как xG, xA, xGBuildUp и др., которые не всегда могут давать максимально объективную картину за счет того, что учитывают очень мало игрового контекста, в котором совершается действие.
Сегодня я предлагаю рассмотреть результаты отчета, подготовленного сотрудниками Лёвенского университета, занимающимися машинным обучением и спортивной аналитикой. В данном отчете приводится рейтинг лучших футболистов АПЛ первой половины текущего сезона для различных игровых позиций по метрикам VAEP и xT. Рейтинг представлен в виде сборной команды игроков с наивысшими значениями рассматриваемых метрик, которые усредняются для 90 минут игрового времени. В качестве игровой схемы была выбрана 4-2-3-1 как наиболее часто используемая схеме в текущем сезоне. Также в отчете рассматриваются лучшие новички АПЛ сезона 20-21 и рейтинг молодых игроков до 21 года, демонстрирующих по указанным метрикам самые высокие показатели. В качестве бонуса будут рассмотрены две голевые передачи, получившие наивысшие оценки по все тем же метрикам.
Перед началом демонстрации результатов будет полезно вспомнить некоторые характерные особенности рассматриваемых метрик и основные отличия между ними без глубокого погружения в особенности вычислений.
Метрика VAEP
Для расчета данной метрики используется машинное обучение. Модель, которая считает VAEP, оценивает текущее действие футболиста, рассматривая совершенное действие и два предыдущих действия, которые определяют контекст игры, и рассчитывает вероятность забить и пропустить гол в течение следующих 10 действий.
Далее модель оценивает то, как изменились вероятности забить и пропустить гол относительно предыдущего действия (которое было рассмотрено аналогично текущему) и складывает эти изменения, в результате чего получается финальная оценка.
В качестве примера: оценка действия по метрике VAEP +0.05 означает, что в результате совершенного действия вероятность забить гол в течение следующих 10 действий увеличилась на 0.05 и наоборот, оценка -0.05 означает, что совершенное действие увеличивает шансы противоположной команды забить гол на 0.05 в течение такого же количества последующих действий.
Подробное описание можете найти в этой статье.
Метрика xT
В основе данной метрики лежит статистическая модель, которая рассматривает игровой процесс в виде последовательности переходов между различными игровыми состояниями. Такая модель называется марковской моделью или моделью на основе цепей Маркова.
При построении данной модели все поле разбивается на зоны. Для каждой зоны вычисляется показатель xT (ожидаемая угроза), который является оценкой того, что через несколько следующих действий (обычно 5 действий) будет забит гол, при условии, что игрок с мячом находится в текущей зоне.
Далее для каждого совершенного действия вычисляется разность значений xT для конечной и начальной зоны. Полученная разность и является финальной оценкой, которая ставится для совершенного действия. Иными словами метрика xT отражает то, как изменяется вероятность забить гол в течение следующих 5 действий, если в результате совершенного действия мяч перешел из одной зоны в другую.
Подробное описание можете найти в этой статье.
Сравнение VAEP и xT
Обе метрики основаны на описании состояний игры. Подход используемый в xT, привязан к конкретному расположению игроков на поле (строгая привязка к зонам), в то время как VAEP описывает состояние игры на основе трех последних действий и лучше охватывает игровой контекст. По качеству описания состояний игры – метрика VAEP оценивается более высоко.
Метрика xT легче интерпретируема в отличие от VAEP из-за того, что в ней состояния описываются на основе привязки к зонам. Оценки VAEP основаны на алгоритмах машинного обучения, которые учитывают большое количество параметров и в большинстве случаев не дают возможности простой интерпретации получаемых результатов (т.е. нельзя объяснить, почему та или иная последовательность действий получила какую-то определенную оценку).
Метрика VAEP оценивает не только изменение вероятности забить гол (атакующая оценка действия), но и изменение вероятности пропустить гол в свои ворота в результате действия (оборонительная оценка действия), чего не учитывает xT. Это приводит к тому, что VAEP дает сбалансированную оценку действия с учетом риска потерять мяч и пропустить гол в результате совершенного действия.
Метрика xT учитывает только действия по продвижению мяча (пасы, кроссы, ведение мяча и т д) и игнорирует оборонительные действия, такие как подкат или перехват мяча, что уменьшает охватываемый ею игровой контекст, в сравнении с VAEP, которая учитывает широкий спектр игровых действий.
Обе метрики строятся на основе event-данных (данных о событиях), которые отражают пространственные координаты только одного игрока, совершающего действие в данный момент, но не учитывают информацию о других игроках, что делает эффективность метрик, построенных на таких данных, несколько ниже в сравнении с метриками на основе трекинговых данных (или на основе контекстуальных/контекстных данных, которые сегодня представлены на рынке компанией StatsBomb)
Лучшие игроки по метрикам VAEP и xT
Обе метрики сходятся в определении трех лучших атакующих полузащитников. На флангах больше всего очков набирают Джек Грилиш и Каллум Хадсон-Одои. И если попадание капитана Астон Виллы с 15 очками по системе гол + пас на конец первого круга не вызывает никакого удивления, то присутствие Хадсона-Одои (игрока молодежной сборной Англии) с 3 выходами в старте и 3 результативными очками может удивить рядового болельщика АПЛ, который мало следит за игрой синих.
Справедливости ради стоит отметить, что основными конкурентами Грилиша за место левого вингера в команде лучших по метрике VAEP были Сон Хын Мин, набравший 17 очков по системе гол + пас на конец первого круга, и Диогу Жота, для которых итоговые значения метрики оказались несколько ниже.
Лучшим в центре по рассматриваемым метрикам оказался конечно же Бруну Фернандеш, входящий на конец первого круга также в 1% лучших полузащитников Европы Top-5 лиг за последние 5 лет по метрике Open Play xGAssisted (xA), которая определяет среднее ожидаемое количество ассистов созданных "с игры". За матя Бруну зарабатывал в среднем 0.36 xA.
Последним игроком, присутствие которого в команде лучших подтверждается как VAEP так и xT, оказался вратарь Бернли - Ник Поуп, являющийся на сегодня основным в воротах сборной Англии. Безусловно, рассматриваемые метрики в какой-то степени отражают и степень снижения вероятности пропустить гол в свои ворота в результате действий голкипера, и увеличение вероятности забить гол за счет длинных и качественных передач вперед, но оценка вратаря - не является основной задачей данных инструментов, поэтому, просто принимаем данный результата к сведению и идем дальше.
Лучшим форвардом по метрике VAEP оказался Харри Кейн, по метрике xT - Уилфрид Заа. Данное различие может быть объяснено спецификой рассматриваемых метрик. Кейн в текущем сезоне стал опускаться гораздо глубже для поиска мяча и выполнения большого количества работы плеймейкера. Если раньше его амплуа в качестве чистого нападающего в Тоттенхэме было только на бумаге, а фактическую игровую роль можно было определить как "ложную девятку" или "чистую десятку", то в период Моуриньо эпизодами Харри оказывается настолько глубоко, что его функционал соответствует даже "восьмерке" в некоторые моменты, в результате чего преобладающее игровое амплуа для Кейна можно описать в виде некоторой гибридной позиции со смесью 10 с 8 (или глубокой десятки) и 9.
В новом игровом амплуа Кейн демонстрирует великолепную результативность по ассистам, которые, однако, в большинстве случаев принимаются его партнерами за пределами или на границе штрафной площади, и это обуславливает низкие значения метрики xT, которая оценивает действия, строго привязывая их к определенной зоне игрового поля.
У Заа же наоборот, некоторые сделанные ассисты принимаются партнерами в непосредственной близости у ворот, в зонах с высоким значением xT, что и обуславливает более высокие показатели чем у Кейна. Кроме того, высокий процент точности передач в финальной трети поля у Заа также способствует повышению значений метрики xT.
Отсутствие игроков Ливерпуля в списке лучших по метрике VAEP является дополнительным отражением спада, наблюдаемого у красных в текущем сезоне. Несмотря на это, ТАА и Джордан Хендерсон все таки попадают в список лучших по метрике xT, причем показатели Трента упали по отношению к прошлому году за тот же период на 50%.
Самым главным удивлением для меня стало отсутствие Кевина де Брюйне в команде лучших по метрике VAEP, по которой его значения оказались ниже, чем у двух других центральных полузащитников - Илкая Гюндогана и Джеймса Уорд-Прауса. По метрике xT КДБ попал в список лучших, получив себе в пару Хендо.
Также стоит отметить одну интересную особенность, метрика VAEP, давая сбалансированную оценку действиям игроков, в которой в том числе учитывается оборонительный характер совершенного действия, выделяет обоих центральных защитников сильнее, чем крайних, в отличие от xT.
Лучшие трансферы по метрикам VAEP и xT
Данные рейтинги рассматривают игроков, подписанных летом 2020 года, но не учитывают тех, кто вернулся из аренды. Лучшим по метрике VAEP стал португалец Диогу Жота, уступив одну сотую Грилишу при конкуренции за место в команде лучших. Высокие значения в том числе показывает новичок Астон Вилы Бертран Траоре. Замыкает тройку Хамес Родригес, усиливший Эвертон в этом сезоне и показывающий яркую и эффективную игру на старте чемпионата, но затем пропустивший весь декабрь из-за травмы, что, возможно, не позволило продемонстрировать колумбийцу более высокие результаты.
Хамес является единственным игроком попавшим в оба рейтинга и также замыкает тройку лучших по метрике xT. На втором месте по создаваемой угрозе попадает Хаким Зиеш, зарабатывая в среднем за матч на одну сотую больше xT, чем Хамес, а возглавляет рейтинг лучших трансферов по xT новичок Лидса Рафинья Диаз, получая в среднем за матч 0.21 xT.
В данном месте можно отметить тот факт, что приведенные оценки по метрике xT перекрывают более узкий диапазон значений, что усложняет качественное сравнение игроков друг с другом на основе указанной метрики. Данная особенность хорошо отражена на командах с лучшими игроками, где для VAEP разница между максимальным (Грилиш) и минимальным (Поуп) значениями равна 0.39, а для xT, аналогичная разница равна 0.26. Такая же картина наблюдается для рейтинга лучших трансферов - по метрике VAEP между первым и третьим местом разница составляет 0.22, а по метрике xT и вовсе 0.03. Наблюдаемая особенность является следствием все той же зонной специфики, учетом небольшого числа действий игроков и слабым охватом игрового контекста для метрики xT, в сравнении с метрикой VAEP, учитывающей 21 тип различных действий и рассматривающей каждый игровой эпизод, основываясь на трех последних действиях совершенных в игре.
В тоже время данная особенность частично обуславливается учетом различного количества действий в будущем (VAEP номинально - 10, xT - 5), что в том числе влияет на различие в итоговых вероятностях гола (в статье про Цепи Маркова и про метрику xT можно наглядно наблюдать указанную особенность).
Рейтинг молодых талантов по метрикам VAEP и xT
Каллум Хадсон-Одои является главным героем сегодняшнего обзора. Помимо попадания в команду лучших игроков АПЛ по метрике VAEP, он также занимает первую строчку в рейтинге молодых талантов по обеим метрикам.
(Внимательный читатель заметит, что значение метрики xT в рейтинге молодых талантов и в команде лучших игроков отличается на одну сотую - 0.28 против 0.27, но предлагаю не обращать большого внимания на закравшуюся ошибку в приведенных результатах, которая может быть обусловлена как учетом большего или меньшего количества игр для одного из рейтингов, так и просто опечаткой).
Другой игрок, на которого стоит обратить особое внимание, - новичок Вулверхэмптона Педру Нету. Португалец также попадает в оба рейтинга лучших молодых талантов, причем по метрике VAEP занимает третье место, пропуская на второе место Фила Фодена, постепенно закрепляющегося в основе Манчестер Сити и демонстрирующего очень хороший футбол в текущем сезоне. По метрике xT Нету замыкает пятерку, пропуская вперед Букайо Саку, Риса Джеймса и ТТА.
Лучшие передачи по метрикам xT и VAEP
Две передачи, которые будут рассмотрены ниже, получили самые высокие оценки по метрикам xT и VAEP в первом круге АПЛ. Они наглядно отражают специфику расчета каждой из метрик и особенно преимущество VAEP перед xT с точки зрения охвата игрового контекста.
Батшуайи со своей единственной голевой передачей в текущем сезоне в матче против Фулхэма получил самую высокую оценку по метрике xT для совершенного действия. Такая оценка обусловлена зоной, в которой Заа замкнул прострел. Для данной зоны значение xT является самым высоким на футбольном поле, и при вычитании из xT для рассматриваемой зоны значения xT, которое соответствует зоне, из которой Батшуайи отдавал передачу, получается очень высокое итоговое значение метрики xT.
Второй ассист в нашем рейтинге в отрыве от игрового контекста выглядит довольно обычной передачей в разрез в свободную зону и по метрике xT получает не самую высокую оценку, но метрика VAEP, для оценки которой используются модели машинного обучения, позволяет учесть быстрый ввод мяча Мартинесом, начальную точку поля, в которой получил мяч Грилиш и последующее продвижение мяча игроком Астон Вилы на скорости, время матча, в которое была отдана передача (75 минута) и текущий игровой счет (Арсенал 0:2 Астон Вилла), что в совокупности с набором дополнительных параметров, описывающих данную игровую ситуацию, делает финальную передачу на Олли Уоткинса гораздо более ценной с точки зрения увеличения вероятности забить гол, нежели, если бы передача отдавалась в другой игровой ситуации.
Т.е. исходная вероятность гола перед пасом на Уоткинса была относительно низкой, ввиду того, что Грилиш уже совершил длительный дриблинг на скорости в финальном отрезке матча, пройдя почти половину поля, когда его команда уже имела преимущество в два мяча, а в момент приема Уоткинсом сильно увеличилась, т.к. еще 10 секунд назад мячом владел Арсенал, и то время, за которое мяч был доставлен из своей штрафной в штрафную соперника, говорит о том, что обороняющая команда навряд ли успела перестроится после фазы атаки, что дополнительно добавляет шансы забить гол из точки с номинально неплохим уровнем xG.
Вывод:
По моей субъективной оценке рейтинги на основе метрики VAEP более качественно отражают реальность и более эффективно оценивают игровые эпизоды на футбольном поле. Футбольная аналитика будет двигаться в сторону инструментов на основе машинного обучения, о чем в том числе свидетельствует анонсированная недавно метрика OBV от StatsBomb, которая по описанию, приведенному на презентации StatsBomb Evolve, очень похожа на метрику VAEP, только будет строится на основе новых контекстуальных данных о событиях StatsBomb 360, которые обогащены широким спектром дополнительной информации и учитывают в том числе координаты игроков, находящихся без мяча.
P.s.
Оригинал обзора - здесь.