10 мин.

Оценка действий игроков АПЛ 20-21 на основе новой метрики OBV от StatsBomb

Недавно на StatsBomb была опубликована еще одна статья про модель OBV. На этот раз авторы решили сфокусироваться на ее практическом применении и рассмотрели прошлый сезон АПЛ 2020-2021.

Вообще, OBV (On-Ball Value) - метрика, которая позволяет оценить любое действие на футбольном поле. Ее оценка состоит из двух частей - отдельно оцениваются изменения вероятностей забить и пропустить гол в результате совершенного действия. Далее посчитанные изменения складываются и получается финальное число. Если оценка имеет положительный знак - в результате совершенного действия увеличилась вероятность забить гол и наоборот, если знак отрицательный - то увеличилась вероятность пропустить в свои ворота.

OBV относится к Possession Value (PV)-метрикам - статистикам, анализирующим каждое владение мячом. Подобные метрики не столь новы (самым популярным моделям, например, EPV, уже больше двух лет), но в отличие от общеизвестных xG / xT моделей строятся на основе более продвинутых моделей машинного обучения (например, нейросетей) и уже сейчас все больше используются как в первую очередь клубами, так и провайдерами данных / медиа. Больше технических деталей можете найти в предыдущем посте, а этот пост - об их интерпретации.

Оценка индивидуальных действий игроков с помощью OBV

Матч Вест Хэм Юнайтед — Ливерпуль 31.01.2021

Рассматривается быстрая контратака (1:25) Ливерпуля после неудачного стандарта хозяев. Первый пас Трента на Шакири получил оценку +0.009. Далее Шакири отдает одним касанием диагональ на Салаха. Передача Джердана получила довольно высокую оценку +0.13, что говорит о том, что модель оценивает увеличение вероятности забить гол на 0.13 единиц в результате данного действия.

Также на приведенной картинке отмечено дополнительное действие у швейцарца - carry, которое должно отражать продвижение мяча, но фактически его не было. Здесь вопрос в определениях и процедурах самого Statsbomb’a:

  • Действие carry фиксируется в том случае, если координаты окончания предыдущего действия и координаты начальной фазы следующего действия отличаются.

  • StatsBomb применяет частично (или полностью) автоматическую систему фиксации event-событий, которая анализирует видеоряд с определенной частотой.

Таким образом иногда возможны ситуации, когда система фиксации данных будет делать небольшие ошибки. Здесь она определила чуть разные моменты времени для окончания предыдущего действия и начала следующего, при этом внеся ошибку при измерении координат. В результате для Шакири было добавлено небольшое фантомное действие по продвижению мяча в сторону боковой линии, которое затем было оценено моделью OBV как -0.002. Опять же нужно понимать, что в данном случае основная проблема не с моделью, которая считает оценки, а непосредственно с качеством самих данных.

(Для уточнения информации относительно указанной ошибки я написал сотрудникам StatsBomb в twitter. Мне ответили довольно оперативно, описав вероятный механизм возникновения ошибки и особенности расчета показателя carry, которые были приведены выше. Также стоит напомнить, что для расчета метрики OBV используются данные StatsBomb 360 - относительно новый продукт. Мне уже приходилось слышать от людей, кто успел поработать с 360 данными, что они содержат некоторые неточности. Вероятно, с течением времени точность фиксации будет постепенно повышаться, и, как следствие, будут получаться более точные значения метрики OBV)

Далее Салах обрабатывает мяч первым касанием, направляя его себе на ход в сторону ворот соперника, делает пару шагов и наносит голевой удар. За продвижение мяча при приеме Салах получил +0.05 балов, за последующий удар +0.49, причем, при оценке удара было учтено и то, что мяч летел в створ и то, что мяч был направлен в область, вероятность гола для которой тоже была очень высока (удар в угол). Если бы Салах не попал по воротам, то модель бы присвоила этому действию отрицательную оценку в качестве наказания за неэффективное завершение очень ценной цепочки владения мячом.

Графическое отображение наиболее опасных передач в АПЛ 20-21 по метрике OBV

На картинке ниже рассматриваются только ключевые передачи, которые включают в себя непосредственно ассисты и предголевые пасы (передачи, после которых был сделан голевой пас). Слева представлены 30 таких пасов с наибольшим значением OBV, справа - 10 с наименьшим. Такие передачи получили отрицательные оценки за счет сильного снижения вероятности гола, несмотря на то, что по факту стали ассистами или предшествовали голевой передаче.

Рейтинг лучших футболистов АПЛ 20-21 по суммарному значению OBV (учет всех действий на поле)

В очередной раз видим впечатляющую статистику Грилиша в прошлом сезоне, но отметить я бы хотел другое.

  • Несмотря на то, что в данном рейтинге учитываются все действия на поле, в большинстве своем рейтинг представлен атакующими футболистами (это очевидно - действия на половине соперника оцениваются выше с точки зрения увеличения вероятности забить гол)

  • OBV не смещена в сторону самых очевидных атакующих действий - голов и ассистов, а учитывает все действия внутри атаки.  Например, из топ-6 игроков по системе гол + пас прошлого сезона АПЛ в рейтинге есть только два игрока - Салах и Варди, но отсутствуют Кейн, Бруну, Сон и Бэмфорд

Рейтинг лучших футболистов АПЛ 20-21 по OBV, за исключением: ударов, ассистов и предголевых пасов

Этот рейтинг помогает найти игроков, демонстрирующих высокую эффективность на ранних стадиях атак (buildup фаза, за исключением предголевых передач) и при оборонительных действиях. При этом также учитывались действия вратарей - например, 4-е место в нем занимает Ник Поуп.

Рассмотрим отдельно лидера рейтинга - Джека Грилиша. Его 30 продвижений мяча с наибольшими OBV больше похожи на карту пасов. В прошлом сезоне почти все самые эффективные carries Джек совершал на территории соперника, покрывая при этом огромное расстояние.

Интересно, что средний OBV за матч для Грилиша меняется с 0.58 до 0.39 при исключении ударов, ассистов и предголевых передач. Это означает, что только 0.19 балов из суммарной OBV (не более 33% данной оценки) пришлись на его 16 очков по системе гол + пас. Это довольно важный нюанс, который подтверждает один из тезисов, приведенных выше. Поэтому метрики, подобные OBV,  дают значительно более комплексную оценку и не фокусируются целиком и полностью на оценивании действий в завершающей стадии атаки.

Анализ центральных защитников АПЛ 20-21 по метрике OBV в разрезе пасов и продвижений мяча

На графике ниже по оси x приведены суммарные оценки OBV для передач с игры, по оси y - суммарные оценки для продвижений мяча для центральных защитников.

Можно выделить следующее:

  • Большая группа игроков имеет нулевой или почти нулевой OBV.  Оно и понятно - центральные защитники часто играют поперек поля или же отдают передачи назад вратарю

  • Джон Стоун и Адам Уэбстер оказываются в топе по суммарной OBV по продвижению мяча, при этом второй также демонстрирует относительно высокие показатели по передачам

  • Фабиан Шер и Тиагу Силва оказываются среди лучших по суммарной OBV для передач, имея при этом неплохие показатели оценок продвижения мяча

  • Диего Льоренте находится выше среднего по суммарным показателям, оценивающим продвижение мяча, но получает отрицательное итоговое OBV для своих передач

Сравнение футболистов по качеству передач в финальной трети по метрике OBV

На этом же графике по оси x - значение OBV для каждой передачи в среднем за сезон. Данное значение характеризует эффект от передачи (получаемая "награда" = reward).

По оси y - средний % точных передач в финальной трети поля. Данное значение оценивает качество передач (риск потери = risk).

Такой ракурс позволяет выделить следующие группы футболистов:

  • Низкий риск, низкая награда ( low-risk, low-reward):

Пример - Жезус. Он демонстрирует самые низкие показатели по передачам вперед на финальной трети поля среди всех игроков АПЛ 20-21. Только 5% передач вперед и почти 30% передач назад (по данному показателю - 4-ый в АПЛ). В итоге в среднем за каждый пас он получает достаточно высокую отрицательную оценку по метрике OBV. При этом бразилец хорошо сохраняет владение показывая довольно высокий % точных передач, что опять же объяснимо более частой игрой назад.

  • Низкий риск, средняя награда (low-risk, medium-reward).

Примеры - Гюндоган, Ковачич и Джонс. Они демонстрируют небольшую среднюю эффективность передач, но чрезвычайно высокий процент точности. Если эти игроки получают мяч в финальной трети, то вероятность потери очень мала. При этом они также в среднем будут увеличивать шансы команды забить гол при каждой своей передаче.

  • Низкий риск, высокая награда (low-risk, high-reward).

Пример -  Джек Грилиш. Его авторы предлагают отнести его в отдельную группу. Если оставить футболистов, которые имеют более 80% точных передач в финальной трети, то англичанин вновь опережает других игроков. На этот раз по средней эффективности каждой передачи, при этом имея значительный запас. Из всех игроков Грилиш ближе всех находится к правому верхнему углу графика - зоне, где должны находиться игроки, которые стабильно совершают эффективные действия в финальной трети.

  • Высокий риск, низкая награда ( high-risk, low-reward).

Примеры -  Жота, Родриго и Погба. Они имеют в среднем отрицательный OBV для передач и низкий % точных передач в финальной трети

  • Высокий риск, высокая награда ( high-risk, high-reward):

Пример - Джек Харрисон.  Чтобы понять, как Джек попал в данную область, посмотрим, сколько передач в финальную треть он отдает в среднем за матч. Это 8.5 пасов, что почти в 2 раза меньше, чем, например, у де Брюйне (14,8). Из-за их меньшего количества, его процент успешных пасов выше,  но даже меньшим количеством попыток он создает столько же опасности, сколько и его многие конкуренты. При этом только 63% его передач достигают адресатов, то есть, Джек в основном выбирает очень опасные решения с высоким риском потери. Но те передачи, которые достигают партнеров, значительно увеличивают шансы Лидса на гол.

Позиционный анализ команд с помощью метрики OBV в разрезе конкретного набора действий

Здесь представлена тепловая карта по метрике OBV для двух действий - передачи и продвижения мяча. Все поле разбито на условные зоны. Для каждой зоны считается сумма всех значений OBV по этим двум действиям для всех футболистов данной команды. Далее из полученного значения вычитается среднее по всем клубам для каждой из зон. Яркий красный показывает, что команда значительно лучше других создает опасность из выделенной зоны, а черный цвет - наоборот.

Авторы акцентируют внимание на трех зонах - "зона Грилиша" в Астон Вилле, "зона Трента" в Ливерпуле и "зона Пепа" в Манчестер Сити (штрафная площадь, равномерно окрашенная в розовый цвет), но при желании можно увидеть интересные особенности и по другим командам.

Альтернативные рейтинги

OBV позволяет смотреть на эффективность игроков и команд под различными углами. Ниже приводится еще один пример - составлен рейтинг лучших команд по созданной опасности применительно к конкретному типу действий в АПЛ 20-21.

  • High Passes: Burnley

  • Ground Passes: Liverpool

  • Carries: Manchester City

  • Defensive Actions (Tackles, Interceptions, and Ball Recoveries): Leeds United

  • Headed Shots: Crystal Palace

  • Footed Shots: Manchester City

P.s. последние новости из мира футбольной аналитики можете найти здесь.