Новые метрики для оценки оборонительных действий в футболе. Основа - трекинговые данные и нейросети (Часть 1)
На конференции MIT Sloan Sports Analytics 2021 было представлено несколько работ, связанных с футбольной тематикой. Обзор на одну из публикаций вы могли читать ранее в моем блоге. В той работе были приведены результаты исследования данных АПЛ за несколько сезонов, которые показали, что в некоторых ситуациях удар из-за пределов штрафной является наиболее правильным и наиболее эффективным решением, с точки зрения получения максимальных шансов забить гол находясь во владении мячом, ввиду того, что дальнейшее продвижения мяча не приведет к увеличению xG.
Описываемое исследование было основано на данных о событиях. Это широко используемый тип данных в футбольной аналитике. Именно на таких данных сегодня строятся все самые популярные метрики в футболе: xG, xA, xT и т д. Данные о событиях описывают только те действия на футбольном поле, которые совершаются игроками с мячом, следовательно, такие данные охватывают очень мало игрового контекста, что особенно важно при оценке оборонительных действий.
Ниже приводится пример, который ярко отражает ограниченность данных о событиях применительно к оценке эффективности защитников.
В рассмотренном игровом эпизоде Ван Дейк образцово отыграл выход 2 в 1. Данный момент отражает ту часть футбола, которая долгое время оставалась вне статистических рейтингов, ввиду отсутствия инструментов, позволяющих измерять качество оборонительных действий игроков.
Если разбирать эпизод на атомы, то можно увидеть в нем множество мельчайших деталей.
1. Вирджил оценивает начальную фазу игрового момента, исходные позиции игроков, направления и скорость их движения. Также он должен держать в голове амплуа игроков, участвующих в эпизоде, и их рабочие ноги. На основе мгновенной оценки эпизода он выбирает свою оптимальную позицию.
2. Ван Дейк располагается между атакующими игроками так, чтобы перекрывать потенциальный пас на Сона и в тоже время сохранять возможность накрыть Сиссоко, находящегося с мячом, в случае если тот явно попытается улучшать позицию для удара и начнет уходить на скорости в сторону ворот.
3. Затем происходит ключевой момент при подходе к штрафной. На видео можно наблюдать, как Ван Дейк притормаживает и делает еле заметное движение назад в сторону Сона, максимально усложняя пас на корейца и в тоже время заставляя Сиссоко принимать решение играть эпизод самому, убирая под нерабочую левую ногу. При этом Вирджил оставляет себе возможность накрыть удар француза или же сделать его максимально неудобным, навязав давление в последний момент.
В принципе, в таком позиционировании нет ничего необычного, это хрестоматия игры при выходе 2 в 1 - нельзя бросаться на игрока с мячом, нужно плассироваться перед атакующими игроками, контролируя обоих, и занимать оптимальную позицию, максимально снижая шансы передачи себе за спину, т.к. это значительно увеличит вероятность гола. В определенный момент, когда либо игрок с мячом начнет явно улучшать позицию для удара и примет решение решать эпизод самостоятельно, либо же, когда расстояние до ворот будет критичным и станет очевидно, что у атакующего игрока в следующее мгновение останется только одна опция в виде удара - защитник должен создать максимальное давление на игрока с мячом, чтобы тот наносил удар из максимально неудобной позиции, в идеале - заблокировать удар или отобрать мяч.
Ван Дейк сделал свою работу великолепно и продемонстрировал высокий профессионализм, но данные о событиях отразили разобранный эпизод сухой строчкой - missed shot (удар мимо), никак не оценив действия голландца.
Разрешить данное ограничение могут трекинговые данные, которые все активнее начинают применятся в футбольной аналитике. Такие данные позволяют фиксировать пространственные координаты всех игроков и мяча в каждый момент времени. Трекинг гораздо лучше описывает игровой процесс, но анализ таких данных становится более сложным и требует применения более интеллектуальных инструментов.
Еще одна публикация по футболу, представленная на все той же конференции, была основана как раз таки на трекинговых данных. Авторы работы являются сотрудниками компании StatsPerform и занимаются футбольной аналитикой на основе машинного обучения. В своей работе они предложили ряд новых метрик, которые позволяют оценивать оборонительные действия футболистов, совершаемые без мяча.
Краткое введение в новые метрики
Метрика xReceiver
Первая модель, предложенная авторами, получила название xReceiver (xR). Данная модель для каждого игрока команды, владеющей мячом, предсказывает вероятность того, что именно ему будет адресована передача в следующий момент времени. Важно понимать, что здесь проводится попытка именно предвосхитить намерение игрока с мячом и определить наиболее вероятное решение (не обязательно самое правильное с точки зрения шансов на успех).
На видео ниже можно посмотреть изменение метрики xR для всех игроков в динамике голевого эпизода матча ЛЧ 2018-19 Бавария - Ливерпуль.
Метрика xPass
Данная метрика для каждого игрока команды, владеющей мячом, оценивает вероятность успешности паса. Другими словами - она оценивает насколько сложно сделать все возможные передачи в текущем игровом эпизоде и какие из них являются менее рискованными, а какие более.
На видео ниже можно посмотреть изменение метрики xP для всех игроков в динамике все того же голевого эпизода, в котором Мане забил гол, после передачи Ван Дейка.
Метрика xThreat
В первую очередь стоит отметить, что xThreat никак не связана с метрикой xT, которая активно используется сегодня футбольными аналитиками, хотя называется точно также.
xT, которую разработал Карун Сингх, строится над данными о событиях и оценивает для каждой выделенной зоны футбольного поля вероятность того, что через следующие несколько действий будет забит гол (детали по xT можете найти здесь)
xThreat строится на основе трекинговых данных и для каждого игрока команды, владеющей мячом, оценивает вероятность того, что в течение следующих 10 секунд он нанесет удар по воротам, если ему будет сделана передача в данный момент (здесь никак не оценивается непосредственно вероятность гола или xG)
На картинке ниже можно наблюдать, что значения метрики xThreat для игрока в штрафной площади и игрока, находящегося перед финальной третью, почти равны, что еще раз говорит нам о том, что рассматриваемая xThreat отличается от широко используемой сегодня xT, для которой значения очень сильно зависят от зоны футбольного поля.
На видео ниже можно посмотреть пример изменения метрики xThreat внутри голевой атаки после перехвата мяча одной из команд. В данном случае рассматривается отличный игровой эпизод от тех, которые приводились ранее.
Коротко о подходе, который использовался для построения новых метрик
Все рассмотренные метрики строятся с использованием графовых свёрточных нейронных сетей. И если использование свёрточных НС сегодня широко распространено при обработке неструктурированной информации, к которой можно отнести трекинговые данные, то использование графа для описания футболистов на поле - это новый подход, который ранее не применялся в индустрии.
Трекинговые данные, которые использовались в данной работе, можно представить в виде набора кадров. Для 1 секунды футбольного матча доступно 10 таких кадров (частота измерения - 10 Гц). Каждый кадр описывается графом, который состоит из узлов и ребер. Узлы - футболисты, ребра - связь между соседними футболистами.
Глубже вдаваться в детали не имеет смысла. Можно только отметить, что данный подход оказался довольно успешным и помог разрешить ряд трудностей, которыми обычно сопряжена работа с трекинговыми данными.
Полученные результаты
Использовав описанный выше подход и трекинговые данные 1200 матчей нескольких сезонов из TOP-5 европейских лиг авторы рассчитывали метрики xReceiver (xR), xPass (xP) и xThreat (xT - далее под xT понимается именно новая метрика xThreat).
На основе полученных результатов авторы создали программный инструмент под названием Defensive Impact (Оборонительное воздействие). С помощью данного инструмента можно автоматически в режиме реального времени определять различные типы оборонительных действий, совершаемых игроками без мяча, и количественно оценивать эффективность таких действий.
Типы оборонительных ролей
1. Ball-orientated defending (pressure)
Оборонительные действия, при которых защитник или атакующий игрок, участвующий в прессинге, на большой скорости сближаются с игроком противоположной команды, который владеет мячом. Основная цель такого действия - увеличить шансы выбить мяч, совершить отбор или заставить противника сделать пас в менее опасную область поля. В результате такого действия - передача совершается в зону с меньшим xT.
2. Man orientated defending
Оборонительные действия, при которых игрок обороняющейся команды сближается с соперником, находящимся без мяча. Основная задача обороняющегося футболиста - оказать максимальное давление и накрыть игрока, которому может быть отдана передача в следующий момент времени. В результате - действие направленно на то, чтобы снизить xR у соперника.
Ниже приводится пример, в котором демонстрируется основной результат проделанной авторами работы. Предложенная модель позволяет давать оценку оборонительным действиям без мяча! Еще раз напомню - ранее данные о событиях позволяли оценивать только оборонительные действия, в которых происходило непосредственное взаимодействие с мячом - подкат, перехват, отбор.
Оценка оборонительных действий
1. Синяя команда атакует. Игрок 5 получил мяч. Модель определяет для него двух наиболее вероятных адресатов (наибольшие значения xR) - игроки 9 и 10.
2. В следующий момент времени в данном игровом эпизоде модель оценивает наиболее высокое значение метрики xT для игрока 10, т.е. пас на данного игрока - является довольно перспективным решением и имеет высокую вероятность того, что владение закончится ударом по воротам.
3. В следующий момент времени модель выделяет сразу несколько игроков обороняющейся команды, которые активно участвуют в эпизоде.
Серый игрок 4 - непосредственно играет по 10 атакующей команды, т.е. он автоматически выполняет роль - Man orientated defending.
Серый игрок 6 в данном эпизоде - Man orientated defending. Опускаясь ближе к своему партнеру, он создает дополнительное давление на 10 соперника и перекрывает изначально возникший коридор для передачи, страхуя своего партнера от ситуации в которой он останется 1 в 1 против атакующего игрока. В результате, его действия направлены на то, чтобы снизить xR для 10.
Серые игроки 2 и 8 в данном эпизоде играют по игроку с мячом, их роль - Ball-orientated defending. Они стремятся сделать так, чтобы 5 сделал передачу игроку с меньшим xT.
4. В заключительный момент перед последующей передачей картина незначительно меняется. Теперь игрок обороняющейся команды с номером 8 меняет свою роль на Man orientated defending и еще до момента совершения передачи начинает движение в направление 10 атакующей команды.
В результате, совокупные действия защитников привили к тому, что мяч был отправлен игроку на фланге, для которого вероятность нанесения удара через 10 следующих секунд была оценена как 0.05 (5% шансов такого исхода). Рассматриваемая атака закончилась неопасным кроссом в штрафную. Теперь остался последний шаг - как-то оценить степень снижения опасности из-за действий игроков обороняющейся команды, которые принимали активное участие в эпизоде, но прямо никак не взаимодействовали с мячом.
6. Авторы предложили следующий подход. Если в результате активных действий обороняющихся игроков передача была сделана игроку с более низким значениtм xT, относительно изначально существовавших вариантов для продолжения атаки, то:
значение метрики xT для наиболее опасного адресата делится поровну между группой футболистов, играющих по мячу в данном эпизоде (Ball-orientated defending). В рассмотренном примере по мячу играл только один игрок - 2 номер, поэтому он зарабатывает +0.15 xT (трактовка данной оценки - игрок предотвратил 0.15 ударов своими действиями).
точно также xT делится поровну между группой игроков, играющих "по игроку" в данном эпизоде (Man orientated defending). В рассмотренном примере по мячу играли три футболиста - 4, 6 и 8. Каждый игрок получается по 0.05 xT за данный эпизод.
На видео ниже данный пример разбирается в динамике.
Общий итог по первой части работы:
1. Впервые у футбольных аналитиков появился инструмент для измерения качества оборонительных действий (defensive value), совершаемых без мяча. Теперь мы можем количественно оценить, как определенные действия защитников на поле могут вынуждать игроков противоположной команды, находящихся на мяче, принимать те или иные действия. Само значение defensive value измеряется через метрику xT, физический смысл которой определяется как количество предотвращенных ударов.
Ниже приводится суммарная оценка оборонительных действий после окончания матча для рассмотренного ранее примера. Помимо итоговой оценки также можно наблюдать какой тип оборонительных действий преобладал для каждого из рассмотренных игроков.
Преобладание ярко-оранжевого цвета говорит о том, что футболист чаще всего создает давление на игрока противоположной команды, находящегося с мячом, т.е. такой игрок чаще выполняет роль - Ball-orientated defending.
Светло-оранжевый цвет соответствует оборонительным действиям, при которых футболист создавал давление на игроков, являющихся потенциальными адресатами передач. Такие действия соответствуют роли - Man orientated defending.
Игрок, находящийся на первом месте по defensive value, предотвратил 0.64 удара по своим воротам оказывая давление на игроков соперника на мяче и 0.15 ударов, играя по игрокам без мяча.
2. Учет того, как игрок действует без мяча, какие оборонительные действия совершает или не совершает, позволило более детально определять его игровой функционал и исполняемую на поле роль.
Ранее авторы работы предложили подход для классификации футболистов по их функционалу на основе данных о событиях. Описание работы можно найти здесь. Предложенный подход был очень перспективным, но имел явный недостаток, обусловленный типом используемых данных. При рассмотрении только действий на мяче теряется большое количество информации, что усложняет процесс классификации игроков.
Добавление информации о действиях футболистов без мяча позволило создать более точный классификатор футбольных ролей. Ниже для уже рассмотренного ранее примера приводится описание ролей, которые выделили авторы и соответствующие оценки оборонительных действий за один матч.
В своей работе авторы получили еще ряд интересных выводов и предложили новые концепеции для применения в футбольной аналитике, в которых более подробно раскрывается назначение метрики xP. Продолжение будет во второй части обзора.
Материалы:
Оригинал публикации - Making Offensive Play Predictable - Using a Graph Convolutional Network to Understand Defensive Performance in Soccer.
Видео с Pro Forum, где работа была представлена впервые на широкую аудиторию.
Видео с Friends of Tracking, на котором представлено более детальное обсуждение работы.
Новые метрики для оценки оборонительных действий в футболе. Использование Disruption map (Часть 2)