11 мин.

Оценка эффективности игры в защите. Анализ действий команд без мяча. Учет фактора «домашнего» поля. АПЛ 2020-2021

На последней конференции от StatsBomb помимо приглашенных участников свои работы также презентовали сотрудники компании. С интересным докладом выступил Уилл Морган – второй человек по Data Science в компании.

На этот раз специалисты StatsBomb’а предложили способ оценки игры команд при обороне на основе 360 данных.

Оборонительные действия футболистов почти невозможно оценивать на основе чистых event данных. Ключом является информация об игроках без мяча. Сегодня в индустрии наметились два пути для решения данной задачи – использование трекинга или расширенных event-данных. StatsBomb решили пойти по второму пути, начав собирать контекстуальные event-данные (360 данные), на основе которых и были разработаны две модели, представленные в докладе.

Модель №1

Первая модель для каждого действия с мячом во владении прогнозирует вероятности трех возможных исходов – владение закончится ударом, владение будет коротким (закончится через 5 сек) или же владение будет долгим (продолжится более 5 сек). Данная модель строится на основе графовых нейронных сетей (ранее StatsPerform презентовала ряд оборонительных метрик на основе аналогичного подхода и трекинговых данных). Такой подход является более сложным, чем в модели OBV, например, но позволяет более точно фиксировать информацию об игровом контексте.

Результаты модели демонстрируются с двух ракурсов:

1. На уровне одного матча

Анализируется игра между Лидсом и Ливерпулем в рамках текущего сезона АПЛ (2021-09-12). Отдельно рассматриваются примеры игровых эпизодов для которых модель прогнозировала каждый из трех возможных исходов как наиболее вероятный.

Левая картинка: синие кружки - футболисты Лидса, красные - Ливерпуля. Белый цвет - игрок Ливерпуля на мяче. В рассмотренном игровом эпизоде футболисты Лидса прессингуют Ливерпуль на его половине.

Предварительно были посчитаны средние вероятности каждого из исходов за некоторый исторический промежуток (один или несколько полноценных сезонов). В среднем игроки совершают действия, которые оканчиваются "коротким владением", 24 раза из 100, т.е. вероятность такого события 0.24. Для длинной цепочки владения - 0.52, для владения с ударом - 0.23.

Каждый раз, когда футболист находится на мяче, модель выдает три значения вероятности для текущего игрового эпизода. Далее результаты модели сравниваются со средними значениями и в качестве наиболее вероятного исхода выбирается тот вариант, для которого наблюдается самая большая разница относительно среднего.

В данном примере модель прогнозирует высокую вероятность “короткого владения” для Ливерпуля, которая оказывается значительно выше среднего (0.33 против 0.24). Это значит, что для красных увеличиваются шансы потеряют мяч в следующие 5 секунд.

Полученная оценка указывает на эффективность противника в прессинге или создаваемом давлении (т.е. эффективность оборонительных действий соперника оценивается через изменение вероятности потери мяча для команды во владении). Типовые ситуации для высокой вероятности “короткого владения” – игрок на мяче находится под прессингом или же соперник перекрывает все возможные опции для передачи.

Картинка по центру: модель прогнозирует высокую вероятность “длинного владения” для команды на мяче - 0.67 против 0.52. Модель как бы “видит” потенциальных адресатов для футболиста Ливерпуля с мячом, которым довольно легко будет сделать пас и продолжить владение. Повышение шансов продолжить текущее владение можно оценить как низкоэффективные действия соперника с точки зрения созданного давления.

Правая картинка: модель прогнозирует высокую вероятность “владения с ударом” - 0.26 против 0.23. Повышение вероятности такого исхода также косвенно указывает на низкую эффективность оборонительных действий соперника.

2. На уровне всего сезона

Сначала авторы оценили среднюю эффективность оборонительных действий для всех команд АПЛ сезона 20-21. Они разделили все поле на 6 зон и для каждой зоны посчитали среднюю вероятность “короткого владения” в данной зоне по всем клубам.

Далее они посчитали такую же вероятность, только для каждой конкретной команды. Например, они взяли Лидс и для всех соперников Лидса в каждой из 6 зон с помощью модели посчитали вероятность потерять мяч в течение пяти секунд после каждого совершенного действия. Далее они сложили все вероятности и разделили на количество матчей. В результате получили среднюю эффективность оборонительных действий только для одной команды.

Затем они вычли из командных показателей среднее по лиге и получили тепловую карту, представленную ниже. Основное назначение данной визуализации - найти интересные тенденции, которые наблюдаются у команд по ходу всего сезона.

Красный цвет - зоны, в которых команда довольно эффективно оказывает давление на соперников, что часто сопровождается потерями мяча. Для данных зон характерна высокая вероятность “короткого владения” у соперников. Синие зоны - наоборот, в данных зонах более вероятно длительное владение у соперника. Для всех указанных команд рассматриваются моменты игры без мяча. Справа - собственные ворота, слева - атакующие команды на мяче.

Сильнее всего на представленных результатах выделяется Лидс. Его тепловая карта “короткого владения” имеет наиболее яркий красный окрас при сравнении с другими командами, причем пять из шести зон окрашены разными тонами красного. Это говорит о том, что почти на всех участках поля команда оказывает высокий уровень качественного прессинга для своих оппонентов и действует очень эффективно без мяча.

Следующими после Лидса по эффективности действий без мяча и по количеству покрытых зон поля идут Ливерпуль и Манчестер Сити.

Для Вулверхемтона и Кристал Пэлас наблюдается худшая из картин по оказываемому давлению на соперника. Без мяча команды почти всегда опускаются на свою половину (правая часть) и играют явным вторым номером, повышая тем самым шансы на длительное владение соперников на противоположной стороне поля.

Отдельного внимание стоит обратить на тепловую карту Бернли, которая отражает тактическую гибкость команды. Можно отметить, что команда умеет включать эффективный прессинг на половине соперника, поднимаясь высоко. Также команда умеет садиться очень глубоко и закрываться в низком блоке, что сопровождается более долгим владением у соперников.

По аналогии авторы посчитали средний уровень "неэффективных" оборонительных действий или средний уровень ошибок в обороне, приводящих к ударам по своим воротам. Они построили еще одну тепловую карту. Теперь для каждой обороняющейся команды с помощью модели они посчитали среднюю вероятность исходов, когда владение соперников заканчивалось ударом по воротам. Далее они посчитали среднее значение вероятности таких исходов по всем командам, после чего вычли из командного значение среднее по лиге. Такой подход позволил выделять “слабые стороны” команд и определять уязвимые места при игре без мяча.

Красный цвет - зоны, в которых команды оказывают некачественные действия без мяча, повышая тем самым вероятность того, что соперник завершит свое владение ударом по воротам. Синие - качественные оборонительные действия, снижение шансов удара по своим воротам. Справа - собственные ворота, слева - атакующие команды на мяче.

Снова выделяется Лидс, только уже в отрицательном ракурсе. Если сопернику удается пройти в финальную треть, особенно если удается оказаться в пределах штрафной, то значительно повышаются шансы завершить свое владение ударом.

Для Бернли можно отметить интересный факт - если команда включает прессинг и встречает соперника высоко, что она умеет делать, как мы видели ранее, тогда ей удается снизить шансы соперника завершить свое владение ударом. В случае игры низким блоком, эффективность оборонительных действий оказывается ниже, чем среднее значение по лиге.

Брайтон и Челси хорошие примеры команд, которые максимально эффективно подавляют возможности для нанесения ударов из своей штрафной.

Модель №2

Вторая модель, продемонстрированная в рамках доклада, для каждого действия команды с мячом прогнозирует только вероятность “короткого владения” P(Short). Но в отличие от первой модели, данная модель учитывает где играет игрок команды – дома или в гостях, а также делает поправку на силу команды.

По своей сути она представляет собой расширенную версию первой, только использует чуть другой подход к моделированию вероятности – Байесовскую статистику (противопоставляется классической статистике и оперирует условными вероятностями). Теперь вероятность "короткого владения" для каждого действия считается при условии, что на мяче находится команда, играющая "дома", например, и имеющая определенную "силу" в данном чемпионате.

Силу команд оценили через разницу в xG Difference между командой во владении и командой без мяча. Данный показатель считается на длительном промежутке времени (сезон). Ниже продемонстрирована очевидная взаимосвязь между силой команды и длительностью владения, которую авторы смогли подтвердить на данных в своей модели. Чем сильнее команда, находящаяся во владении, тем больше времени она будет владеть мячом в среднем.

Результаты модели демонстрируются с двух ракурсов:

Левая картинка:

В модели "короткого владения" учли силу играющих команд и составили рейтинг для АПЛ 20-21, который отражает общую тенденцию по лиге относительно эффективности действий команд без мяча против своих соперников. Без внесения поправки на силу мы бы наблюдали больше команд с более высокой разницей xGD правее нуля, т.е. Манчестер Сити, Челси и Ливерпуль (+42, +31, +37 - данные fbref) и т д.

Синее распределение - это посчитанная с помощью второй модели вероятность "короткого владения" для всех соперников указанной команды. Все команды разнесены относительно условного нулевого значения, которому соответствует средняя вероятность P(short) по лиге. Команды правее нулевой отметки - высокая вероятность "короткого владения", т.е. эффективные действия без мяча, команды левее - низкая P(short), позволяют сопернику дольше владеть мячом.

Лучшее качество действий без мяча демонстрирует Лидс, выделяясь среди других клубов, далее идут Саутгемптон и Ливерпуль, с которыми по соседству в рейтинге оказался Бернли. Если бы не нормировка, то Бернли едва ли бы оказался в данном рейтинге и смог бы вновь обратить внимание на свои способности периодически качественно работать без мяча. Да, безусловно, бордовые имеют массу слабостей, но данные и их анализ позволяют выявить интересные закономерности, которые могут быть скрыты от обывателя.

В верхней части рейтинга отображаются команды, преимущественно играющие низким блоком - Вест Хэм и Ньюкасл.

Правая картинка:

В данном случае авторы помимо внесения поправки на силу команды, добавили в модель учет того, где играет команда - дома или в гостях. Для каждой команды они посчитали отдельно вероятность "короткого владения" для домашних и гостевых игр, затем рассмотрели разность полученных значений.

В среднем команды создают для своих соперников более высокую вероятность "короткие владения" в гостях, нежели чем дома. Виден перекос распределений в левую сторону от нулевой линии.

Челси и Саутгемптон эффективнее создают давление своими действиями без мяча дома, нежели в гостях. Интересный результата получился для Манчестер Сити. В сезоне 2020-2021 они были более эффективными и агрессивными именно в гостевых играх, нежели чем в домашних.

Далее авторы составили аналогичные рейтинги, только на этот раз вычисляли вероятность "короткого владения" только для действий в середине поля.

На левой картинке на границах рейтинга сильных изменений не произошло. Однако можно заметить, что для Лидса и Саутгемтона распределения сместились чуть правее. Если вернуться к первой тепловой карте, то можно заметить, что именно в центральной части поля указанные команды были наиболее эффективными в давлении без мяча.

Рейтинг на правой картинке несколько изменился, но, например, для МС все также наблюдается перекос в повышенную интенсивность оборонительных действий в гостях, хотя уже не такой ярко выраженный как в предыдущем рейтинге.

Финальная визуализация.

По оси x - вероятность "короткого владения", посчитанная с помощью второй модели на основе байесовской статистики.

По оси y - вероятность "владения с ударом", посчитанная также с помощью второй модели.

Можно наблюдать сильную взаимосвязь между прогнозируемой длительностью владения и ожидаемым количеством ударов по воротам. Чем выше вероятность "короткого владения" у соперников указанной команды, тем более эффективные действия команда совершает без мяча и тем меньше вероятность того, что в результате таких действий команда получит атаку на свои ворота, которая завершится ударом и наоборот.

Однако на графике присутствуют отклонения от общей тенденции, например, Лидс. Команда демонстрирует самое высокое в лиге значение эффективности действий без мяча, при этом позволяет своим соперникам очень часто завершать атаки ударами по воротам (второе место после Астон Виллы).

В любом случае данный способ анализа позволяет взглянуть на действия без мяча под новым углом и получить интересные инсайты, чего ранее было почти невозможно сделать, используя чистые данные о событиях.

P.s. Видео с конференции будет доступно в телеграм-канале Кирилла Серых.

Альтернативный подход к оценке оборонительных действий от StatsPerform:

Новые метрики для оценки оборонительных действий в футболе. Основа - трекинговые данные и нейросети (Часть 1)

Новые метрики для оценки оборонительных действий в футболе. Использование Disruption map (Часть 2)

Интересный перевод статьи с анализом прессинга Бернли - здесь.

Ссылка на вк