14 мин.

Удары из-за пределов штрафной могут быть эффективными и приносить больше голов. Новый подход к интерпретации xG

В данной статье будет приведен обзор свежей работы, которая была представлена на конференции MIT Sloan Sports Analytics 2021 несколько дней назад. Оригинальное название работы - "Leaving Goals on the Pitch: Evaluating Decision Making in Soccer", которое по смыслу можно перевести как - "Незабитые голы, оставленные на поле: Оценка принимаемых решений в футболе". Авторами данного исследования являются сотрудники лёвенского университета, занимающиеся машинным обучением и спортивной аналитикой.

Основной смысл работы заключается в том, что используя продвинутые методы анализа, включающие машинное обучение и другие статистических подходы, в частности, - цепи Маркова (о которых я писал ранее), можно выделить некоторые участки поля перед штрафной площадью, из которых предпочтительнее наносить удар с точки зрения максимизации xG, а не пытаться улучшать позицию и продвигать мяч ближе к воротам.

1. Введение

Существующие модели xG могут незначительно отличаться друг от друга количеством учитываемых параметров, но все они сходятся в одном - чем дальше точка поля, из которой наносится удар, тем ниже шансы забить гол и следовательно меньше значение xG. Такая интерпретация привела футбольный мир к осознанию того, что меньшим количеством ударов из позиций с высоким xG (ближе к воротам) можно забить больше голов, чем более частыми попытками из позиций с низкими вероятностями ожидаемых голов (дальние дистанции). Это в свою очередь привело к тому, что футболисты стали реже бить издали и чаще стараться улучшить позицию для удара. На рисунке ниже можно наблюдать тому подтверждение. В течение 6 рассматриваемых сезонов год за годом происходило снижение % дальних ударов за матч. Под дальними ударами понимаются любые удары из-за пределов штрафной. Общее число таких ударов в АПЛ за 6 лет снизилось почти на 20%.

Однако, несмотря на существующий тренд в снижении общего количества дальних ударов в АПЛ, также удалось зафиксировать интересную особенность. Был составлен список футболистов, которые за два сезона (17-18 и 18-19) нанесли более 45 дальних ударов в рамках чемпионата Англии. В эту команду попали: Сон, Азар, Эриксен, Сигурдссон, Погба, Кейн и Де Брюйне. Далее для них сложили все удары и посчитали % забитых голов - 6.5%.

Для всех вышеперечисленных футболистов также посчитали общее количество касаний, после которых не были нанесены удары и вычислили, сколько раз были забиты голы после таких моментов. Данная статистика рассматривалась только для зоны дальних ударов (далее будет картинка с указанием рассматриваемой зоны). В результате получили значение - 2.1%.

Полученные цифры натолкнули аналитиков на гипотезу, что возможно есть некоторые участки футбольного поля, находящиеся за пределами штрафной, для которых опасность от нанесенного удара может быть выше, чем попытка улучшить позицию или же продолжить атаку передачей на партнера, что они и решили проверить.

 

2. Моделирование поведения игроков на футбольном поле

Для того чтобы проверить сформулированную гипотезу была построена статистическая модель на основе цепей Маркова. Если максимально упрощать, то такая модель рассматривает игровой процесс как последовательность переходов между различными состояниями (цепочка переходов). Состояния определяются конкретной зоной поля. Для каждой зоны рассчитываются вероятности перехода в другую зону и вероятность того, что будет нанесен удар по воротам. Есть два варианта перехода в другую зону: либо игрок сам двигается с мячом из одной зоны в другую, либо отдает передачу.

Существуют различные способы построения таких моделей, каждая из которых может делить поле по разному. Самое главное, что стоит понимать, - данная модель позволяет оценить вероятность того, что текущее владение мячом закончится голом через несколько следующих действий. Такая оценка делается для всех зон футбольного поля. В результате, если игрок делает пас или совершает движение, перемещая мяч из одной зоны в другую, то мы можем оценить качество этого действия как повышение или понижение вероятности забить гол через следующие несколько действий (в метрике xT обычно рассматривается 5 действий).

 

Нововведение бельгийских специалистов заключается в том, что они добавили в модель переменную Policy (специфика принятия решений / тактическая установка), которая учитывает то, какое решение будет принимать игрок, находясь в той или иной зоне футбольного поля (выберет ли он удар или решит продвигать мяч в другую зону). В результате, в готовой модели можно обыгрывать различные сценарии принятия решения и возможные исходы - что было бы, если бы игрок, находящийся в данной зоне, ударил по воротам, что было бы если .. и т д.

Описанная модель строилась на данных о событиях АПЛ сезонов 17-18 и 18-19, которые были предоставлены StatsBomb. Всего было рассмотрено 17 команд, для каждой из которых обучалась отдельная модель (рассматривались команды, игравшие в обоих сезонах).

Важной деталью будет отметить тот факт, что внутри статистической модели, описанной ранее, дополнительно использовались модели машинного обучения, с помощью которых предсказывались зоны, в которые игроки намеревались перевести мяч в ситуациях, когда мяч был перехвачен или выходил за пределы поля в результате паса. Данный факт интересен в контексте того, что ранее зачастую описанные подходы рассматривались как конкурирующие (например, метрика xT на основе цепей Маркова, метрика VAEP на основе машинного обучения). Теперь же мы видим, что эти подходы могут взаимно дополнять друг друга.

На основе описанной выше модели был создан программный фреймворк, который позволяет решить две задачи.

  • Проанализировать игровую ситуацию и определить - какое действие является предпочтительным с точки зрения повышения шансов забить гол. Например, что будет более опасным - ударить по воротам при приеме мяча сразу же вторым или третьим касанием или же отдать пас на фланг с последующим кросом в штрафную.

  • Проанализировать возможные варианты изменения модели принятия решений футболистами в определенных зонах (policy, о которой говорилось раньше) и оценить эффект от таких изменений. Например, насколько больше было бы забито голов за сезон, если бы игроки били реже или чаще из-за пределов штрафной)

 

3. Примеры использования

3.1 Определение оптимального действия для футболиста в зависимости от расположения на поле.

В данном случае, как и везде в статье, речь идет об участке поля, выделенном голубым на рассмотренной ранее картинке с размеченным футбольным полем.

Ниже представлена тепловая карта разницы xG для четырех команд АПЛ (Челси, Эвертон, Хаддерсфилд и МЮ) и для двух типов сценариев. В первом сценарии для каждой точки внутри выделенной ранее области дальних ударов было рассчитано два показателя xG:

  • xG для текущей зоны в случае незамедлительного удара (удар наносится из той же зоны, в которой игрок принял мяч)

  • xG для зоны, в которой вероятнее всего окажется игрок данной команды через одно действие (пас или продвижение с мячом в другую зону)

В случае, если незамедлительный удар более опасен, с точки зрения вероятности забить гол, зона окрашивается в сторону красного и наоборот, в случае, если изменение позиции увеличивает шансы, то зона окрашивается в сторону синего. Если оба решения равнозначны, то разница в xG близка к 0 и цвет зоны нейтрально белый. Данный сценарий отражен на верхней группе графиков.

Второй сценарий аналогичен первому, только для случая перемещения мяча в другую зону учитываются два действия (два последующих перехода).

Наблюдаемые результаты:

  • Для все команд есть зоны, для которых более предпочтительно незамедлительное нанесение ударов (ярко и блекло бордовые) и зоны, в которых более предпочтительно дальнейшее улучшение позиции и перемещение мяча дальше (еле заметный голубой оттенок). Причем наблюдается интересный факт, если для зоны более высокие шансы гола с нанесением удара, то разница в xG значительно больше, чем для альтернативного случая (различия в глубине окраса).

  • Зоны, в которых удар более предпочтителен, зависят от рассматриваемой команды, но в целом наблюдается некоторая закономерность - более яркий раскрас имеют зоны, расположенные напротив ворот. Одно из возможных объяснений, предлагаемых авторами, заключается в том, что когда игрок с мячом находится на центральной линии и пытается отдать передачу вместо удара, то зачастую такая передача идет по диагонали в штрафную, и партнер получает передачу полубоком, в результате ему чащу всего требуется развернуться, чтобы нанести удар.

  • При увеличении числа дополнительных действий до нанесения удара (второй сценарий) наблюдается снижение преимуществ данного решения. Зоны, из которых вероятность удара была выше, становятся чуть более яркими, а те, которые были раскрашены в нейтральный цвет, начинают окрашиваться в сторону красного, следовательно, в таких зонах более правильным решением с точки зрения высоких шансов является удар, нежели последующее улучшение позиции, в отличии от первого сценария. (Возможно данная разница в цвете не бросается в глаза, но если поразглядывать приведенные графики более пристально, то можно найти подтверждения вышесказанному)

 

Далее предлагается для рассмотрения еще один сценарий, который рассматривается для Челси и Эвертона:

  • xG для текущей зоны в случае незамедлительного удара (удар наносится из той же зоны, в которой игрок принял мяч)

  • xG для зоны, в которой вероятнее всего окажется игрок данной команды через два действия, при этом первое действие должно обязательно перемещать мяч на один из флангов.

 

Наблюдаемые результаты:

  • Введение ограничение на первое действие для второго сценария приводит к тому, что итоговая вероятность гола после двух передач снижается, следовательно зоны дальних ударов окрашиваются сильнее в красный

 

Полученные результаты могут быть полезны командам с точки зрения повышения эффективности игры в атаке. Игроки могут получать детальное руководство по принятию решений в различных зонах внутри области дальних ударов в случае возникновения описываемой игровой ситуации в матче. Также данный анализ может быть полезен при разборе особенностей игры соперника в атаке, чтобы подготовить игроков защиты и опорной зоны с фокусом на участки поля, из которых соперник создает наибольшую опасность.

3.2 Оценка вероятности нанесения более опасного удара в текущем владении мячом

Данный пример нужно рассматривать как развитие предыдущих сценариев. Если ранее для каждой точки внутри голубого участка дальних ударов проводилось сравнение:

  • xG для удара из текущей позиции (зоны)

  • xG для удара из следующей самой вероятной позиции после одного или двух переходов

То теперь происходит сравнение (Сценарий №4):

  • xG для удара из текущей позиции (зоны)

  • Значение xG для позиции (зоны), которую принципиально может достичь игрок из текущей зоны и для которой значение xG будет максимальным в текущем владении. Т.е. для каждой зоны внутри голубого участка области дальних ударов рассчитываются xG для всех возможных последующих состояний и определяется зона, в которую может попасть игрок и для которой шансы гола будут максимальными.

 

Далее по аналогии с предыдущими сценариями проводят вычитание соответствующих значений xG. (игрок может попасть в зону с максимальным xG как через 1 действие, так и через 5, здесь не рассматривается ограничение на количество переходов)

 

Возможно более понятной станет описанная картина при рассмотрении следующей визуализации.

Наблюдаемые результаты:

  • Для каждой команды в Сценарии №4 удалось определить зоны, для которых есть потенциал для дальнейшего улучшения позиции и попадания в зону с более высоким значением xG (более фиолетовый/синий окрас), и для которых увеличение шансов в новых зонах отсутствует или незначительно отличается от удара из текущей позиции (полностью белые или тускло окрашенные зоны)

  • Зоны, для которых отсутствуют другие позиции с более высоким значением xG (или почти отсутствуют) в Сценарии №4, соответствуют зонам, для которых предпочтительным решением являлся незамедлительный удар в Сценарии №2, что выглядит логичным.

  • Для некоторых зон любое количество последующих действий может увеличить исходное значение xG не более чем на 5%. Пример - бледно закрашенная зона для Челси чуть левее от дуги штрафной.

  • В большинстве случаев, если игрок находится на границе штрафной площади прямо напротив ворот, то увеличение xG при улучшении позиции составляет от 5 до 10% (незначительный прирост, если учитывать возможные риски потери мяча и т д)

  • Левая часть участка дальних ударов на карте МЮ, которая ярко раскрашена фиолетовым, является примером того, что для некоторых зон дальнейшее улучшение позиции может повысить шансы гола до +20%.

  • Полученная тепловая карта вероятностей может существенно отличаться от команды к команде. Если посмотреть на карту Хаддерсфилда, то можно сделать вывод, что для команды не существует зон, из которых более полезно было бы пытаться улучшать позицию для удара с точки зрения высокого потенциала для увеличения шансов забить гол (наблюдается незначительное приращение xG)

 

3.3 Оценка прироста голов за сезон, если бить чаще из зоны дальних ударов (равномерная плотность ударов)

Ниже приводятся результаты оценки приращения ожидаемого количества голов за сезон, если бы команды АПЛ били более редко или часто из области дальних ударов. В данном примере моделируется ситуация, когда удары наносятся равномерно из всех зон внутри рассматриваемой области за пределами штрафной.

Наблюдаемые результаты:

  • Почти для всех команд увеличение % дальних ударов увеличивает значение ожидаемых голов и наоборот, при снижении частоты ударов - наблюдается снижение числа голов.

  • Исключение составляют Бернли, Ливерпуль и Ньюкасл Юнайтед. Для них не наблюдается никакого эффекта от увеличения количества ударов из-за штрафной и наблюдается обратный эффект при снижении частоты ударов, который приводит к увеличению ожидаемых голов за сезон. Это объясняется тем, что перечисленные команды имеют самую низкую конверсию ударов из за штрафной в голы.

  • Самый большой прирост в количестве ожидаемых голов наблюдается для Челси, Эвертона, МС и МЮ (до +1 гола за сезон при увеличении частоты дальних ударов на 20%).

 

3.4 Оценка прироста голов за сезон, если бить чаще из наиболее опасных зон, определенных для каждой команды отдельно

Пожалуй, основной результат всех проделанных ранее манипуляций представлен ниже. Ранее было показано, что для каждой команды существуют зоны в области за пределами штрафной, для которых построенная модель определяет более высокое значение xG, нежели чем для других зон.

Авторы работы смоделировали сценарии, в которых каждая из рассматриваемых команд совершала бы больше ударов из наиболее опасных зон и оценили прирост ожидаемых голов за сезон для таких сценариев.

Наблюдаемые результаты:

  • При увеличении % нанесенный дальних ударов из наиболее опасных зон, количество ожидаемых голов увеличивается в сравнении с предыдущим сценарием, когда моделировалось равномерное распределение ударов (Челси зарабатывал бы +1.6 дополнительных голов, в сравнении с +1 голом для предыдущего случая)

  • Большинство команд получили бы один дополнительный гол под конец чемпионата, который в большинстве случаев соответствует одному дополнительному очку в турнирной таблице. Это может быть очень важно для команд, которые борются за квалификацию в еврокубки или же за место в чемпионате на следующий сезон.

Ниже приводится график, на котором отражена зависимость набранных очков от количества забитых голов в чемпионате для 10 сезонов АПЛ. Можно наблюдать довольно высокую корреляцию и использовать грубую оценку: + 1 дополнительный гол позволяет в среднем зарабатывать +1 дополнительное очко.

4. Важность полученных результатов

Плюс одно очко - это много или мало ? Стоит ли использовать описанный в статье инструмент для определения таких зон и трансформировать существующую модель поведения в команде, давая тренерскую установку игрокам на более частое нанесение ударов из-за пределов штрафной?

Сегодня, наверное, рано делать поспешные выводы. Но можно продемонстрировать очень наглядный пример важности одного очка для команды на конец чемпионата. Борнмут в сезоне 2019-2020 набрал на одно очко меньше Астон Вилы и вылетел из АПЛ. Построенная модель предсказывает для Борнмута возможность получения +0.8 голов (~ +1 гол), если бы команда била на 20% чаще из-за пределов штрафной из зон, которые для команды являются наиболее опасными. Это бы привело к тому, что Бормунт заработал бы одно дополнительное очко и по разнице забитых мячей оказался бы выше Астон Вилы в итоговой таблице, что позволило бы команде сохранить прописку в АПЛ.

 

Оригинал работы - здесь (можно найти рассматриваемые графики с тепловыми картами разности xG для всех 17 команд)

Группа в вк

Инстаграм