8 мин.

Улучшенная xG-модель. Как качество обороны влияет на вероятность забить гол

Концепция xG (ожидаемых голов) совсем недавно вошла в лексикон основных (англоязычных) средств массовой информации. Это довольно интересный подход к интерпретации игры, особенно в случае спорта низкой результативности. У команд бывают удачные и неудачные матчи, а «ожидаемые голы» описывают уровень этой удачи на дистанции нескольких встреч, сезона или даже нескольких сезонов.

Это перевод статьи. Ссылка на оригинал и другие полезные штуки лежат в тапках.

Для чайников

Это количественная мера. Ударам присваивается значение от нуля до единицы на основе исследований, которые показывают насколько результативным может быть удар с текущей позиции. Затем «шансы» складываются, а полученный результат показывает сколько мячей команда могла бы забить в этой игре.

Единственная проблема метрики – игнорирование игроков соперника. Сколько защитников было между точкой удара и воротами? Насколько эффективно они закрывали пространство перед ударом? Существует огромная разница между ударом без помех, и ударом, при котором атакующий игрок испытывает сопротивление со стороны обороны.

К счастью, благодаря Stratagem Technologies, эта проблема исправлена. Их аналитики учли: количество защищающихся игроков между мячом и воротами, тип удара и оценку давления, которое оказывалось на атакующего игрока перед ударом.

В этом материале приводится исследование того, насколько сильно изменяются шансы при активной игре обороны. Процесс разбит на два этапа: сначала построим базовую модель, в которой вероятность зависит от позиции, откуда был нанесён удар и типа удара (головой, пенальти, штрафной и т.д.). Затем, модель будет расширена для включения показателей Stratagem, чтобы количественно определить вероятность забить гол в зависимости от действий защиты.

Базовая модель

Stratagem собирает огромное количество данных по каждому матчу. Для наших целей подойдут следующие показатели:

  1. Позиция удара;

  2. Тип момента (штрафной, пенальти, по собственных воротам, открытая игра);

  3. Часть тела (левая и правая нога, голова);

  4. Количество защитников между точкой удара и воротами;

  5. Давление со стороны обороны (по шкале от 0 до 5).

Мы возьмём лишь удары, которые не попадают под категории: штрафной, пенальти и по собственным воротам. Т.е. обычные удары с игры. На данный момент доступны цифры только по сезону 2016/17. Всего собрано 7600 таких ударов.

Для базовой модели использована логистическая регрессия, чтобы определить вероятность забить гол. Она учитывает расстояние до ворот и угол. Уравнения и результаты регрессии приведены в Приложении 1 в конце статьи. Как и ожидалось, коэффициенты сильно разнятся для ударов головой и ногой.

Рисунок 1: показывает результаты для ударов по воротам ногой. Цветные зоны указывают на шансы в зависимости от угла и расстояния. Например, удары из «зоны 1» голубого цвета имеют 5-10% шанс, удары из «зоны 2» имеют 10-20% шанс и т.д. Как минимум половина ударов из «зоны 6» (красная) приведёт к взятию ворот.

Рис. 1: Качество ударов из соответствующих зон в базовой модели. Цветные зоны указывают на вероятность для ударов ногой в обычном игровом моменте.

Это стандартная модель, не учитывающая влияние защитников. Она говорит лишь о среднем шансе забить гол с выбранной позиции. Следующим шагом является изучение того, как меняется качество момента в зависимости от действий защитников.

Улучшенная модель

Как упоминалось ранее, у нас есть два новых показателя: 'numDefPlayers' – количество защитников, включая вратаря, на прямой линии между точкой удара и воротами, и ‘defPress’ – давление, оказываемое защитниками на бьющего, с оценкой по шкале от 0 до 5.

Stratagem даёт следующее описание:

  1. Нет давления: нет игроков обороны, никто не блокирует удар;

  2. Небольшое давление: никто не вступает в отбор, но игрок находится в нескольких ярдах и обеспечивает некоторый шанс сблокировать удар;

  3. Низкое давление: игрок в нескольких ярдах от бьющего, но может вытянуть ногу чтобы сблокировать удар;

  4. Среднее давление: контакт с защитником, игрок создаёт помеху, находясь позади бьющего или дёргает его за майку;

  5. Высокое давление: рядом с бьющим много игроков соперника, которые могут совершить оборонительное действие как только атакующий попытается ударить, или выпрыгнуть вверх, чтобы не позволить бьющему нанести удар головой.

  6. Интенсивное давление: бьющий удерживается перед ударом, много соперников, которые вступают в отбор одновременно, предоставляя малое пространство для нападающего, или игрок перекрыт в верховой дуэли.

Я расширил базовую модель качества ударов, включив две оборонительные метрики. Полученная регрессия показала, что коэффициенты весьма значимы и существенно улучшают логику модели относительно базовой. Другие показатели также указывают на улучшение модели: увеличение качества средней вероятности точного прогноза и снижение коэффициента Брайера. Поэтому нет сомнений, что включение оборонительных показателей значительно улучшило модель.

Но что означает новая информация в практическом смысле? Грубо говоря, каждые три защитника (включая вратаря) уменьшают вероятность гола. Удар ногой с двенадцати ярдов в обычном игровом эпизоде без помех приведет к голу с вероятностью 42%; размещение трёх защитников между точкой удара и воротами уменьшат это показатель до 24%. Увеличение давления на бьющего с 0 до 4 в приведенной выше системе оказывает примерно такое же воздействие.

Рисунок 2: наглядная демонстрация того, насколько качество ударов зависит от оборонительных показателей. Приведены 4 варианта: первый – удары, нанесенные при лёгком давлении с одним игроком обороны (обычно, вратарь); второй – низкое давление, но четыре игрока между точкой удара и воротами; третий – высокое давление с двумя игроками; четвёртый – высокое давление при четырёх игроках.

В каждом случае я приведу пример шанса из сезона 16/17; все четыре удара были нанесены примерно из одной точки. Зоны показывают качество шансов, как и на первом рисунке: 5-10% (голубой), 10-20% (пурпурный), 20-30% (зеленый), 30-40% (желтый), более 40% (красный).

Рис. 2: Влияние обороны на качество ударов

Четыре сценария наглядно демонстрируют, как вероятность гола зависит от обороны. Когда игрок имеет шанс для свободного удара по воротам (слева вверху) вероятность забить с любого разумного расстояния увеличивается. Зоны 1 и 2 (голубой и пурпурный) выходят далеко за пределы штрафной, а зона 6 (красная) выходит за пределы шестиярдного квадрата перед воротами. Удары вблизи штрафной имеют шанс 1 к 3. Такой был, например, у Афобе в составе Борнмута на 61-й минуте матча против Саутгемптона в апреле.

В другом примере (снизу справа) сильное давление на бьющего, и снижение шансов отличиться. Удар из зоны пенальти Насера Шадли на 70-й минуте матча Вест Брома против Ливерпуля в прошлом сезоне имел шанс 1 к 10.

Зона 1 (внешняя) не выходит за пределы штрафной, а вероятность забить в любой точке шестиярдного квадрата меньше 25%. Этот пример наглядно показывает сложность игры против хорошей обороны.

Заключение:

Результаты помогли количественно оценить вероятность забить гол при хорошей обороне. Хорошо организованная и ориентированная на оборону команда может снизить вероятность забить из-за пределов шестиярдного прямоугольника до 20%. В этой ситуации способности позиционного расположения защитников очень важны.

Стоит отметить, что по ходу сезона 16/17 разница между средними шансами для команд АПЛ существенно не отличалась. Самым большим изменением является ожидаемый гол в матчах против «Ливерпуля», которой увеличился с 0,96 в базовой модели до 1,03 в улучшенной. Это от 36 до 39 голов в общей сложности за сезон (на самом деле они пропустили 42). Это означает, что защита «Ливерпуля» даёт соперникам немного больше шансов, чем предполагала модель.

Важное замечание

Качества отдельного футболиста не влияют на шанс забить. Чтобы оценить навыки нападающего, необходимо взять набор из 1000 ударов. Поэтому куда важнее агрегировать данные об ударах всех игроков. Качество ударов описывается вероятностью значительно лучше при вычислении усредненных показателей.

Приложение 1: формулы для вычисления логистической регрессии

в базовой модели:

в улучшенной модели:

nDef – количество защитников между точкой удара и воротами, pressure – рейтинг давления от Stratagem. Все бета-коэффициенты были определены с использованием логистической регрессии для ударов ногой (исключая штрафные, пенальти и удары по своим воротам). Расстояние в системе координат Stratagem (1ед. = 0,267м); углы в градусах. Полученные коэффициенты приведены в таблице ниже. Обратите внимание на то, как pressure и nDef способствуют улучшению логики расширенной модели.

Спасибо, что прочитали перевод. Оригинал лежит здесь.

Ссылку на материал обнаружил в паблике Блокнот.

Не забывайте подписываться и плюсовать, если вам понравилось.

Я VK

Пообщаться о футболе можно здесь.