8 мин.

Насколько сильно передачи между линиями влияют на игру? Анализ через призму Data Science

Новый перевод в нашем блоге посвящен теме определения и значения проникающих передач (передач между линиям) в футболе. Автором является Куба Михальчик, который раньше уже переводился в нашем блоге. В своем проекте для OptaPro 2020 Forum Куба использовал трекинг данные сезона 2018/19 Бельгийской Профессиональной Лиги, чтобы выявить и оценить передачи между линиями в контексте увеличения вероятности забить гол / потерять мяч.

В этом материале он описывает свою методологию и кратко излагает основные находки. Дальше весь текст написан от лица автора.

 

Вступление 

Передачи между линиями постоянно обсуждаются среди футбольных аналитиков, тренеров и экспертов. Передачи, которые пересекают линию обороны соперника, обычно позволяют команде переходить из одной фазы атаки в другую.

Поэтому всегда ценятся игроки, обладающие способностью отдать проникающую передачу. В то время как некоторые существующие статистические данные, такие как packing или progressive runs, уже косвенно выполняют эту функцию, я применил трекинг данные Stats Perform, взятые из Бельгийской Профессиональной Лиги 2018/19 и создал новый метод для непосредственного измерения значения этих передач.

Определяем передачи между линиями

Отправной точкой этого исследования стала цель создания надежного подхода для нахождения линий в расстановках команд, учитывая, что каждый игрок может переключаться из одной линии в другую в результате своих перемещений.

Естественным способом кластеризации игроков в линии является применение алгоритма кластеризации к Х оси поля (координата боковой линии). После тестирования нескольких алгоритмов кластеризации, я остановился на одном из самых простых вариантов - метод оптимизации естественных разрывов Дженкса - с тремя кластерами, сформированными из полевых игроков (с вратарями, которые затем формируют четвертый кластер). Этот алгоритм является эффективным и очень понятным методом для уменьшения объема отклонения от среднего значения кластера.

Чтобы предотвратить моментальные переключения между линиями, координата x была усреднена по двухсекундному временному окну. Кроме того, группы, которые продолжались менее одной секунды, были удалены и переназначены к предыдущей линии.

Применение определенного количества кластеров, возможно, не является самым оптимальным подходом для анализа других областей футбола, но я посчитал его приемлемым для проникающих передач. Кроме того, использование различных переменных кластеров, вероятно, приведет к кластерам, состоящим из одного игрока, который на самом деле не образует линию, но не может быть проигнорирован, поскольку его расположение может иметь решающее значение для обороны.

Рисунок 1. Пример определения линий в формации, используя 1-D кластеризацию

 

Для целей этого анализа передача между линиями определяется как передача, которая не только пересекает по крайней мере одну из линий соперника в геометрическом контексте, но и:

- продвигает мяч вперед не менее, чем на 10 метров;

- имеет отправную точку на расстоянии не менее пяти метров от точки пересечения;

- имеет конечную точку как минимум в двух метрах от самого глубокого  игрока в линии.

Этот алгоритм исключает передачи, которые:

- разрезают линии в геометрическом смысле, но вряд ли приведут к переходу на следующую фазу атаки;

- крайне легко выполняемы из-за их близости к линии, которую они пересекают.

Определение также означает, что получатель паса не находится под давлением любого из игроков, которые были отрезаны передачей.

В выборке учитывались все передачи, кроме стандартных положений, однако, поскольку координаты Z (высота мяча) не принимались во внимание, результаты не учитывают была ли передача сделана верхом.

Последнее замечание перед переходом к самой модели касается проблемы определения перехваченных передач. Поскольку конечные координаты перехвата указывают на то место на поле, где происходит перехват, мы не можем полагаться на них, чтобы определить, должна ли передача быть проникающей или нет.

Однако, учитывая, что у нас есть информация об угле передачи и нижней границе длины передачи, мы можем попытаться определить ее предполагаемый конечный пункт назначения. Для этого мы применяем Модель выживания Вейбулла, которая является техникой, специально предназначенной для работы с ограниченными “снизу” данными, чтобы оценить ожидаемую дополнительную длину прохода от точки перехвата. Таким образом, даже если передача была перехвачена, но ее предполагаемый пункт назначения классифицировал ее как пересечение линии, мы все равно могли бы пометить ее как неудачную передачу между линиями.

Создаем модель для определения ценности передач

Первоначальная цель этого проекта состояла в том, чтобы попытаться количественно сравнить значимость различных проникающих и непроникающих передач путем сравнения передач с аналогичными пространственными характеристиками.

В идеале, была бы использована модель ожидаемой ценности владения (EPV), охватывающая обилие доступных трекинг данных. К сожалению, построение надежной модели EPV на основе этих данных является очень сложным и количество человеко-часов не соответствует пользе от финального результата.

С другой стороны, non-shot xG модель с распределением значений по событиям из более глубоких частей поля, вероятно, была бы недостаточно гибкой для этой задачи. Поэтому я остановился на модели EPV, аналогичной фреймворку VAEP,  в котором данные о событиях обогащаются cледующими данными, извлеченным из трекинга.

  1. Максимальный «угол зрения», который определяется как максимальный угол, создаваемый мячом и любыми двумя соседними игроками первой линии соперникаРисунок 2: Пример «угла зрения», показывающий область, где игрок, находящийся во владении, может отдавать передачу между двумя противниками. Угол между первым игроком, мячом и вторым игроком, обозначенный как альфа, является максимальным углом в этом сценарии. Угол между игроком 3, мячом и игроком 4 является отрицательным и поэтому игнорируется при расчете «целостности линии», определенной в пункте 3 ниже.

  2. Максимальное расстояние между соседними игроками в первой встречающей линии;

  3. «Целостность линии» определяется как сумма обратных положительных “углов зрения”;

  4. «Компактность линии» определяется как сумма обратных расстояний между соседними игроками в линии;

  5. Значения Pitch control в начале и в конце действия определяются в соответствии с моделью, представленной в этом техническом документе от Люка Борна и Хавьера Фернандеса в Sloan 2018.Рисунок 3: Пример результатов  pitch control модели

Обе функции пытаются зафиксировать любую возможную уязвимость в линии, которая ближе всего к игроку с мячом.  Идея “угла зрения” в том, что мяч между двумя игроками продвинуть  легче тогда, когда угол между ними и мячом больше по одной из двух причин: а) они находятся на большом расстоянии друг от друга б) игрок, владеющим мячом, ближе к встречающей линии.

Тем не менее, расстояние между соседними игроками в линии важно, так как это тот язык, который многие тренеры используют для объяснения своих идей игрокам. 

Таким образом, функции 3 и 4 направлены на то, чтобы охватить первую группу игроков в целом, применяя обе концепции, изложенные в пунктах 1 и 2.

Когда мы применяем сумму обратных углов и расстояний, чтобы поддерживать интуитивно понятную шкалу для обоих показателей, низкие значения указывают на неправильное позиционирование, а высокие значения демонстрируют поддержание нужных дистанций.

Одна ключевая вещь, которую стоит упомянуть, это то, что «целостность линии» не включает в себя отрицательные “углы зрения”. Возвращаясь к Рисунку 2, этот отрицательный угол создается между игроком три, мячом и игроком четыре, который фактически скрыт за остальной линией. В этом случае потенциальный пас мог пройти только через этих двух игроков с другой стороны, пересекая линию между игроками два и три. Поэтому, хоть положение игрока четыре нельзя полностью игнорировать, оно менее критично, чем положение первых трех. В результате я решил не включать отрицательные углы в расчет.

Все пять функций были обработаны в соответствии с VAEP. Мы получили то, что характеристики текущего и предыдущих двух событий в цепочке владения были введены в модель XGBoost для прогнозирования вероятности того, что команда забьет или пропустит гол за следующие десять действий.

Увеличивают ли передачи между линиями вероятность забить гол?

На этом скрипичном графике показаны вероятности забить или пропустить гол во время любого из десяти действий, следующих за проникающей/непроникающей передачей.

Более широкая область на участке означает более высокую вероятность. Медианные вероятности отмечены точками, а диапазон между 25-м и 75-м процентилем обозначен с помощью столбцов.

 

Хоть в этом подходе и отсутствует статистическая строгость, он указывает на то, что передачи в пространство между линиями повышают вероятность гола, а медианное значение почти в два раза выше, чем у непроникающих передач.

Также следует отметить, что неудачная передача между линиями, по-видимому, также не увеличивает вероятность того, что команда пропустит гол.

 

Какие игроки лучшие по проникающим передачам?

В контексте скаутинга одним из главных преимуществ определения передач между линиями является то, что это может найти перспективных в этом плане игроков.

Диаграмма ниже описывает всех игроков, сыгравших центральным защитником минимум десять игр в сезоне 2018/19 по двум показателям: количество попыток передач между линиями и процент их успешности.

Игроки в правом верхнем квадрате преуспели в обоих показателях

*Включены только центральные защитники, сыгравшие 900+ минут.

 

Как и в случае с центральными защитниками, которые используют передачи с продвижением, способность перевести мяч в следующую фазу атаки имеет решающее значение и для глубинных плеймейкеров. Результаты для игроков этого типажа приведены ниже.

Одним из наиболее выделяющихся игроков прошлого сезона был Руслан Малиновский, который прошлым летом перешел из Генка в Аталанту.

 

 

В самом конце исследования автор задается вопросом “можно ли определить проникающие передачи по событийным данным”. Советуем вам полностью прочитать оригинальный материал

 

Подписывайтесь, чтобы не пропустить следующий эпизод 

Твиттер

Телеграм