Продвинутая статистика игры с мячом и без мяча. Как объединить и использовать для глубокого анализа матчей?
Футбольный анализ стремительно развивается. В течение многих лет существовало только два направления данных в футболе:
Первое – это ивент-данные, где фиксируется все, что происходит на поле. Это – передачи, удары, перехваты, отборы и т.д.
Второе – трекинг-данные, где фиксируется местоположение каждого игрока. Фиксируются передвижения со скоростью 25 кадров в секунду.
Как и радиорепортаж футбольного матча, ивент-данные описывают совершенные игроками действия с мячом, что дает большой объем полезной информации. Однако, если сосредотачиваться исключительно на действиях игрока с мячом, все остальные действующие и взаимодействующие события, происходящие на игровом поле, не будут учтены.
В отличие от ивент-данных, трекинг-данные предоставляют возможность не просто отслеживать с высокой четкостью расположение игроков на поле без мяча, но и определять с учетом контекста игры, как эти футболисты влияют на действия игрока, владеющего мячом.
Объединив два направления данных, мы получим более четкую картину всего происходящего на футбольном поле.
Подобного рода объединенные «контекстуальные ивент-данные» в последние годы становятся все более популярными. Недавно аналитическая компания Stats Perform, специализирующаяся на спортивных данных и аналитике, объявила о выпуске новой серии продвинутых футбольных метрик на основе потоков лайв данных «Opta Vision», упаковав все это в объединенный массив данных по нескольким лигам мира.
Такие данные позволяют глубже погрузиться в происходящее по ходу матча в целом или отдельного события на поле. С их помощью, например, можно выразить в цифрах верность принятого игроком решения в той или иной ситуации (подробнее об этом ниже). Учитывая растущий спрос на более глубокое понимание происходящего на футбольном поле со стороны клубов, СМИ и болельщиков, такие данные – это ценный актив.
Давление на мяч и «разрушение линий»
«Мы получаем трекинг-данные в различных формах уже около 15 лет от различных поставщиков и технологических компаний», – говорит Бен Макрилл, вице-президент Stats Perform по данным, искусственному интеллекту и профессиональным продуктам.
«В профессиональных клубах трекинг-данные использовались преимущественно для анализа физических показателей: оценки скорости, пробега и сравнения с данными тренировок по GPS. Сейчас наблюдается рост использования этих данных для тактического анализа, но для того, чтобы извлечь из них какую-либо пользу, необходимо обладать способностями к изучению данных», - продолжает Макрилл.
Трекинг-данные часто труднодоступны для многих лиг. В то время как клубы Английской Премьер-лиги имеют множество встроенных камер на своих стадионах благодаря официальному партнеру Second Spectrum, менее охваченные лиги, например, Первый дивизион Кипра – не могут похвастаться такой роскошью.
Для борьбы с этим компания SkillCorner и подобные ей используют искусственный интеллект для дистанционного извлечения трекинг-данных, по сути, независимо от стационарных установок на стадионах. Важно, что источники трекинг-данных Opta Vision сочетают в себе обе эти методологии для обеспечения глубины и широты охвата.
В последние годы компании SciSports, Second Spectrum, SkillCorner и StatsBomb, последняя из которых выпустила свой массив данных «360», стремились объединить трекинг и ивент-данные. Важно отметить, что новый релиз Stats Perform предполагает создание автоматизированного процесса с помощью компьютерного зрения, позволяющего предоставлять эту информацию пользователю в режиме реального времени.
Что же нового и более углубленного можно получить, используя этот объединенный массив данных? Аналитик из Stats Perform, Бен Макрилл, выделяет четыре основных аспекта.
Первый – это более глубокое понимание того, какой прессинг оказывается на игрока с мячом в момент приема передачи или её исполнения. Вместо обычной регистрации отдачи паса, новые данные проливают свет на то, сколько игроков находилось рядом и какое давление оказывалось на зону владения мячом в каждом событии.
Например, Кевин Де Брюйне из «Манчестер Сити» получает пас от Жоау Канселу, а два игрока «Вулверхэмптона» оказывают на него давление:
Этот эпизод заметно отличается от следующего эпизода, в котором он получает передачу на том же участке поля в игре против «Арсенала», где на него практически не оказывают давления:
Расположение других игроков, которые не коснулись мяча, добавляет дополнительный контекст к событию получения передачи и может показать, какие игроки оказывают наибольшее давление на зону мяча.
Вторым аспектом является более глубокое понимание пасов, разрывающих линию, то есть – сколько игроков отрезается одной передачей. Лучший пример - Тьяго из «Ливерпуля». На изображении ниже Тьяго получает мяч на своей половине поля и одним пасом Джордану Хендерсону в центральный круг отрезает пять игроков «Манчестер Юнайтед»:
Напротив, в следующем эпизоде против Саутгемптона, Тьяго простым пасом находит адресата в лице Диого Жоты:
Оба паса были совершены в центральном круге, но при этом во втором случае ни один игрок не был отрезан этой передачей.
В классических ивент-данных оба события были бы зарегистрированы всего лишь как пас вперед, но расположение игроков соперника показало, насколько ценным была передача в первом примере для взлома полузащиты «Юнайтед».
Макрилл также отмечает растущую популярность этих современных, продвинутых метрик в мире аналитики и то, что подобные методы описания игры прочно вошли в футбольный лексикон. Теперь изменилось лишь то, что эти показатели могут быть измерены лучше.
«В последнее время всё чаще подобные данные встречается у других провайдеров, но мы хотели сделать это с помощью компьютерного зрения и автоматизированного процесса. Так это становится более масштабируемым, позволяет делать это быстрее и в режиме реального времени», - говорит Макрилл.
«Играй просто!»
Третьим важным аспектом является модель прогнозирования паса, которая позволяет лучше понять процесс принятия решений игроком.
Какой вариант паса выбрал игрок? Каковы риски и выгоды этого решения? Выбрал ли он самый рискованный вариант или самый безопасный?
«Мы делаем это с тренерами после каждой игры. Мы возвращаемся к игре и оцениваем, принял ли игрок правильное решение в этих ситуациях», - говорит Макрилл – «Вы смотрите на успешность паса, но это не дает вам никакого представления о том, был ли вариант лучше, или все-таки это был наиболее верный выбор».
Новая модель может помочь выразить это в цифрах. Давайте рассмотрим другой пример.
Ниже мы видим, что у Орельена Тчуамени, новичка «Реал Мадрид», есть три варианта для передачи, в матче за свой предыдущий клуб «Монако». Все они имеют менее чем 50-процентный шанс оказаться точными – этот показатель называется «ожидаемая точность паса» или xPass.
Модели пасов существуют уже некоторое время, но, как описывает Макрилл, новая модель позволяет увидеть все варианты, доступные игроку:
«Мы делаем прогноз на основе расположения игрока, степени давления, расстояния между другими игроками вокруг мяча, вероятности того, что эти игроки совершат перехват или включат высокий прессинг на игрока, получающего мяч».
Варианты передачи также несут в себе потенциальное вознаграждение, выраженное в «Ожидаемой угрозе» или xThreat, которая представляет собой вероятность нанесения удара в течение следующих 10 секунд, если передача будет исполнена:
Для Тчуамени пас с наибольшей угрозой для соперника – на Желсона Мартинша, расположенного в центре (0,27 xThreat). Однако передача Сеску Фабрегасу на дальнюю штангу имеет более высокую вероятность оказаться точной (43% xPass).
Тчуамени выбрал последний вариант и выполнил передачу, после чего Фабрегас опередил вратаря Пари Сен-Жермен Кейлора Наваса и выкатил на пустые ворота…
…Кевину Фолланду, который внес мяч в сетку ворот:
Два из трех вариантов, доступных Тчуамени в нашем примере, несли высокую угрозу для соперника (более 0,2 xThreat), но имели менее чем 50-процентный шанс оказаться точными. В конечном счете, француз принял правильное решение, которое имело наибольшую вероятность завершиться голом.
Если рассматривать все пасы которые отвечали критерию «высокий риск – высокая награда в «Лиге 1 в сезоне 2020-21, то заметно, что «Монако» выбирал больше сложных вариантов передач, чем любая другая команда лиги:
Применительно к игрокам этот анализ может помочь повторно оценить, насколько важен отдельный футболист для своей команды.
«Сделать простой пас без риска или банально сохранить мяч иногда может быть лучшим решением для игрока, но мы, часто находясь на трибунах, критикуем игроков, когда они отдают пасы назад, а ведь это могло быть лучшим решением. Теперь мы можем выразить это в цифрах», – подчеркивает Макрилл, представитель компании StatsPerform.
Более пристальный взгляд на расстановку команды
Четвертый и заключительный аспект позволяет глубже изучить тонкости расстановки команды в течение игры, учитывая, что наше нынешнее объяснение командных формаций в конечном итоге несовершенно.
«Мы всегда использовали формации как способ описания общей структуры команды. Но расстановка - это динамическое изменение структуры в течение 90 минут. Она основана на расположении мяча, контексте игры, стадиях игры», – отмечает Макрилл.
Большинство футбольных болельщиков привыкло знакомиться со стартовыми формациями, но расположение команды динамично в течение матча. На это влияет множество различных факторов. Схему расположения игроков команды принято записывать в фазе позиционной обороны, поскольку при атаке схема зачастую непостоянна. При атаке важны скорее общие принципы построения игры. Расстановка часто трансформируется в зависимости от установок тренера, качеств игроков, действий соперника, стадии матча и т.д.
«Мы стремились создать нечто такое, что в любой момент игры могло бы подсказать вам верную схему команды, нюансы внутри этой расстановки и то, какая формация наиболее эффективна для создания моментов», - говорит Макрилл.
Давайте рассмотрим другой пример из французской Лиги 1. Это снова «Монако», и на этот раз их защитник Бенуа Бадиашиль, выделенный и обведенный кружком, владеет мячом в полуфланге на своей половине поля.
В этой фазе игры модель Stats Perform's Shape Analysis определяет, что «Монако» действует по схеме 4-2-4 – правый защитник Рубен Агилар высоко поднимается на правом фланге, чтобы создать переднюю линию из четырех атакующих игроков:
Этот анализ позволяет выявить наиболее часто используемые командой схемы в течение матча или всего сезона, а также определить, какие из них наиболее эффективны для создания голевых моментов.
Например, анализ схем игры «Монако» в период их владении мячом в сезоне 2020/21 годов показывает, как часто они использовали фланговых игроков для создания четверки или пятерки игроков в последней линии – 46 процентов времени владения мячом:
Можно пойти дальше и определить, какая из этих схем была наиболее эффективной с точки зрения создания опасных моментов.
Это демонстрируется с помощью еще одной продвинутой метрики, Possession Value (PV), которая измеряет вероятность того, что команда, владеющая мячом, забьет гол в ближайшие 10 секунд – аналогично метрике xThreat, но с акцентом на вероятность гола, а не удара.
Possession Value показывает, что наиболее эффективной расстановкой при владении «Монако» мячом в сезоне 2020/2021 была 2-4-4, которая давала 4,7 PV на 100 владений – немного больше, чем 4-4-2 с высоко расположенными фланговыми полузащитниками:
Акцент на отражении таких фундаментальных аспектов игры с помощью данных сыграл решающую роль в новом релизе массива объединенных данных от Stats Perform. Очень важно, что это частая тема разговоров среди тренерских штабов.
«Для меня это попытка перевести эти данные на повседневный футбольный язык. Мы пытаемся взять вещи, которые уже знакомы тренерам и аналитикам, вещи, о которых мы говорим на тренировочных площадках каждый день, и пытаемся перевести это в нечто, что может быть принято болельщиками», – утверждает Макрилл.
Появление подобных данных в широком доступе помогает сократить пропасть между тренерами, аналитиками, клубами – с одной стороны, и болельщиками – с другой, так как это дает понимание происходящих на футбольном поле процессов. Это важная часть глобального, на наш взгляд, тренда роста потребности со стороны любителей футбола понимать закономерности происходящего во время игры. Это, в свою очередь, способствует повышению вероятности появления новых Рене Маричей (основателя сайта https://spielverlagerung.de, с 2017 года постоянно работающий помощником в тренерском штабе Марко Розе), что, конечно же, соответствует целям нашей школы футбольной аналитики Build Up School.
Оригинал материала на The Athletic
Следите за нами в Telegram, Instagram, VK и Sports.ru buildup-school.ru