От короткого паса до длинного заброса: алгоритмы разоблачают стили атак
Всем привет!
Это моя первая статья на Sports.ru, и я хочу показать, как анализ данных позволяет взглянуть на футбол по-новому. В своих материалах я буду рассказывать, как с помощью кода можно анализировать матчи, подбирать игроков для клубов на основе стиля игры, прогнозировать исходы матчей и многое другое.
Футбол — это динамичная и многогранная игра, в которой каждая команда стремится выработать свой уникальный стиль ведения атак. Однако, несмотря на разнообразие тактических подходов, можно проследить определённые закономерности в том, как команды строят игру: как они переходят из обороны в атаку, каким образом создают голевые моменты и как завершают атаки. Анализ этих аспектов позволяет глубже понять футбольные стратегии, выявить наиболее эффективные модели игры и даже предсказать поведение команд в разных ситуациях.
В данной статье проводится анализ атакующих действий команд из топ-5 европейских лиг с целью выявления сходств и различий в их стратегиях развития атак. Опираясь на данные с платформы FBref и используя методы кластерного анализа, мы определяем количество характерных групп (кластеров) и изучаем их ключевые особенности. Это позволяет не только выявить общие тенденции, но и выделить уникальные тактические модели, применяемые в ведущих чемпионатах Европы. Мы пройдём весь путь — от сбора и подготовки данных до детального анализа полученных кластеров, чтобы лучше понять, какие стили атаки доминируют в современном футболе.
Для анализа возьмём данные из топ-5 европейских чемпионатов с платформы FBref. Мы отберём только те показатели, которые напрямую характеризуют стиль развития атак, исключая метрики, связанные с реализацией моментов. Кроме того, данные будут нормированы по владению мячом, чтобы команды с разным процентом владения не искажали картину. Это позволит нам сосредоточиться исключительно на различиях в построении атак.
В качестве ключевых параметров я выбрал следующие показатели:
Типы передач по дистанции:
Short_Att – процент коротких передач (короткие передачи / все точные передачи)
Medium_Att – процент средних передач
Long_Att – процент длинных передач
Типы передач по характеру выполнения:
Pass Types_Live – процент передач с игры (все передачи с игры / общее количество передач)
Pass Types_TB – процент передач-разрезов (through ball)
Pass Types_Sw – процент переводов (switch)
Pass Types_Crs – процент кроссов (cross)
Касания мяча в зонах поля:
Touches_Def Pen – процент касаний в своей штрафной
Touches_Def 3rd – процент касаний в своей трети поля
Touches_Mid 3rd – процент касаний в средней трети
Touches_Att 3rd – процент касаний в атакующей трети
Touches_Att Pen – процент касаний в штрафной соперника
Обводки и продвижение мяча:
Take-Ons_Att – попытки обводок за 90 минут
Carries_TotDist – средняя дистанция продвижения мяча за одно ведение
Carries_PrgDist – средняя дистанция прогрессивного продвижения мяча (ведение вперед)
Carries_1/3 – процент ведений, доведенных до финальной трети
Carries_CPA – процент ведений, которые закончились входом в штрафную
Анализ атакующих стилей команд требует работы с числовыми данными, представляющими различные метрики атак. Однако перед проведением кластеризации или других методов машинного обучения необходимо привести данные к единому масштабу.
В рамках подготовки данных выполняется предварительная обработка, включающая удаление нечисловых признаков, таких как название команды и лига, а также стандартизацию данных. Стандартизация необходима, поскольку различные метрики могут иметь разный масштаб – например, процент владения мячом выражается в диапазоне от 0 до 100, а попытка обводок имеют значительно меньшие значения.
Для нормализации данных используется метод стандартизации, который приводит каждый признак к распределению со средним значением 0 и стандартным отклонением 1. Это позволяет исключить влияние разницы в масштабах признаков, что особенно важно для алгоритмов кластеризации и анализа главных компонент (PCA).
После преобразования данные становятся готовыми для дальнейшего анализа, включая определение количества кластеров и выявление характерных атакующих стратегий команд. Такой подход обеспечивает корректность результатов и делает возможным выявление схожести между командами в ведущих чемпионатах Европы.
После приведения данных к единому масштабу с помощью стандартизации следующим этапом подготовки является снижение размерности. Данные о стиле атак команд содержат множество переменных, что может усложнять интерпретацию и анализ. Чтобы выделить наиболее значимые направления вариации и упростить обработку, применяется метод главных компонент (PCA).
Метод главных компонент (Principal Component Analysis, PCA) — это статистический метод, который позволяет уменьшить число признаков в данных, сохранив при этом максимальное количество информации. Он преобразует исходные признаки в новый набор переменных (главных компонент), каждая из которых является линейной комбинацией исходных данных. Главные компоненты выбираются таким образом, чтобы они объясняли наибольшую дисперсию данных. Первая компонента объясняет наибольшую часть изменчивости в данных, вторая — следующую по значимости, и так далее. Это позволяет уменьшить размерность данных без значительной потери информации.
В данном исследовании используется три главные компоненты, что позволяет сохранить основную информацию о различиях между командами, одновременно уменьшая размерность признакового пространства. PCA трансформирует исходные стандартизированные данные в новую систему координат, где каждая главная компонента представляет собой линейную комбинацию исходных признаков.

Анализ полученных главных компонент даёт возможность оценить вклад различных признаков в структуру данных, а также визуализировать распределение команд в новом пространстве. Это облегчает дальнейшую кластеризацию и помогает выявить группы команд с похожими атакующими стилями.
После подготовки данных и снижения их размерности с помощью PCA следующим этапом является кластеризация. Однако прежде чем применять алгоритм, необходимо определить оптимальное количество кластеров. Одним из популярных методов для этого является метод локтя (Elbow Method).

После определения оптимального количества кластеров следующим этапом анализа является их формирование. Для этого применяется агломеративная кластеризация (Agglomerative Clustering) — метод, относящийся к иерархическим алгоритмам, который постепенно объединяет объекты в группы на основе их схожести.
В данном исследовании используется модель агломеративной кластеризации с пятью кластерами (n_clusters=5), число которых было определено с помощью метода локтя. Алгоритм начинает с того, что каждая команда рассматривается как отдельный кластер, после чего на каждом шаге объединяются ближайшие группы, пока не останется заданное количество кластеров.
После обучения модели каждой команде присваивается номер кластера, который добавляется в исходные данные. Это позволяет не только визуализировать распределение команд по группам, но и анализировать ключевые характеристики каждого кластера. В дальнейшем такое разбиение поможет выявить закономерности в атакующих стилях команд и сравнить их тактические подходы.

На основе кластеризации команд по атакующим стилям можно выделить пять групп, каждая из которых обладает уникальными характеристиками.
🔹 Кластер 0 – «Оборонительные прагматики»
📌 Стиль игры:
Ориентированы на надежную оборону и игру вторым номером. Часто используют длинные передачи, меньше вовлекаются в контроль мяча и продвигают мяч в атаку за счёт кроссов и быстрых переходов.
📑 Характеристики:
Высокая доля длинных передач
Небольшое количество касаний в атакующей трети
Умеренное владение мячом
📍 Команды в кластере:
Augsburg, Bochum, Brest, Cagliari, Como, Crystal Palace, Empoli, Freiburg, Genoa, Gladbach, Hoffenheim, Holstein Kiel, Las Palmas, Leganés, Leicester City, Mainz 05, Monza, Saint-Étienne, St. Pauli, Strasbourg, Torino, Union Berlin, Valladolid, Werder Bremen, Wolfsburg
🔹 Кластер 1 – «Сбалансированные позиционщики»
📌 Стиль игры:
Команды, которые используют смешанный подход, чередуя позиционные атаки с быстрыми переходами. Имеют хорошую структуру владения мячом и могут варьировать темп игры.
📑 Характеристики:
Высокая точность коротких и средних передач
Средняя активность в атакующей трети
Умеренное продвижение мяча через дриблинг
📍 Команды в кластере:
Atalanta, Athletic Club, Barcelona, Bologna, Celta Vigo, Dortmund, Girona, Inter, Juventus, Lazio, Lille, Marseille, Milan, Monaco, RB Leipzig, Real Sociedad, Roma, Sevilla, Stuttgart, Toulouse
🔹 Кластер 2 – «Доминаторы владения»
📌 Стиль игры:
Команды, которые стремятся контролировать игру через владение мячом. Отличаются высоким количеством передач, активным участием полузащиты в построении атак и сравнительно меньшей зависимостью от длинных передач.
📑 Характеристики:
Высокий процент владения мячом
Большое количество касаний в средней зоне
Много коротких передач и продвижения через дриблинг
📍 Команды в кластере:
Aston Villa, Betis, Bournemouth, Brentford, Brighton, Eintracht Frankfurt, Everton, Fulham, Ipswich Town, Manchester Utd, Newcastle Utd, Nice, Nottingham Forest, Parma, Reims, Southampton, Tottenham, Villarreal, West Ham
🔹 Кластер 3 – «Прессингующие вертикальщики»
📌 Стиль игры:
Активно используют высокий прессинг и быстрое продвижение мяча. Такие команды играют интенсивно, делают много передач в финальную треть поля, но не всегда контролируют мяч продолжительное время.
📑 Характеристики:
Высокий показатель передач в финальную треть
Интенсивный прессинг и быстрая игра вперед
Частое использование длинных передач
📍 Команды в кластере:
Alavés, Angers, Auxerre, Espanyol, Fiorentina, Getafe, Heidenheim, Hellas Verona, Le Havre, Lecce, Mallorca, Montpellier, Nantes, Osasuna, Rayo Vallecano, Udinese, Valencia, Venezia, Wolves
🔹 Кластер 4 – «Быстрые комбинационщики»
📌 Стиль игры:
Топ-команды с высокой динамикой игры, которые сочетают владение мячом с быстрыми атаками. Часто используют короткие комбинации, активны в атакующей трети и эффективно продвигают мяч вперёд.
📑 Характеристики:
Самый высокий процент коротких передач
Высокая интенсивность продвижения мяча
Максимальное количество касаний в атакующей трети
📍 Команды в кластере:
Arsenal, Atlético Madrid, Bayern Munich, Chelsea, Lens, Leverkusen, Liverpool, Lyon, Manchester City, Napoli, Paris Saint-Germain, Real Madrid, Rennes
Данный анализ, основанный на кластеризации атакующих стилей команд из топ-5 европейских чемпионатов, предоставляет углубленное понимание тактических подходов, которые определяют игры различных клубов. В отличие от традиционного подхода, когда команды классифицируются по их текущей силе или позициям в таблицах, этот метод позволяет выявить их специфические атакующие стратегии, которые могут быть значимыми при оценке их производительности и поведения на поле.
Кластеризация по атакующим стилям помогает не только разделить команды на группы по их тактическим предпочтениям, но и дает возможность наблюдать за более глубокими трендами, которые определяют, как клубы подходят к организации своих атак. Мы видим, что в каждой группе команды придерживаются определенной философии игры: от контратакующих и оборонительных подходов в кластере 0 до динамичных и комбинационных атак в кластере 4. Это разделение особенно важно для тренеров и аналитиков, которые могут использовать эти данные для тактической подготовки к матчам, например, в контексте того, как противостоять различным стилям атак.
Кроме того, анализ позволяет выявить тренды и изменения в европейском футболе. Например, команды, такие как Manchester City, Bayern Munich, Chelsea и Paris Saint-Germain, активно показывают растущий акцент на комбинационном футболе с быстрыми переходами, что является отражением более общего тренда в современном футболе, где важнейшими характеристиками становятся скорость игры и тактическое разнообразие. С другой стороны, такие клубы, как Augsburg или Bochum, показывают склонность к более прагматичным, оборонительным подходам, что может указывать на стратегии, ориентированные на сохранение оборонительных позиций и игру в контратаках.
Для подготовки к матчам этот анализ представляет собой мощный инструмент для предсказания поведения команды в атакующих фазах игры. Знание атакующего стиля противника позволяет адаптировать стратегию для нейтрализации их сильных сторон или, наоборот, для использования уязвимостей. Например, команда, играющая в стиле контратак, скорее всего, будет уязвима к прессингу, в то время как команда, ориентированная на владение мячом, может быть подвержена потерям мяча в высоко прессингующих ситуациях.
Кластеризация также дает ценную информацию для долгосрочного анализа: она позволяет тренерам и аналитикам наблюдать за эволюцией тактических предпочтений команд. В условиях быстрой трансформации футбольных стилей, когда тренеры и клубы постоянно ищут новые способы адаптации к игровым тенденциям, такое исследование помогает понять, как изменяются предпочтения команд, какие стратегии доминируют в данный момент и какие подходы могут стать более популярными в будущем.
В заключение, кластеризация атакующих стилей команд представляет собой важный шаг к более глубокому пониманию футбольной тактики, который выходит за рамки традиционных статистических показателей, таких как голы, передачи или владение мячом. Это исследование подчеркивает важность тактической идентичности каждой команды и её адаптации к изменяющимся трендам в европейском футболе. Такой подход может стать основой для более точных прогнозов и подготовок к матчам, а также для долгосрочного анализа стратегий, влияющих на развитие игры на самых высоких уровнях.