11 мин.

Видели новую статистику в трансляциях ЧМ? Это детище Венгера и потенциальный прорыв в осмыслении игры

Но пока много проблем.

В матчах ЧМ мы часто встречаемся с новой статистикой – владение с разделением на три категории, среднее время возврата мяча и другие показатели:

Погружаемся в новые метрики и историю их возникновения.

Как и почему появилась новая статистика? Что она означает?

Это инициатива Арсена Венгера. С ноября 2019-го француз работает в ФИФА. Одна из его обязанностей – технический анализ турниров под эгидой организации. ЧМ – первая большая проверка Арсена и его группы в этом отношении. Технические отчеты после турниров с привлечением известных тренеров для анализа – давняя практика ФИФА и УЕФА. 

В этот раз благодаря Венгеру пошли дальше – до турнира появился ряд общедоступных углубленных показателей для анализа, которые мелькают в трансляциях и послематчевых статистических отчетах. Новую статистику назвали «The 11 EFI metrics» (Enhanced Football Intelligence Metrics – «углубленные метрики футбольного интеллекта»). По смыслу – скорее «показатели углубленного осмысления футбола».

«Хотим поделиться своим видением использования данных в футбольной аналитике в комбинации с интерпретацией технических экспертов. Мы верим, что это создаст новый уровень глубины осмысления футбола и поможет всем лучше понимать игру», – анонсировал Венгер.

Коротко пройдемся по 11 метрикам Венгера:

Новое владение – подсчет с тремя категориями «команда А», «команда Б», «борьба за мяч». Последнее – это ситуации, когда ни одна команда не имеет контроля над владением (но мяч находится в игре; паузы в статистику не идут вообще). Классический пример – дальний пас, верховая борьба и попытка выиграть подбор. Эти секунды борьбы заносятся в новую категорию. 

Время возврата мяча (ball recovery time) – среднее время, которое команда затрачивает, чтобы вернуть мяч. 

Разбитие линий соперника (line breaks). Примером такого действия может быть пас, который продвигает атаку и проходит между двумя полузащитниками (защитниками) в схеме соперника («разбивает» линию). Разбивать линию можно и с помощью проходов, если выполняется описанное условие – игрок с мячом проходит между игроками одной линии в схеме соперника.

Высота линии защиты и компактность команды (defensive line height and team length) – средняя высота линии защиты в метрах в стадии владения и в стадии обороны. Компактность тоже измеряется в метрах – расстояние между самым низким и высоким игроком по схеме (аналогично между фланговыми).

Входы на чужую треть поля (final third entries).

Спровоцированные переходы мяча (forced turnovers) – ситуации, в которых мяч переходит от одной команды к другой под давлением. Игрок, оказавший это давление, получает себе в статистику такое действие. Если давление при переходе мяча оказывала группа игроков, то все получают себе балл.

Прессинг-действия (pressure on the ball) – все попытки оказывать давление, включая те, которые не завершаются переходом мяча к команде.

Ожидаемые голы (expected goals) – хорошо знакомая нам метрика, которая отражает совокупную остроту моментов команды с учетом контекста ситуаций, в которых наносятся удары. 

Схема команды (team shape). Основана на средних позициях игроков. Отдельно приводится схема при владении и схема без мяча. 

Получения мяча за линиями полузащиты и защиты соперника (receptions behind midfield and defensive lines) – количество успешных передач, которые принимает игрок между линий и за последней линией в схеме соперника. Показатель плотно связан с пасами, которые разбивают линию, но тут в центре внимания принимающий игрок. 

Фазы игры (phases of play) – разделение всех действий в матче на 15 фаз. 9 в обороне и 6 в атаке. Насколько примеров оборонительных – «низкий блок», «средний прессинг», «переход в оборонительную схему». В атаке – «контратака», «билдап», «дальние пасы». Пропорция времени в каждой фазе игры измеряется в процентах. 

На специальной странице все метрики объясняются в деталях и с видеопримерами. Еще есть подробный текстовый документ. ФИФА действительно доступно и наглядно описывает новые метрики. Проблема была скорее в распространении информации – среди болельщиков и тех, кто помогает им смотреть футбол. По секрету: я лично показывал некоторым комментаторам эти ссылки после резонно возникавших вопросов. 

В трансляциях эти метрики стараются показывать по 2-3 раза за тайм – как правило, 10-я, 25-я и 40-я минуты таймов. Со сдвигом на 2-3 минуты в зависимости от событий матча. По замыслу Венгера эти показатели постепенно должны стать узнаваемым и полезным дополнением к просмотру матчей. Но у режиссеров трансляций по ходу турнира явно появились любимчики – параметры, которые попроще и годятся для вывода именно в лайве (а не в перерыве или после матча). Это владение, время возврата мяча, спровоцированные переходы мяча, получения мяча за линиями полузащиты и защиты соперника. Остальные мелькают ощутимо реже (ниже расскажем, где их смотреть самостоятельно).

Где смотреть эти данные после матча? Насколько они полезны? В чем недостатки?

Каждый параметр в отдельности выглядит интересным и полезным при грамотном использовании. Конечно, лучше иметь к ним доступ, чем не иметь. Здорово, что их теперь считают – некоторые вообще были разработаны с нуля группой Венгера. Это большой плюс, но есть и минусы. 

Главный челлендж в трансляциях – сочетание трудного содержания некоторых показателей с необходимостью выводить данные в 1 строку (максимум 3, если речь о лидерах в категории). По этой причине некоторые метрики вообще оказываются непригодны для прямого эфира. Например, 15 фаз игры. Полезное разделение, но сугубо для послематчевых отчетов. 

Идеальным в плане баланса выглядит показатель «время возврата мяча». Выполняется три ключевых условия: 1) интуитивно понятен даже без определения; 2) содержательно полезен (показывает, насколько команда активна в прессинге и контрпрессинге –  чем быстрее возвращает мяч, тем активнее); 3) легко выводится в одну строку.

Неудивительно, что по популярности у режиссеров он занимает четкое второе место сразу за обязательной и попсовой статистикой владения. Его все еще показывают в первую очередь, хотя апгрейд показателя с делением на три составляющих выглядит спорным. Он перестал быть интуитивно понятным. 

Сама точность в подсчетах и дополнительное деление – крутой шаг, но точно ли нужно было добавлять третью категорию («борьба за мяч»)? Ее можно считать и учитывать таким образом, но исключать из графики, пересчитывая проценты без времени борьбы за мяч. Так точность сочеталась бы с классикой. Разделение на три категории можно было бы оставить для послематчевых отчетов. 

У других показателей еще более серьезные проблемы в трансляциях. Разберем на примере «получений мяча за линиями полузащиты и защиты соперника». Проблема: в этот показатель включается огромное количество слишком разных по важности и особенностям развития атаки показателей. Это очевидно даже из названия: получение мяча между защитой/полузащитой соперника и получение после передачи за спину защитникам – очень разные действия. Но тут они объединяются. 

Также важна зона, в которой игрок получает мяч – на фланге, в полуфлангах или в центре. Получения на флангах – намного менее опасные с точки зрения близости к острой ситуации. Соперники не так защищают эти зоны. Но в статистике простой пас вдоль фланга от Уокера на Сака ценится так же, как тонкая разрезающая голевая передача Месси на Молину. В этом опасность объединения столь разных действий под один показатель. 

Другой важный фактор, который необходимо учитывать – тип передачи. Перевод, вертикальная верхом или низом. Это совсем разные типы развития атаки. Делание помогает лучше понять, как именно команда действует в конкретной зоне. 

Самое интересное: все эти проблемы очевидны создателям показателя. В объясняющем видео они проговаривают важность такого деления. Еще добавляют собственное разделение на получение мяча – «внутри схемы соперника» (более ценные и трудные) и «за пределами схемы» (менее ценные и простые):

Все эти деления есть в послематчевых PDF-отчетах на 50 страниц. В трансляциях мы наблюдаем категорически упрощенную картину:

Из-за этого некоторые показатели выглядят вообще бесполезными в контексте трансляций. Что можно сказать из выведенной выше статистики из трансляции матча Англия – Франция? Что Англия больше атакует и что атакуют через зону, где располагаются Сака и Хендерсон (удачно совпало, что игроки одной зоны в топе). Часто нельзя сказать даже этого.

Теперь давайте подумаем, чего мы не знаем об этих «получениях мяча»:

• Сколько из них между линиями защиты и полузащиты, а сколько за спину защитникам? Они все объединены; 

• Сколько в центральной зоне, а сколько на флангах? Они все объединены; 

• Сколько в статичном положении, а сколько на скорости? Они все объединены; 

• Сколько в результате переводов, а сколько простыми пасами низом? Они все объединены. 

ФИФА считает все эти данные, но не выводит, чтобы не перегружать нас информацией. На выходе информация, которая до нас доходит, часто выглядит упрощенной до бесполезности. Это усугубляется тем, что комментаторы не всегда в курсе деталей и пытаются дать осмысление общей цифре, хотя в таком формате она не пригодна для осмысления. 

Я не предлагаю выводить все-все. Просто стараюсь описать ловушку, в которой оказалась ФИФА в попытках сочетать углубленную статистику с массовым зрителем. В трансляциях все должно быть просто, но в некоторых случаях простота убивает суть показателя. 

При желании углубленно работать с данными уже после матчей возникают другие проблемы. Венгер анонсировал «фантастически удобный матч-центр», но на деле у нас есть только матч-центр ФИФА, в котором новые метрики представлены скудно. Почти нет персональной статистики по игрокам – в конце страницы представлены лидеры, а общего списка нет вообще. 

Также есть менее заметная страница с PDF-отчетами по каждому матчу. С точки зрения содержания – это золото. Там есть вся обещанная детализированная статистика. Проблема в не очень удобном для работы с данными формате. Также у ФИФА нет страницы с данными за весь турнир, а не только по матчам. 

Конечно, здорово, что есть сами данные – и энтузиасты даже в таком виде будут их обрабатывать. Но простой болельщик не будет вбивать значение каждого показателя себе в эксель или другую программу, чтобы получить данные по команде за весь турнир. А без этого труднее сопоставлять команды/игроков или хотя бы получить представление об усредненных значениях показателя для позиции, чтобы лучше понимать, какое значение выглядит круто, а какое – слабо. 

***

Новые данные ФИФА – потенциальный прорыв и большой шаг вперед. Аналоги этих показателей давно считают внутри клубов и аналитических компаний, но многие из них не были доступны простым зрителям.

Но пока прорыв лишь потенциальный. ФИФА находится в ловушке. Большая часть углубленных показателей оказалась слишком трудной для трансляций. Это хорошо видно по поведению режиссеров, которые в итоге используют лишь 3-5 параметров с упором на 2 самых любимых (владение и время возврата мяча).  

В то же время трудные и потенциально полезные гик-аудитории показатели очень неудобно обрабатывать после матчей. Данные уникальные, но навигация в разы уступает той, которая есть на статистических сайтах вроде WhoScored или FBref

Эти проблемы не выглядят неразрешимыми. Сделать полноценный матч-центр с послематчевой статистикой и выводить более точечную, но понятную статистику по ходу матчей (взять для этого отдельного человека) – простые задачи для организации с возможностями ФИФА (даже удивительно, почему до сих пор не сделали). 

В то же время можно порадоваться появлению новых показателей. В полном формате с нужными делениями по категориям они правда крутые. Раньше ничего подобного в открытом доступе не было.

Гризманн проводит великий ЧМ. Тащит на обеих половинах, тогда как магия Месси и Мбаппе строится на отказе от обороны

Фото: REUTERS/Matthew Childs