Релевантность оценок WhoScored. Насколько верно они отражают качество игры футболиста?
Одним из интереснейших досугов человеческой жизни является сравнение. Причиной для сравнения может выступить любой мотив: выявление более комфортного предмета быта, эффективного способа достижения цели, лучшего представителя в каком-либо ремесле, оценки текущего состояния…
Недаром появилось выражение: «все познается в сравнении». Также и в футболе. У болельщиков, экспертов появляется желание определить лучшего, сравнить нескольких кандидатов, где-то доказать состоятельность своего фаворита на фоне менее привлекательного антагониста, ведь футбол, хоть и игра, но соревновательная, а смысл почти любого соревнования – определение сильнейшего. Для сравнения представители футбольной индустрии используют различные инструменты, и с развитием цифровизации все чаще обращаются к статистическим порталам, где массовый зритель видит, как статистические данные конвертируются в легкую для восприятия балльную оценку, и оперирует ею для констатации «победителя».
Сегодня хотелось бы поговорить об одном из представителей – статистическом портале «WhoScored». Предлагаю обсудить уязвимые моменты и оценить релевантность в оценках игры футболистов.
Что такое оценка WhoScored? Согласно официальному определению, это «уникальный всеобъемлющий статистический алгоритм, который базируется на более чем 200 статистических показателях, каждый из которых учитывается с различной степенью важности». Точная формула подсчета для игроков каждой из позиций, разумеется, не раскрывается, но ключевые показатели известны. Это те показатели, которые находятся в открытом доступе в отчетах WhoScored к матчам – отборы, перехваты, выносы, обводки, ключевые передачи, удары по воротам, точные навесы плюс результативные действия (цитирование: https://www.sports.ru/football/blogs/794158.html (статья Вадима Лукомского, советую к ознакомлению, где Вадим акцентировал внимание на том, что оценка в основе своей отображает активность игрока, нежели в полной степени «лучшесть»). В своей статье хочу обратить внимание на изъяны системы с другой стороны, со стороны «не учтенных параметров и излишней стандартизации».
Позиционирование.
Как говорил еще Йохан Кройф: «В среднем, игрок владеет мячом на протяжении 3 минут за матч, что доказано статистически. Так что самая главная вещь – чем он занят остальные 87 без мяча. Вот что определяет игрока как хорошего или нет». К сожалению, оценка игры футболиста без мяча отчасти протекает в плоскости субъективности, из-за чего давать справедливую оценку достаточно проблематично, и WhoScored не берет в рассчет ряд ключевых футбольных элементов.
«Футбол — это игра пространства и времени» – Хави.
И здесь сложно поспорить, но, чтобы эти переменные были на твоей стороне, необходимо создать определенные условия, за счет, в частности, игры без мяча. Это ложные движения игрока, когда он уводит соперника и освобождает зону для партнера (даже базовые движения «крестом» партнерами), это грамотное позиционирование для легкой траектории передачи от партнера, это насыщение зон (динамичность позиции игроков) – что касается атакующей фазы. При игре в обороне: грамотная интерпретация эпизодов при включении в прессинг-эпизоды, создания прессинг-ловушек – не сыграл плотно в прием, вышли через твоего игрока – все действия партнеров перечеркнуты (даже если игрок не потерял позицию и не оголил именно свою зону); теневое перекрытие передачи или грамотная позиция при игре в зоне, из-за чего в эту зону не идет передача и, как следствие, у защитника не появляется ситуация, чтобы заработать баллы на оборонительных действиях («Лучшая игра защитника — это такая игра, при которой передача вообще не идет в его зону» – Юрий Павлович Семин). Еще одним крайне недооцененным элементом при позиционировании защитника является грамотное плассирование. Особенно ярко данный навык проявляется при игре 2 в 1. Предлагаю рассмотреть пример игры Ван Дайка в эпизоде против двух игроков «Тоттенхема» от 31 марта 2019 года.



Ван Дайк одновременно перекрывал передачу на Сона и не пускал Сиссоко под сильную ногу. В итоге он вынудил его убрать мяч под левую ногу и сместился, максимально затруднив удар.

Но на оценку WhoScored это существенно не повлияло, так как это не отбор, совершенный будучи последним защитником.
Такие существенные, а где-то ключевые аспекты игры остаются недостаточно «воспетыми» при составлении оценки.
Технические элементы
Желание стандартизировать моменты для удобства подсчета убивает правильную оценку технического действия. Элемент, который хороший футболист делает на достойном уровне, элитный выполняет на первоклассном. Чтобы избежать некой голословности (хотя футажи я не подобрал), приведу примеры технических действий и разницу.
Обработка. Одним из аспектов элитных игроков является умение повышать скорость мяча, играя в одно-два касания, при обработке спиной к воротам соперника – разворот (даже под давлением) за счет одного, максимум двух касаний, иначе теряется темп и даже потенциал отличной продвигающей передачи партнера будет израсходован. Также это обработка мяча под давлением – один из наиболее ценных навыков при игре против активно прессингующего соперника (а тенденция в развитии футбольной индустрии именно такая), не зря даже пошло выражение «обыграл при приеме мяча» (игрок сумел принять мяч таким образом, что сразу же создал себе игровое пространство и выгодную позицию для дальнейших действий (обводки, передачи или удара)).
Передачи. «Техника — это не умение жонглировать мячом 1000 раз. Любой может сделать это, практикуясь. С таким же успехом можно работать в цирке. Техника подразумевает под собой умение отдать передачу в одно касание, с правильной скоростью, на удобную ногу партнера по команде» – Йохан Кройф. Здесь хотелось бы заострить внимание на «своевременности» и «удобстве», к сожалению, количественным показателям очень сложно оценить качественные, из-за чего комфортная передача Педри и передача в «больничку» от Санчеша будет иметь одинаковый вес при оценке (если партнер Санчеша первым сыграл в мяч).
Это что касается «культуры паса», также хочется обратить внимание на соотношение передач одного типа. Например, ключевые передачи. Сложность передач, дистанция удара партнера после полученной передачи и трудность нанесения удара крайне разнятся, но при этом обе передачи могут быть записаны как ключевые. Также стоит обратить внимание на некоторое обесценивание передач в подготовительной фазе атаки, особенно отрезающую немалую прессингующую группу, но на своей трети поля.
«Самый ценный футболист — тот, кто способен увидеть и исполнить передачу там, где остальные видят лишь пустоту» – Гус Хиддинк.
Здесь интересным контрастом могут выступить … шахматы, где также начисляются баллы за действия, и в банальном ходе нет ничего плохого, за него также начисляются баллы, только если не было возможности получить перевес, тогда «теоретический ход» превращается в «неточность», «ошибку», «упущенную возможность» или «зевок». В футболе такого нет, и упущенная возможность для передачи, особенно на подготовительном этапе, никак не карается, а происходит некоторое «уравнилово».
Ценность удара по xG. Немного хотелось бы зайти на поле оценки вратарей, которое, к сожалению, на мой взгляд, является самой сложной позицией для модельной оценки. На данный момент конъюнктура сложилась так, что массовый зритель оценивает голкиперов по проценту сейвов и Post-Shot Expected Goals (PSxG). Уязвимость данной системы в том, что дальний удар Фила Фодена и Абдукодира Хусанова различаются, но опасность по балльной метрике они несут одинаковую, что, на мой взгляд, не совсем справедливо.
Заключительным техническим действием, которое хочется рассмотреть, является «дриблинг». Помимо крайне трепетного определения дриблинга (непосредственное ведение мяча мимо защитника, зафиксированное техническим взаимодействием), устанавливающего различие между ним и «прокидыванием + бег» (пассивный прием мяча и последующий рывок за ним, который чаще фиксируется как удачный розыгрыш мяча, создание пространства или хорошая позиция), происходит стандартизация ценности этого дриблинга. Если игрок обыграл двух соперников, но по итогу вернулся к своим воротам, отдав передачу центральному защитнику на свою треть поля, получает больше баллов, нежели игрок, совершивший одну обводку, стянувший на себя еще подстраховку и отдавший передачу на второй темп, то опять же возникают вопросы к оценке игрока, и все больше программируется «modus operandi» на оценку активности игрока, нежели качества его выступления.
Персоналость
Как роль личности в истории, так и роль лидера на поле нельзя недооценивать. Помимо высокопарных слов по типу «синергии» игроков, хочется привести два конкретных типа игровых лидеров. Первый тип – лидер, начинающий прессинг команды (инициатор прессинга или стартер прессинга). Этот игрок первым вступает в борьбу против владеющего мячом соперника, заставляя его совершить ошибку либо вынуждая остальных членов команды поддержать инициативу и подключиться к активному отбору мяча. Яркими примерами в прошлом сезоне выступали Усман Дембеле (во второй части сезона) в «ПСЖ» и Мартин Одегар в «Арсенале». Второй тип – защитник, который руководит офсайдной линией команды (если выбирать термин, то с некоторой натяжкой и некоторой пошлостью можно назвать такого игрока «свипер»). Свипер играет чуть глубже основной линии защиты и отвечает за координацию положения защитников относительно нападающих соперника, особенно важно это при организации офсайдной ловушки. Свипер следит за соблюдением расстояния между защитниками и линиями нападения, обеспечивая правильное расположение всех игроков, чтобы избежать ситуаций, когда нападающий оказывается вне игры (офсайд). Эта роль требует особого тактического понимания игры и способности оперативно реагировать на перемещения партнеров и противников. Термин немного архаичный и требования к нему чутка изменились, но ключевые функции сохранились. Таким примером на протяжении всего прошлого сезона выступал Иньиго Мартинес, руководя обороной «Барселоны». Удобно, что некоторую ценность игрока мы можем оценить через последствия его потери.
Данными двумя ролями не ограничивается перечень возможных лидерских ролей, но они наглядно демонстрируют, что система WhoScored упускает тот факт, что в футбол играют люди, которым необходимо коммуницировать между собой для повышения эффективности взаимодействия. Основным субъектом взаимодействия становится лидер, который при помощи различных вербальных или невербальных знаков «задает общий тон композиции оркестра».
Ценность действия
Алгоритмы подсчета оценок на портале WhoScored скрыты от широкой аудитории, что вызывает немало вопросов, в частности, какая методика расчета баллов используется, как трактуются эпизоды при оценке (более детально) и какова ценность конкретных действий при подсчете оценок (вес компонента и чему равна его доля).
Так, желтая карточка, полученная в результате срыва опасной контратаки после неудачного рикошета, и желтая карточка, приобретенная в результате спора с рефери, имеют абсолютно разную природу, но имеют ли они различное отображение?
Также интересным моментом является то, что на определенном этапе оценки WhoScored могли повышать не только от результатов игрока, но и от общего итогового результата команды (https://medium.com/@dannypage/q-a-about-whoscored-ratings-160eebbbbccf).
Недостаточная дифференциация ролей
Один и тот же показатель (например, процент владения мячом) интерпретируется одинаково для игроков разных амплуа. Так, центральные защитники и атакующие полузащитники имеют разные требования к игре, но получают одинаковые баллы за одни и те же показатели.
Конкретный пример оценки игроков – сезон 2018/2019 АПЛ (пиковый сезон Ван Дайка, когда он занял второе место в голосовании за «Золотой мяч»)
Один из лучших сезонов среди центральных защитников, именно на этот сезон выпала, без преувеличения, легендарная серия матчей Верджила, когда его никто не мог обыграть на протяжении 65 матчей. По итогам сезона «красные» заняли второе место с рекордными для вице-чемпионов 97 баллами, став самой надежной обороной в АПЛ, пропустив всего 22 мяча.

Нидерландский защитник получил справедливую высоченную оценку в 7.44 балла.
Но, возможно, Вы могли забыть, но буквально годом ранее был схожий перформанс. Ничего страшного, WhoScored напомнит. Не менее легендарный Шкодран Мустафи в сезоне 2017/2018 наиграл на оценку 7.38, что всего лишь на 0.06 уступает результату лучшего сезона Ван Дайка (в АПЛ). Количество выступлений, конечно, скромнее, но 25 матчей, на мой взгляд, немалая выборка.
Но ничего страшного, уже через год (в сезоне 2018/2019) Мустафи дошел (хотя по оценкам упал) до уровня лучшего защитника чемпионского «Манчестер Сити» (Эмерика Лапорта), пропустившего всего 23 мяча (у каждого игрока оценка – 7.05).

Также хотелось бы акцентировать внимание на персоне Джеймса Тарковского. Его «Бернли» пропустил за сезон 68 мячей, но английский защитник опережает всех своих коллег (кроме Ван Дайка) по средней оценке, что еще раз наглядно сигнализирует о том, что оценки WhoScored отображают активность игрока, нежели его качественное превосходство (возможна некая корреляция, но явно не многоколлинеарность).
Статистика в футболе бесполезна?
Конечно, нет. Я лишь хотел обратить внимание на правильность ее прочтения и важную роль контекста, в очередной раз обратившись к цитате Бенджамина Дизраэли: «Есть три вида лжи: ложь, наглая ложь и статистика», – и подытожить фразой: необходимо свои наблюдения подкреплять статистикой, а не на ее основе выводить закономерности, иначе есть риск неправильной интерпретации. Футбол – динамичная игра со множеством переменных, и, чтобы задать релевантную и не перегруженную модель, правильно ее интерпретировать, необходимо мыслить шире оценок на статистических порталах (либо воспринимать их не как оценки «качества выступления», а, скорее, как количественный аспект, активность). Так в футболе есть успешные «амбассадоры» продвинутой статистики (помимо того, что все клубы развиваются в данной области, но при этом оставляют в своем штате селекционного отдела классических скаутов) – «Брайтон», «Брентфорд» и т.д. На более раннем периоде одним из основоположников активного использования продвинутой статистики для оценки игроков был мсье Арсен Венгер (в большей степени на этапе подготовки своих игроков, нежели скаутинге), которому хотелось отдать некую дань уважения.
Венгер стал главным тренером «Арсенала» осенью 1996 года. Уже тогда он выделялся своим вниманием к деталям и научной методологии подготовки спортсменов. До прихода Венгера большинство клубов полагались больше на опыт и интуицию тренеров, чем на количественный анализ данных. Он внедрил использование компьютерных баз данных для систематизации тренировок и мониторинга физической формы игроков. Это было необычно для британского футбола тех времен, где редко применялись цифровые технологии для оценки эффективности. Клуб закупил специализированное программное обеспечение, позволяющее анализировать нагрузки, физическую готовность и прогресс каждого игрока индивидуально.
Одной из первых мер стало внедрение системы отслеживания движения игроков с использованием GPS-датчиков. Эти устройства позволяли собирать подробную информацию о расстоянии пробега, скорости передвижения, ускорениях и усталости игроков во время матчей и тренировок. Такой подход позволил оптимизировать интенсивность нагрузок и минимизировать риск травм. Под руководством Венгера клуб расширил свою команду сотрудников, включив профессиональных аналитиков, занимающихся обработкой данных. Они начали создавать модели поведения игроков, изучали факторы успеха отдельных исполнителей и групповых взаимодействий. Благодаря этому появилась возможность объективно оценивать эффективность и качество игры, выявлять сильные стороны игроков и корректировать стратегию. Используя накопленные данные, тренер мог принимать обоснованные решения о ротации состава, замене уставших игроков и выборе оптимальной схемы игры.
Например, в сезоне-2003/2004, когда команда выиграла Премьер-лигу, практически не проиграв ни одного матча, важнейшую роль сыграл детальный анализ выступлений и стратегии каждой встречи. Сегодня методы, введенные Венгером, стали стандартом современного футбола. Большинство топ-клубов используют аналогичные подходы, внедряют продвинутый анализ данных и занимаются углубленным мониторингом состояния игроков. Таким образом, Арсен Венгер заложил основу научного подхода в английском футболе, сделав применение статистики одним из ключевых факторов успешной работы тренера.
Содержательная статья про Арсена Венгера:https://www.sports.ru/football/blogs/931613.html
Спасибо за внимание! Статья достаточно субъективна, поэтому буду рад ответить на вопросы, дополнить размышления и обсудить Ваши мысли в комментариях.
Но критика того, что данные системы не могут правильно оценить ТТД, местами завышена, местами вообще неверная.
Например, если футболист хорошо работает с мячом, он будет совершать меньше потерь, может быть, будет провоцировать на себе больше фолов и тд. В итоге оценка будет выше, чем если бы он плохо работал с мячом. Особенно это будет заметно на дистанции.
Если футболист обладает высокой культурой паса, многие его передачи будут развивающими атаку или создающими острые моменты. А если в атаке забивные партнёры с хорошей реализацией, то и голевых передач будет больше. Как следствие, это положительно отразится на оценке.
Если игрок обвёл соперника, но потом отдал пас на свою половину поля (оставим за скобками вопрос "зачем?", примем как данность), то он получит плюсик за обводку, но не получит плюсик за "создание момента" или "обостряющую передачу". Всё справедливо. Ну и представить такой нелепый сценарий (обводка и пас своему вратарю) в качестве регулярного крайне сложно. Чаще после обводки либо следует попытка создать момент (допустим, навес/прострел) или хотя бы просто пас ближнему (де Йонг этим грешит), который уже дальше пробует что-то придумать. Так что на дистанции кто хорошо обводит, тот молодец. Гораздо чаще случается ситуация, когда игрок идёт с мячом на нескольких, обводит одного, второго и на третьем оппоненте запутывается в собственных ногах и по сути получается, что теряет мяч, но отрицательное действие (потеря) компенсируется положительным (обводкой или даже двумя). Вот тут есть пространство для совершенствования системы.
Реальная проблема с оценкой обводок - система не оценивает зоны обводок (обвести в опорной зоне, где толпа соперников, намного сложнее, чем на фланге, где может не быть подстраховки). Вторая проблема с обводками - обыгрыш нескольких соперников в одном проходе оценивается как несколько обводок, а не одна обводка с обыгрышем нескольких соперников. В итоге человек, который может обвести только 1 в 1 (допустим, на фланге пробросил и почесал на скорости за мячом), может оказаться лучше того, кто обвёл 2-3 человек и дезорганизовал оборону соперника. Правда, это компенсируется тем, что такие проходы случаются значительно реже и в целом не оказывают большого влияния на оценку.
В общем, нужна дифференциация обводок, как это сделали с передачами и ударами.
Что касается оценки защитников, то здесь точно так же на оценку работает косвенная польза. Если игрок совершает меньше отборов, то он и фолит меньше, получает меньше карточек (а за это система штрафует).
Так что данные системы оценивают именно качество, а не активность. Просто они не настолько хороши, чтобы дать идеальную оценку, которая отразила бы всё-всё-всё. Но этого и не нужно. Их ценность не в том, что они являются истиной в последней инстанции (конечно, нет), а в том, что они являются беспристрастными. На что человек наиграл, то и получает.
Например, распространено мнение, что Месси в ПСЖ провалился. Я говорю - это не так. Мне могут сказать - ты фан Месси и даже если он играет плохо, ты просто этого не хочешь видеть. И вот тут можно ткнуть этого чела (который в свою очередь на самом деле, как правило, хейтер Месси со стажем) в оценку хускорда. В первом сезоне он уступил в Лиге 1 только Мбаппе со статистикой, емнип, 29+15 (у Месси 6+14). Причём сколько уступил? Всего 0,1 или 0,2 балла. Учитывая повышенный вес голов и ассистов в итоговой оценке можно, даже не видя игры Месси, понять, что он просто лучше всех играл в футбол, не было никакого провала. Собственно, наглядное подтверждение тезиса, что игра Месси - это не только голы. Ну а во втором сезоне, когда голевая статистика стала получше, хотя и не улетела в космос (16+16) он стал у хускорда и софаскора лучшим с отрывом. Системы не идеальны, но беспристрастны. Хорошо пасуешь, хорошо развиваешь атаки, создаёшь много моментов - это в итоге отразится в оценках независимо от имени и статуса. А если делаешь это лучше всех, то и оценка будет лучше всех. Поэтому я могу смело утверждать, что мне не показалось, что Месси был лучшим в ПСЖ и не было никакого провала или, как некоторые утверждали, он хорошо сыграл только на ЧМ.