Практика анализа данных: Справедливое сравнение игроков
Выпусник Футбологики, скаут Александр Борисов собирает на своем телеграм-канале переводы интересных статей и подготовил эксклюзивный материал, наглядно иллюстрирующий то, каким образом нужно воспринимать статистические показатели. Представьте, что вы хотите оценить двух бегунов на средние дистанции на основе расстояния, которое они пробежали. У первого бегуна есть 12 минут, чтобы завершить свой забег, в то время как у второго на это есть 15 минут.
Несправедливо? Да, конечно, но это то, что мы делаем, когда не корректируем количественные показатели эффективности в нашем анализе данных.
То, что пасующий монстр ПСЖ Марко Верратти совершает около 90 касаний мяча за игру, просто невероятно. Тем не менее, процент владения мячом у ПСЖ превышает 60%. Было бы несправедливо их сравнивать без корректировки, например, с Жаном Онаной, у которого 47 касаний мяча при том, что «Бордо» владеет мячом 48%. Эта статья даст практический ответ о справедливой сопоставимости и корректировки статистики игроков.
Для того чтобы справедливо сравнивать результаты игроков, важно привести абсолютные и количественные значения к общему знаменателю. Другими словами, значения сначала должны быть скорректированы таким образом, чтобы их можно было справедливо сравнивать и чтобы они были максимально надежными и значимыми.
Корректировка показателей не нова и используется уже много лет. В этой статье будут описаны несколько способов очистки количественных показателей для защиты и нападения.
ПОКАЗАТЕЛИ ЗА 90 МИНУТ (p90)
Показатели за 90 минут (p90) являются хорошей отправной точкой для того, чтобы показать производительность игроков более ощутимой и сопоставимой. Но не более того.
ПОВЫШЕНИЕ ЗНАЧИМОСТИ ПОКАЗАТЕЛЕЙ ЗАЩИТЫ
Давайте сначала рассмотрим защитные, количественные или основанные на объеме, показатели. Например, количество единоборств в обороне, перехватов, подкатов, блокированных ударов и т.д. Все эти действия выполняются, когда мяч находится у соперника. Но если мы используем только количество действий за 90 минут, то видим истинность только абсолютного числа. Очевидно, что центральный защитник «А» с 9 перехватами в игре имеет большую ценность, чем центральный защитник соперника «В» с 7 перехватами. Но это только половина правды. Если команда игрока «A» владела мячом только 40%, а команда игрока «B» владела мячом 60%, то это меняет рейтинг. У «А» было 60% игрового времени на 9 перехватов, в то время как у «B» было всего 40% игрового времени на 7 перехватов.
Если мы скорректируем значение перехватов на справедливую и равную продолжительность (50% владения мячом), то внезапно у «B» будет лучшее значение, чем у «А».
«A» (9/60*50) = 7,5 скорректированных перехватов
«B» (7/40*50) = 8,75 скорректированных перехватов Нескорректированные количественные показатели защиты (p90) благоприятствуют игрокам из команд с небольшим владением мячом, поскольку у них было больше времени для выполнения своих защитных действий Корректировка не относится к качественным значениям. Процент успешных дриблингов, пасов и т.д. не корректируется. Корректировка значений может вывести на свет неприметных игроков или команды и заставить их по-настоящему сиять НИЖЕ ПРИВЕДЕНЫ ДВЕ ДИАГРАММЫ ШВЕЙЦАРСКОЙ СУПЕРЛИГИ СЕЗОНА 21/22 Стандартная диаграмма со значениями p90 и диаграмма, дополненная значениями с поправкой на владение (PAdj). Для сравнения можно использовать игроков W. Burger, C. Zesiger и L. Zuffi.
W. Burger и C. Zesiger играют за «Базель» и «Янг Бойз». Команды, которые много владеют мячом. Их оборонительные характеристики выиграли от корректировки Adj. Для L. Zuffi все наоборот. Он опустился ниже медианы после корректировки из-за низкого владения мячом со стороны «Сьона». Статистическая корректировка – это повсеместная практика во всех областях количественной оценки, используемая для исправления несоответствий или ограничений в наблюдаемых данных, устранения влияния смешивающих переменных или преобразования наблюдаемых корреляций в причинно-следственные выводы. ПОВЫШЕНИЕ ЗНАЧИМОСТИ АТАКУЮЩИХ ПОКАЗАТЕЛЕЙ
Когда дело доходит до показателей атаки, или, точнее, действий с мячом, игроки команд, которые много владеют мячом, имеют больше игрового времени для выполнения своих действий. Нескорректированные показатели количественных действий с мячом (p90) благоприятствуют игрокам команд, которые много владеют мячом, поскольку у них больше времени для выполнения своих действий с мячом. Давайте посмотрим на ключевые пасы и ожидаемые результативные передачи.
Оба показателя имеют одну общую черту. Они могут возникнуть только в результате передачи. Ранее мы скорректировали показатели защиты с учетом владения мячом командой. Хотя это наилучший из возможных вариантов, он не идеален. Потому что корректировка на уровне игрока с учетом значения уровня команды не идеальна. Но лучше, чем p90, вообще без количественной корректировки. Теперь, когда у нас есть цифры, мы можем использовать количество пасов на игрока для корректировки. В оценке игрока действительно имеет значение, сможет ли он добиться своего «ожидаемого значения результативных передач» с 50 или с 30 пасами за игру
НИЖЕ ПРИВЕДЕНЫ ДВЕ ДИАГРАММЫ СУПЕРЛИГИ СЕЗОНА 21/22 Стандартная диаграмма со значениями p90 и диаграмма, скорректированная с учетом значений, скорректированных по передачам. Для этой цели мы использовали единицу измерения «за 40 передач». Используемое значение должно быть как можно ближе к среднему значению. Проследите как меняется положение игроков M. Stevanović, J. von Moor и T. Aiyegun на графиках в зависимости от корректировки.
Игра M. Stevanović по-прежнему хороша, но переоценивается, так как у него было 35,8 пасов за игру. В то время как выступления J. von Moor (19,5 передачи за игру) и T. Aiyegun (17,1 передачи за игру) предстают в новом свете. Они способны выдавать схожую результативность примерно с половиной передач M. Stevanović. «Использовать количество касаний для корректировки опасно», - слышал я несколько раз. Это не учитывает насколько хорошо игрок предлагает себя или освобождается. Это абсолютно верно, но когда речь идет об атакующем вкладе, мы также хотим оценивать только атакующий вклад, измеряемый по отношению к входным данным. Факт: игрок генерирует большую отдачу при меньшем количестве попыток. Если вы хотите оценить вовлечение в игру, а также предложение и открывания, то вы можете сравнить количество передач с другими игроками на той же позиции. Всегда важно полностью сосредоточиться на вопросе, на который вы хотите ответить. Показатели передач, становятся более справедливыми и значимыми с их корректировкой. ПЕРСОНАЛЬНЫЙ КОУЧИНГ НА ОСНОВЕ ДАННЫХ Игрок может получить интеллектуальный взгляд на данные о своей производительности и на индивидуальных тактических коуч-сессиях разработать план, как он может улучшить свою результативность.
Игрок в значительной степени сам отвечает за свое развитие. Он стал своего рода самостоятельным предпринимателем. Внешний коучинг для игроков и тренеров специалистами становится все более важным для достижения совершенства. Будь то психолог, тренер по физподготовке, тренер по тактике или тренер-аналитик. В конце концов, не талант, а развитие приносит прибыль. ПРОДВИЖЕНИЕ МЯЧА (ПРОДВИЖЕНИЕ МЯЧА С ПОМОЩЬЮ ПЕРЕДАЧ И ПРОДВИЖЕНИЕ МЯЧА С ПОМОЩЬЮ ВЕДЕНИЯ)
Продвижение мяча с помощью передач – вызвано передачами, поэтому мы снова корректируем «на 40 передач». В то время как «продвижение мяча с помощью ведения» вызвано не передачами, а касаниями или полученными пасами.
Таким образом, для корректировки этой метрики мы используем показатель «на 30 полученных передач». На следующих двух графиках проследите изменения для H. Mahou, T. Coyle, L. Millar и G. Clichy.
Снова значительные изменения в скорректированных значениях. H. Mahou и T. Coyle показали свою игру с меньшим количеством пасов и получаемых передач за игру, и их игра получила более высокую оценку.
В то время как, с другой стороны, выступление L.Millar и G.Clichy было несколько переоценено из-за большего количества полученных пасов. РАСШИРЕННЫЕ КОРРЕКТИРОВКИ КОЛИЧЕСТВЕННЫЗ ЗНАЧЕНИЙ Примеры, использованные в этом статье, касаются базовых корректировок количественных значений, которые обеспечивают более реалистичный и справедливый взгляд на данные.
Расширенные корректировки возможны при использовании значений Защиты вместо владения соперника, а также при использовании количества касаний соперника. Если у вас есть данные, вы даже можете использовать только количество касаний мяча в атакующей трети или количество передач в финальную треть.
Для действий с мячом вместо количества передач или пасов можно также выборочно использовать только передачи в определенной зоне поля. Там царит напряженность, которая способствует захватывающим беседам, и многие идеи ждут наших открытий. Авторы статьи привыкли всегда анализировать оба вида показателей (p90 и скорректированный) при скаутинге. В любом случае нескорректированные количественные значения могут привести к неверным предположениям, искажениям и, в конечном счете, неверным решениям. Чем сильнее корреляция между количественным показателем и скорректированной единицей измерения, тем более надежным и содержательным будет анализ данных.
Подписывайтесь на социальные сети «Футбологики»: Телеграм ВКонтакте