Что на самом деле значат оценки WhoScored

В последнее время стал все чаще и чаще натыкаться на оценки WhoScored как на почти что универсальный аргумент в спорах, авторитетный источник оценки уровня игроков, инструмент для троллинга и т.д. Если для последнего все средства хороши, то для первых двух целей оценки WhoScored совсем непригодны.
В тексте попытаюсь с примерами из лиги, за которой слежу (АПЛ), растолковать на самом деле очевидные вещи, которые многие упускают – наверняка из-за неохоты вникать в детали и понимать методику этих оценок. По сути, все сказанное также применимо и к рейтингам игроков от Squawka.
Что такое оценка WhoScored? Согласно официальному определению, это «уникальный всеобъемлющий статистический алгоритм, который базируется на более чем 200 статистических показателях, каждый из которых учитывается с различной степенью важности». Точная формула подсчета для игроков каждой из позиций, разумеется, не раскрывается, но ключевые показатели известны. Это те показатели, которые находятся в открытом доступе в отчетах WhoScored к матчам – отборы, перехваты, выносы, обводки, ключевые передачи, удары по воротам, точные навесы плюс результативные действия.
В этом и заключается главная проблема оценки полевых игроков на основе лишь статистических показателей. Все эти показатели засчитываются в оценку как положительные действия, хотя на деле все труднее.
Например, у того, что защитник совершил за матч 5 отборов (при прочих равных отличный показатель) могут быть очень разные причины: 1) он провел неплохой матч, но показатель завышен из-за того, что команда слишком много играла без мяча, была вынуждена чаще его отбирать; 2) он провел не очень хорошую игру, слишком часто пускался в рискованные попытки отобрать мяч, но 5 раз не был за это наказан; 3) он действительно блистательно отыграл в разрушении.
Количество выносов и вовсе напрямую зависит от стиля команды и стиля соперника. У команд, которые больше и глубже обороняются при прочих равных всегда будет больше выносов. Добавим к этому полное игнорирование системой позиционных ошибок – и получим оценку полную изъянов.
Хороший пример проигрыша системы реальности – защитник «Халла» Кертис Дэвис. В январе этого года он потерял место в составе клуба и публично признал правоту этого решения Стива Брюса, хотя был в числе лучших защитников АПЛ по версии WhoScored. Нетрудно догадаться, что стиль «Халла» позволял ему набирать солидное количество выносов, при этом далеко не все его ошибки отмечались системой как результативные, что вело к высокому баллу.
Точно также можно разобрать любой ключевой компонент формулы WhoScored. Могут ли 10 дальних ударов, ни один из которых не завершился голом, считаться положительным показателем? Согласно оценке, могут. Если же учесть контекст, они окажутся ближе к необоснованным потерям мяча, чем к реальной угрозе.
Это на своем опыте осенью сезона 2013/14 познали Эндрос Таунсенд и Натан Редмонд. Благодаря фирменному приему (смещение с фланга-дальний удар) оба лидировали в рейтинге WhoScored в своих командах. Но вскоре Таунсенд потерял место в основе, а Редмонд был переведен на другой фланг, дабы отучить его атаковать так однотипно.
Не хочу перегружать вас однородной информацией, поэтому, если кому-то интересны изъяны остальных стат параметров, можем обсудить в комментариях.
Отдельного разговора заслуживает оценка вратарей.Оценивать их с существующими ныне статистическими показателями труднее, чем игроков любой другой позиции. Самые распространенные из них и играющие важную роль у WhoScored – количество сейвов и процент отраженных ударов – не пригодны для анализа, если мы допускаем, что в мире есть топ-вратари, который стабильно сильнее остальных.
Это неудивительно, так как все удары разные по трудности для вратаря. Сравнение же вратарей по проценту отраженных ударов опирается на предположение, что на дистанции сезона количество трудных и не очень трудных ударов для каждого вратаря более-менее уравновешивается. Но, разумеетсяются, это не так. Процент отраженных ударов слишком сильно колеблется у одних и тех же вратарей от сезона к сезону.
Итого: оценки WhoScored и им подобные – отличный показатель активности и могут быть предельно полезны. Активность нередко равна/близка «лучшести», но это никак не аксиома, следовательно, в корне неправильно упускать контекст и переоценивать важность этой оценки.










Как в бородатом анекдоте: Средняя зарплата в России — это когда 1 человек получает 2 миллиона, а 100 других по 8000р. Тогда в среднем они все получают по 27000р. А теперь простым языком: — У Пети 10 яблок, а у Васи 0. В среднем у обоих по 5 яблок. — Чиновники едят мясо, я — капусту. В среднем мы едим голубцы. — Жена директора колхоза Глаша еб*тся со всеми, а доярка Маша не дает никому, но в среднем они обе бл*ди
Кстати, на Whoscored есть довольно любопытная характеристика сильных и слабых сторон футболиста/команды и их стиля игры. Она учитывает все статистические показатели и делает на их основе вывод. И зачастую он совпадает с тем, что ты видишь на поле.
1. судя по вот этому:
Это неудивительно, так как все удары разные по трудности для вратаря. Сравнение же вратарей по проценту отраженных ударов опирается на предположение, что на дистанции сезона количество трудных и не очень трудных ударов для каждого вратаря более-менее уравновешивается. Но, разумеетсяются, это не так. Процент отраженных ударов слишком сильно колеблется у одних и тех же вратарей от сезона к сезону.
можно сделать очевидный вывод, мол "зачем тогда вообще пытаться анализировать с футбол с помощью цифр, ведь по сути даже в этом примере абсолютно одинаковый по силе и точности удар будет по-разному сложен для двух разных вратарей банально за счет антропометрических данных". но разве статистику и не придумали, чтобы все это хоть как-то стандартизировать?
2. что со статистическими параметрами opta? они претендуют на объективность или нет? я честно говоря ни разу в глаза не видел платного аккаунта этого ресурса и для меня это видится неким сакральным знанием, о котором было бы любопытно узнать подробнее.
2. Opta – поставщик статистик. WhoScored пользуется именно их данными.
по поводу использования таких стат данных в тренерстве: как думаешь, на сколько правдиво был описан данный подход в вильме moneyball? (если смотрел) или применять стату в бейсболе и в футболе - две разные вещи?
Посмотрев на оценки игроков Челси, когда Иванович за сезон поставлен выше Терри, а Реми ниже Филипе Луиса - о чем тут спорить?
Опта небезусловный источник даже если нужно посмотреть отдельный показатель для конкретной цели, например точность паса: у защитников это часто большая доля пасов назад вратарю, которая совсем не характеризует его почтиХави.
Статистика по карточкам тоже условна: это не то сколько нарушают а то что свистят, по логике вор не тот кто ворует а тот кто попадается. Показателен матч Челси с Бернли когда Барнс всех оттоптал, а карточки получили Матич и Иванович.
тут просто всю стату автоматом собирают. Ибо матчей очень много.
1) по правильности выбора позиции в момент подачи/удара(см.ниже насчет линии центра ворот и удара),
2) Правильности принятия решения, выходить/не выходить из ворот(но для этого нужно принять некую модельную скорость/ускорение для вратаря, чтобы знать на какие мячи он обязан выходить, а на какие нет - но опять же субъективно, потому как кто-то силен на линии, а кто-то на выходе, чтож им теперь не использовать свои козыри?
3) Проценты отбитых ударов можно раскидать по скорости мяча и удаленности от линии соединяющей начальную точку удара и центр ворот, таким образом мы получим деление ударов на простые, средние и сложные. (но опять плюс или минус вратарю если он отбил мяч летящий в штангу или чуть мимо ворот? технически плюс - логически, мяч мог скакнуть на кочке и залететь в ворота, так что минус)
Уровень грамотного подсказа защитникам вообще никак не оценить, а ведь это тоже важнейшая часть работы вратаря.
2) не статистика
3) пока недоступная статистика. Еще, как минимум, можно учитывать скорость атаки, часть тела, которой наносился удар.
Разумеется, субъективным глазом можно неплохо оценить вратарей, но перевести в статы пока невозможно.
1) например за уход с верной позиции на метр лишать трех очков, на пол метра - 2, меньше 40см 1 очко,(тут только неясно как действовать с необоснованными выходами с ворот, а-ля Куртуа в этом сезоне)
2) та же статистика, только вкупе с процентном отраженных ударов будет статистика отраженных простых, средних и сложных ударов. Например удар со скоростью выше 80 км/час и удаленностью от центр ворот на 2,5 и более метров будет считаться сложным. Хотя если учитывать дистанцию до ворот, то тогда надо переводить скорость удара во время которое он летит до ворот, т.е. например удар при котором мяч летит до ворот менее 2 секунд и удален от центра на 2,5 метров считается сложным, ну это например
3) Я и говорю, что нужна модельная характеристика игры вратаря на выходе, ее получить несложно и от нее уже плясать.
И я считаю что вратари должны оцениваться от противного, изначально у вратаря ноль балов, за каждую ошибку начисляются очки, и какие-то границы установить оценочные. (но тут не ясно что делать с вратарями, которые просто простояли весь матч без дела...)
Чисто зрительно можно пропустить кто куда пас отдал, кто сделал перехват, кто отбор и так далее.
По примеру с защитниками - тоже вырвано из контекста. Если защитник из слабой команды (см. выше про Дэвиса) получил высокую оценку за один матч (и неважно по какой причине) - это еще не говорит о слабости статистики. Если он продолжит бросаться в глупые перехваты - средняя оценка все расставит по своим местам.
Для оценки качества игры важна именно средняя оценка. В ней будет 20% игр против нападающих из топ-4 (Коста, Агуэро, Жиру, Руни) - в таких играх условный Кертис Дэвис получит меньше семи баллов даже если не будет уж очень сильно ошибаться. А если будет - то вообще труба: вес ошибки (со знаком минус) в несколько раз больше веса полезного действия (со знаком плюс).
10 дальних ударов - тоже хороший пример. Среднее количество касаний мяча в подходящей для удара ситуации - как раз около 10 за матч. На оценку эти удары конечно повлияют - но не так как пара удачных ободок, ключевых передач и других, более полезных для команды действий при этих касаниях мяча. А дальше все тот же вопрос - если это один матч так сложился, то на среднюю оценку он сильно не повлияет. Если же это игрок из разряда "получил мяч - х..чь", то один-два залетевших мяча среднюю оценку не вытянут.
Оценка за матч отражает полезность игрока в одном отдельно взятом матче по объективно измеримым показателям, не более того. Средняя оценка - чуть более надежный инструмент сравнения. Но как и любой инструмент ее нужно правильно применять - не надо ждать от нее чудес. Если сейчас Ман Ютд на основании статистики купит Фабиански вместо Де Хеа, то они совершат ошибку не потому что поляк - плохой вратарь, а потому что он не умеет справляться с давлением в топ-клубах. Если Кертис Дэвис играя в Халле станет лучшим защитником Европы по рейтингу - абсолютно не факт, что он заиграет в Барселоне, потому что там от защитника требуются иные качества.
Я уверен, что скауты клубов используют статистику как дополнительный параметр для оценки. Но почти наверняка они строят на основе данных Opta собственные рейтинги, которые учитывают требования тренера к игроку - например, исключая влияние дальних ударов для игрока, от которого требуется играть в пас или даже вводя отрицательный коэффициент за такие удары. А рейтинги Whoscored - это в общем-то массовый продукт, для болельщиков и таких вот диванных экспертов, как мы с вами.
-------
золотые слова. в любом случае скауты должны использовать статистику, только скорее всего в сыром виде, без всяких средних за матч. врадли они будут оценивать перспективного футболиста по критериям диванных экспертов, вроде: "божит", "крутой", "нормальный", "так себе" и "днарь". личное восприятие конечно тоже будет решать, но это точно не все.
Каким образом? Движение игрока, позиционные ошибки вообще не учитывают пока статами.
С уточнением про Дэвиса могу согласится. Но это не противоречит выводам. Если игрок с высокой оценкой, даже не попадает в основу скромного клуба, нельзя говорить, что он играет хорошо. Даже в масштабах своей роли.
>>Оценка за матч отражает полезность игрока в одном отдельно взятом матче по объективно измеримым показателям, не более того. Средняя оценка - чуть более надежный инструмент сравнения.
Опять же. Не факт. Если в одном матче оценка была завешена не очень полезными фирменными действиями игрока, почему это не повторится? Примеры Таунсенда и Редмонда показывают, что может повторяться, пока субъективный глаз тренера, не решит это исправить.
Ну и самое главное. Мой главный посыл - статистике важен и нужен контекст. Заметьте, сколько контекста вы уже предоставили и какая у нас получается дискуссия на основе статистики и контекста. В конечном итоге, мы говорим об одном и том же)