5 заблуждений, которые вызывают недоверие к xG
Яростная критика продвинутой статистики – такая же часть жизни, как раздражение Александра Мостового из-за иностранных тренеров. Самая обсуждаемая метрика – xG. В ней сомневаются футболисты, тренеры и иногда медиа.
Вы точно слышал этот скепсис, но вот несколько примеров.
Аарон Рэмсдейл: «Я не понимаю этой болтовни об ожидаемых голах, потому что кто-то оценивает, насколько трудно или легко сделать сэйв, когда все это полный бред. Каждый мяч совершенно разный. Это выглядит так, будто если удар наносится с позиции под углом, сложность удара снижается. Это полный бред».
Валерий Карпин: «Что дают эти цифры? Я вообще не понимаю. Я попытался [разобраться]. «По созданным моментам, которые якобы что-то там должны завершиться», какие-то там «несозданные»… Для меня созданный момент может быть абсолютно другим, не тем, который считают аналитики. Мы вышли из обороны, от ворот шли и дошли — для них это не момент, для меня — момент предголевой».
Конечно, Роман Нагучев: «Самый яркий пример, что это очень странная статистика: Силас из «Штутгарта» стоял перед пустыми воротами «Вердера», покатил туда мяч, и появился титр – 60% вероятности гола. Куда девались 40%?»
Сотни объяснений xG (как минимум на Sports.ru раз, два и три) дают хорошее погружение, но только тем, у кого есть желание разобраться. У других остается раздражение, одна из главных причин которого – часто неверное использование этой метрики в медиа. Раздраженным тренерам тычут в нос ожидаемыми голами, вызывая еще большее раздражение.
– Соперник проиграл, но у него лучше xG. Победителю повезло.
– Форвард забил 20, но по xG всего лишь 10. Он переоценен.
– По ожидаемым очкам команда Х вне топ-10, хотя по реальным в топ-5. Им сильно везет.
Читая такое, многие тренеры возненавидят ожидаемые голы, а тем более – ожидаемые очки.
Иногда это работает и в обратную сторону. Тренеры приводят xG как оправдание провала. Ярчайший пример – Грэм Поттер, который перед увольнением из «Челси» намекал на несправедливость поражения от «Астон Виллы» (0:2).
«Если вы посмотрите на xG, то поймете, что момент Макгина (забил второй гол лондонцам) не назовешь явным».
В пик ужасного сезона болельщики «Челси» вряд ли что-либо хотели слышать про ожидаемые голы – тем более в таком контексте. И такие комментарии от тренера, который использует xG как таблетку от увольнения, обесценивают продвинутые метрики в глазах большинства и вызывают насмешки. Но ведь проблема тут не в ожидаемых голах, а в их интерпретации, и об этом хочется поговорить перед стартом евросезона.
Для начала давайте освежим в памяти, что такое xG: это вероятность гола при ударе (оценивается по шкале от 0 до 1). Показатель вычисляется на основе исторических данных. Грубо говоря, мы оцениваем, как часто забивали голы при определенном типе удара. Вот детали, как считаются xG на Sports.ru.
Методику понимают более-менее все, но вопросы остаются. Давайте через несколько быстрых фактов поймем, какие выводы можно делать на основе xG, когда показатель полезен, а когда вреден. Для этого рассмотрим заблуждения в интерпретации xG, которые сформулировал Джонни Уайтмур из Opta и кое-что к ним добавим.
Заблуждение #1: у кого больше xG, тот и должен победить. Если нет, значит результат несправедлив
Кратко: xG без контекста по итогам матча может обмануть. Нужно смотреть, из каких моментов сложился итог, на какой стадии матча. Может быть, лучшая по xG команда собрала моменты, когда результат уже был предопределен.
Ниже статистика, которая, возможно, вас удивит.
• В 37-м туре АПЛ только в 3 матчах из 10 исход по голам совпал с исходом по xG (версия Opta). Речь не о точных совпадениях в счете, а именно в исходе: победа по xG = победа по голам.
• На дистанции сезона АПЛ исход по голам и xG совпал в 60% матчей – 228 из 380.
• На пятилетней дистанции показатель такой же – 60%. 1141 матч из 1900.
Напрашивается восклицание (разумеется, ошибочное): точность монетки всего на 10% ниже, чем ожидаемых голов!
Или другое (тоже ошибочное): турнирные таблицы топ-5 лиг справедливы на 60%!
Гораздо более разумный вывод: команда, которая выше по xG, необязательно должна победить. Иными словами, ожидаемые голы не метрика общего превосходства, а метрика суммарного качества ударов. Простой пример: быстрый гол может так изменить матч, что более сильная команда уйдет в оборону с первых минут, а соперник настреляет один ожидаемый гол дальними ударами. В этом случае график xG отразит лишь ход матча. У первой команды был шанс (предположим, 0.4xG), она им воспользовалась, дальше вторая бросилась отыгрываться, налетела на стену в обороне и 20 раз пробила издали (по 0,05xG), настреляв на один ожидаемый гол. Первой повезло, а второй – нет? Обсуждаемо, но точно не очевидно. Да, расхождение по ожидаемым голам – повод задуматься и не переоценивать чью-то победу, но нужно обязательно рассмотреть, как именно сложился xG и на каком отрезке матча.
Именно поэтому к показателю xPts (ожидаемые очки), который пересчитывает ожидаемые голы в очки, нужно относиться ооочень осторожно. Оценивая их суммарно, уже невозможно учесть контекст матчей (как именно команды набрали xG) и очень просто сделать неправильные выводы. Как аттракцион – отлично, но как инструмент для аналитики – не всегда точно.
Пока мы оценили только совпадения в исходах матчей, но для полноты картины нужно сравнивать xG и голы количественно – числа с числами.
Заблуждение #2: xG не имеет никакого отношения к реальным голам
Кратко: на дистанции в неделю у xG большие расхождения с реальными голами, но на дистанции 5 лет показатели почти сходятся в одну точку. Поэтому ожидаемые голы полезны как ориентир. Раньше у нас была просто статистика ударов по воротам, а сейчас она поумнела – учитывает и качество момента, который привел к удару (это и есть xG).
Для начала возьмем рандомный тур АПЛ – например, 1-й в сезоне-2022/23. И посмотрим на зависимость голов от xG. Точки на графике – команды. На горизонтальной оси – их ожидаемые голы. На вертикальной – реальные.
Линия – сглаженная кривая, а серая зона – доверительный интервал (не будем углубляться в нюансы его расчета, лишь уточним: предполагается, что в него попадает большинство точек на определенном отрезке). Узкий доверительный интервал = маленькая разбежка результатов в выборке, широкий – большая.
Итак, в нашей выборке 20 команд (10 матчей тура).
Точки будто рандомно рассеяны по графику. У 50% команд два гола за тур, но показатель xG у них скачет от 0.6 до 2.4. Какую-то зависимость выявить сложно. И если смотреть на это, то вопросы Валерия Карпина можно понять. Что это? Зачем это?
Дальше строим точно такой же график, но уже не за тур, а за сезон АПЛ. На осях среднее количество xG и голов за 38 матчей.
Да, отклонения все еще есть, но их меньше, а разбежка в результатах – уже. Зависимость между реальными голами и ожидаемыми прослеживается четче, чем на предыдущем графике.
Теперь давайте выйдем за пределы АПЛ и нанесем на график все команды топ-5 за прошлый сезон.
Точки выстроились еще ровнее. Доверительный интервал в выборке сузился, скользящее среднее значение очень близко к результату большинства (не у всех конечно – аномалии никто не отменял).
Но идем еще дальше! И берем все топ-5 лиги за 5 сезонов!
И здесь прямая зависимость между голами и xG на дистанции еще четче.
Вывод: чем шире выборка, тем больше концентрация точек вокруг синей линии. А это значит, что показатели ожидаемых голов стремятся к реальным.
Хммм, зачем тогда вообще нужны ожидаемые голы, если на дистанции они приближаются к реальным?
Ответ простой: так как футбол малорезультативная игра, ожидаемые голы – инструмент для восприятия результатов. В XX веке для более глубокого понимания игры просто считали количество ударов, сейчас этот показатель просто усовершенствовался. Теперь мы считаем не только количество, но и качество, что помогает нам раньше и четче фиксировать тренды.
Например, в 90-е мы бы насторожились, если бы какая-нибудь сборная вышла из группы на ЧМ, нанеся за три матча пять ударов. Эта статистика выполнила бы две функции (их сформулировал Тен Кнудсен из Statsbomb).
1. Описательную. Кажется, сборная не очень любит массированно атаковать, ее реализация аномальна.
2. Прогностическую. Скорее всего, на дистанции продолжить такой тренд трудно, она вряд ли пройдет слишком далеко.
То есть количество ударов позволило бы более трезво посмотреть на результат. xG делает то же самое, но точнее. И здесь важно понимать: xG не объясняет причину результата, а просто лучше всего из существующих метрик описывает матч. И дает основания дать осторожный прогноз. Например, команда трижды подряд победила, но во всех матчах значительно уступила по xG, а это значит, что серия не так крепка, как кажется.
Но это понимание может привести к еще одному заблуждению…
Заблуждение #3: если форвард/клуб забил больше ожидаемого, то в следующем забьет меньше ожидаемого
Кратко: если футболист забил за сезон 15 голов при xG 10, то в следующем сезоне ошибочно ждать, что он зеркально просядет в реализации и забьет 5 при том же показателе xG (10).
Здесь мы попадаем в ловушку, которая называется Ошибка игрока. Интуитивно мы не всегда осознаем, что вероятность каждого следующего события не зависит от исхода предыдущих.
Простейший пример: мы играем в монетку. Так совпало, что аж пять раз выпал орел. Делая шестой бросок, мы уверены: сейчас точно будет решка. Но математически ничего не изменилось: монетка не потеряла форму, а значит – вероятность выпадения решки в шестом броске будет той же, что и в предыдущих пяти. Да, вероятность шести орлов подряд ниже, чем пяти орлов подряд – если оценивать ее ДО начала игры. Но к шестому броску это не имеет никакого отношения, там вероятность орла все еще 0,5.
Важное уточнение: если орел в монетке – случайное событие, то футбол гораздо сложнее. Если кому-то удавалось взламывать даже рулетку (в лондонском «Рице» в 2004-м компания балканцев заработала миллионы, воспользовавшись неровностью колеса), то что говорить об ударах по мячу. Нужно признать, что в футболе прошлые результаты в некоторой степени влияют на психологию и уверенность игрока – чем чаще забиваешь, тем раскованнее себя чувствуешь.
Но от среднестатистического футболиста мы все еще ждем реализации 1 гол = 1 xG. Пример из вакуума: игрок Х провел дебютный сезон в топ-лиге и забил 22 гола при xG 15.
❌Неверно: в следующем сезоне ждем от него 8 голов при xG 15.
❌Неверно: в следующем сезоне ждем от него 22 гола при xG 15.
✅Верно: в следующем сезоне ждем от него 15 голов при xG 15.
Уточнение про вакуум и среднестатистического игрока – ключевое. И здесь мы переходим к следующему заблуждению.
Заблуждение #4: метрика универсальна для каждого футболиста
Кратко: в основе xG – среднестатистическая ценность удара среднестатистического футболиста. Но каждый реализовывает моменты по-разному, это нужно учитывать.
Модель xG от Opta построена на базе 2,5 млн ударов футболистов разного уровня. Это значит, что она отражает среднестатистическую ценность удара среднестатистического футболиста.
Проблема в том, что не каждый удар среднестатистический и не каждый футболист среднестатистический.
Например, вот график Эрлинга Холанда за карьеру в топ-5 лигах. Красная кривая – голы, синяя – xG. Если красная выше, значит Холанд забивал больше ожидаемого.
Вывод: четыре сезона Холанд на дистанции забивал ощутимо больше ожидаемого, реализация упала только прошлой весной. Космический уровень, вряд ли достижимый для кого-то из других современных форвардов. Возможно, доля везения есть, но она точно не определяющая. Способности Холанда явно выше среднестатистических.
А теперь статистика Кая Хавертца в «Челси».
Почти всю лондонскую карьеру немец забивал меньше ожидаемого, лишь ненадолго выходя в плюс.
Причин разницы в реализации может быть множество, она может меняться от сезона к сезону, от позиции к позиции, от команды к команде (например, в «Байере» показатели Хавертца были лучше). Возможно, топ-клуб создает условия для реализации, пока не уловимые продвинутыми метриками (пространство, темп или что-то еще).
Вывод: xG – среднестатистическая отсечка, которой мы определяем уровень реализации. Регрессия к среднему определенно есть на дистанции, но это не значит, что не может быть исключений. При этом нужно с опаской относиться к аномальным отклонениям как в плюс, так и в минус – особенно на короткой и средней дистанции (месяц, сезон). Очень вероятно, что это временное явление.
Каждый случай нужно оценивать с контекстом.
Заблуждение #5: или безоговорочно доверяем xG, или безостановочно критикуем
Кратко: xG – это не универсальный показатель, как количество угловых, аутов или ударов. Каждый провайдер считает ожидаемые голы по-своему. А еще метрика с каждым годом все точнее – учитывает больше и больше факторов.
Во-первых, методика подсчета у разных провайдеров и статистических сайтов может меняться. Ценность удара из пределов вратарской и других зон они могут оценивать по-разному. Все зависит от используемых параметров.
xG – не стандартизированная метрика, разбежка в показателях одного и того же удара может быть огромной. Поэтому если критиковать, то конкретную методику, а не принцип в целом.
Во-вторых, xG умнеет. Нынешняя версия несравнимо точнее, чем та, что была в 2012-м.
Ниже – простой пример от Opta.
Прежняя версия оценивала этот удар форварда «Ливерпуля» Жоты в 0.68 xG – ниже, чем пенальти. Новая выдает более реалистичный показатель – 0.9.
За счет чего? Учитывается положение тела игрока относительно ворот (боком, спиной или лицом), уровень давления от защитников, позиция вратаря, какой частью тела бьет игрок, отскок ли это или первое касание после паса и еще множество факторов.
Поэтому вполне возможно, что удар Силаса из «Штутгарта», о котором говорит Нагучев, улучшенными моделями оценивается по-другому.
Вероятно, что xG и в будущем ждут изменения – возможно, когда-нибудь она будет учитывать и реализацию конкретного футболиста, уровень его формы, давление трибун в большом матче, а также состояние мяча (влажный или сухой).
Но критика все равно останется, и это отлично – значит, прогресс продвинутых данных продолжится, избавляя их от старых недостатков и удовлетворяя новые запросы.
Но еще важно, чтобы вместе с продвинутой статистикой развивалась и качество ее интерпретации. Заблуждаться из-за недостатка информации – нормально. Главное видеть ошибки и двигаться дальше.
Фото: Michael Baucher, Simon Traylen/Global Look Press
нет, если игрок настрелял больше чем дает ему xG - это скорее всего классный игрок, который успешно забивает из трудных позиций, если Рамсу будем бить по очереди с линии штрафной я и Эдегор с одной и той же точки - результат будет очень сильно отличаться, хотя xG наших ударов будет одинаков
а вот классический глюк с суммированием веса ударов не описан
смотрите, существует вероятность того что в одной атаке (ну, все же видели такое в хайлайтах) вратарь возьмет три подряд тяжелейших удара по 0.67 xG и суммарный их вес составит 2 xG - можно подумать, что он в одной атаке спас команду от двух голов или что команда-соперник должна была забить в одной атаке два гола, но ведь это невозможно, как тут считать - зависит от модели коих очень много
Заблуждение: xG - метрика, которая дает весьма условное представление о том, что происходит на футбольном поле
Опровержение: xG - метрика, которая дает весьма условное представление о том, что происходит на футбольном поле
Кажется, главное ограничение этого класса моделей определяется их исходным принципом -- учитывать только удары. Ситуаций, когда удар мог быть нанесён, но не был нанесён, потому что футболист выбрал другое продолжение, модели xG не видят. А зритель видит. И может получиться матч с кучей очевидной остроты у ворот чужой команды -- но с малым xG. Недооценены оказываются игроки и команды, тяготеющие к пасу, к розыгрышу "до верного".
Сначала от себя - проблемы xG в том, что это собирательное название нескольких методик, которые пытаются как-то описать качество ударов и моментов.
И это неплохая идея. Мы понимаем, что действительно бывают очень качественные моменты, вроде удара по пустым с метра, а бывают менее очевидные и ожидаемые голы.
Однако у всех этих систем есть огромная проблема - они сами ничерта не учитывают, кроме каких-то очень общих вещей. ОНи оценивают сферического игрока в вакууме с сферической позиции в вакууме. Более они не учитывают ничего.
Модели искренне считают, что удар с 5 метров это очень опасно, не учитывая толком ни позиции игроков, ни обстановку для удара, притом удар с линии штрафной будет по умолчанию менее опасен, по этой модели. Это полный абсурд.
Теперь критика тезисов статьи:
1. "xG без контекста по итогам матча может обмануть. Нужно смотреть, из каких моментов сложился итог, на какой стадии матча. Может быть, лучшая по xG команда собрала моменты, когда результат уже был предопределен."
Да, но вы же сами пихаете свой xG везде, как какой-то невероятный показатель и опираетесь на него, как на нечто надёжное, а не в каком-то контексте.
2. "на дистанции в неделю у xG большие расхождения с реальными голами, но на дистанции 5 лет показатели почти сходятся в одну точку. Поэтому ожидаемые голы полезны как ориентир. Раньше у нас была просто статистика ударов по воротам, а сейчас она поумнела – учитывает и качество момента, который привел к удару (это и есть xG). "
Во-первых нет, не сходится оно ни в какую одну точку. Статистически разброс огромный и точность очень низкая.
Во-вторых, статистика удара по воротам и статистика xG это две принципиально разные метрики. Ещё раз - принципиально разные. Статистике ударов по воротам вообще плевать на качество моментов. Она хороша для оценки того, насколько команда А позволила сделать что-то команде Б, а так же некоторые стилистические особенности. Например одна команда предпочитает дальние удары или больше риска. Если команда не нанесла ни одного удара, это не плохо само по себе, это может говорить о том, что чисто стилистически команда склонна к более надёжным моментам, но не смогла довести ни одного момента до удара.
xG же плевать на стиль, оно пытается описать "а сколько могло бы быть голов при ударах с определённой вероятностью, если бы всё пошло хорошо". Но тут смотри предисловие, удар из-за штрафной по пустым от игрока, который пасует на 60 метром точно в ногу с закрытыми глазами будет не более опасным, чем попытка удара защитником из штрафной нерабочей ногой, с вратарём на воротах и прессингом.
3. "если футболист забил за сезон 15 голов при xG 10, то в следующем сезоне ошибочно ждать, что он зеркально просядет в реализации и забьет 5 при том же показателе xG (10)."
Какой-то нелепый тезис. Он не учитывает вообще ничего. Если он настрелял столько, то это говорит только о том, что он настрелял столько и никак не влияет на прогноз. Кто этот игрок? Это юниор? Или это чел с 10 сезонами по 15+ голов? Он менял команду или нет? Команда меняла тренера или состав? Команда будет играть примерно в том же темпе или она, допустим, попала в ЕК? Он исполняет штрафные и пенальти или нет? А какой у него коэфициент забитых к созданным?
Вот без этого всего вообще нет смысла о чём-то говорить
4. "в основе xG – среднестатистическая ценность удара среднестатистического футболиста. Но каждый реализовывает моменты по-разному, это нужно учитывать. "
Собственно то, о чём я написал выше. Вы сами пихаете xG везде, без контекта, а контекста толком и нет, потому как xG как модель не считает никаких особенностей.
Кстати, вы сами показывает график Холлана. И где там схождение в одну точку, если там за дофига лет абсолютно полный разброс.
5. "xG – это не универсальный показатель, как количество угловых, аутов или ударов. Каждый провайдер считает ожидаемые голы по-своему. А еще метрика с каждым годом все точнее – учитывает больше и больше факторов."
Опять же, то, что я описал выше - xG это какой-то не очень понятный разброс, который считают все, как могут. И не понимаю, в каком месте оно точнее и умнее. Нет оснований для этого.
И да, лично я, как аналитик, люблю разные стат показатели. Не смотря на то, что xG слабый, я считаю, что он имеет право на жизнь и развиваться. У Итальянцев и не такая статистика была и это гуд для лучшего понимания происходящего на поле.
Просто,, в очередной раз скажу, хватит свой xG пихать всюду, как нечто важное. Ваши же бестолковые аналитики на этом же сайте задалбывают всех постоянно и поголовно xG, как нечто значимое и весомое.
Нет. Только если оценивать всю карьеру, а не узкий период времени, например, один сезон. Для адекватной оценки класса игрока необходимо изучать динамику, просто точка на графике скорее всего обманет.
В эту ловушку попадают даже профессиональные футбольные функционеры, когда переплачивают за напа с одним сильным сезоном в активе
с xG вообще не так. на уровне сезона посмотреть -
Краснодар у understat в 2022/23 44 создали, 39 допустили. нормальный результат, больше создали чем допустили
Краснодар у rustat в 2022/23 50 создали, 53 допустили. Представляете разницу? 39 допущенных xG или 53? 14 допущенных голов на расстоянии в 30 матчей.
При этом в реальности Краснодар забил 62, а пропустил 46. Одна модель считает что Краснодар пропустил больше чем должен был, другая что меньше чем должен был. Круто, анализируем!