13 мин.

5 заблуждений, которые вызывают недоверие к xG

Яростная критика продвинутой статистики – такая же часть жизни, как раздражение Александра Мостового из-за иностранных тренеров. Самая обсуждаемая метрика –  xG. В ней сомневаются футболисты, тренеры и иногда медиа.

Вы точно слышал этот скепсис, но вот несколько примеров. 

Аарон Рэмсдейл: «Я не понимаю этой болтовни об ожидаемых голах, потому что кто-то оценивает, насколько трудно или легко сделать сэйв, когда все это полный бред. Каждый мяч совершенно разный. Это выглядит так, будто если удар наносится с позиции под углом, сложность удара снижается. Это полный бред». 

Валерий Карпин: «Что дают эти цифры? Я вообще не понимаю. Я попытался [разобраться]. «По созданным моментам, которые якобы что-то там должны завершиться», какие-то там «несозданные»…  Для меня созданный момент может быть абсолютно другим, не тем, который считают аналитики. Мы вышли из обороны, от ворот шли и дошли — для них это не момент, для меня — момент предголевой».

Конечно, Роман Нагучев: «Самый яркий пример, что это очень странная статистика: Силас из «Штутгарта» стоял перед пустыми воротами «Вердера», покатил туда мяч, и появился титр – 60% вероятности гола. Куда девались 40%?»

Сотни объяснений xG (как минимум на Sports.ru раз, два и три) дают хорошее погружение, но только тем, у кого есть желание разобраться. У других остается раздражение, одна из главных причин которого – часто неверное использование этой метрики в медиа. Раздраженным тренерам тычут в нос ожидаемыми голами, вызывая еще большее раздражение. 

– Соперник проиграл, но у него лучше xG. Победителю повезло.

– Форвард забил 20, но по xG всего лишь 10. Он переоценен. 

– По ожидаемым очкам команда Х вне топ-10, хотя по реальным в топ-5. Им сильно везет. 

Читая такое, многие тренеры возненавидят ожидаемые голы, а тем более – ожидаемые очки. 

Иногда это работает и в обратную сторону. Тренеры приводят xG как оправдание провала. Ярчайший пример – Грэм Поттер, который перед увольнением из «Челси» намекал на несправедливость поражения от «Астон Виллы» (0:2). 

«Если вы посмотрите на xG, то поймете, что момент Макгина (забил второй гол лондонцам) не назовешь явным». 

В пик ужасного сезона болельщики «Челси» вряд ли что-либо хотели слышать про ожидаемые голы – тем более в таком контексте. И такие комментарии от тренера, который использует xG как таблетку от увольнения, обесценивают продвинутые метрики в глазах большинства и вызывают насмешки. Но ведь проблема тут не в ожидаемых голах, а в их интерпретации, и об этом хочется поговорить перед стартом евросезона. 

Для начала давайте освежим в памяти, что такое xG: это вероятность гола при ударе (оценивается по шкале от 0 до 1). Показатель вычисляется на основе исторических данных. Грубо говоря, мы оцениваем, как часто забивали голы при определенном типе удара. Вот детали, как считаются xG на Sports.ru.

Методику понимают более-менее все, но вопросы остаются. Давайте через несколько быстрых фактов поймем, какие выводы можно делать на основе xG, когда показатель полезен, а когда вреден. Для этого рассмотрим заблуждения в интерпретации xG, которые сформулировал Джонни Уайтмур из Opta и кое-что к ним добавим. 

Заблуждение #1: у кого больше xG, тот и должен победить. Если нет, значит результат несправедлив

Кратко: xG без контекста по итогам матча может обмануть. Нужно смотреть, из каких моментов сложился итог, на какой стадии матча. Может быть, лучшая по xG команда собрала моменты, когда результат уже был предопределен.

Ниже статистика, которая, возможно, вас удивит. 

В 37-м туре АПЛ только в 3 матчах из 10 исход по голам совпал с исходом по xG (версия Opta). Речь не о точных совпадениях в счете, а именно в исходе: победа по xG = победа по голам.

На дистанции сезона АПЛ исход по голам и xG совпал в 60% матчей – 228 из 380. 

На пятилетней дистанции показатель такой же – 60%. 1141 матч из 1900.

Напрашивается восклицание (разумеется, ошибочное): точность монетки всего на 10% ниже, чем ожидаемых голов! 

Или другое (тоже ошибочное): турнирные таблицы топ-5 лиг справедливы на 60%! 

Гораздо более разумный вывод: команда, которая выше по xG, необязательно должна победить. Иными словами, ожидаемые голы не метрика общего превосходства, а метрика суммарного качества ударов. Простой пример: быстрый гол может так изменить матч, что более сильная команда уйдет в оборону с первых минут, а соперник настреляет один ожидаемый гол дальними ударами. В этом случае график xG отразит лишь ход матча. У первой команды был шанс (предположим, 0.4xG), она им воспользовалась, дальше вторая бросилась отыгрываться, налетела на стену в обороне и 20 раз пробила издали (по 0,05xG), настреляв на один ожидаемый гол. Первой повезло, а второй – нет? Обсуждаемо, но точно не очевидно. Да, расхождение по ожидаемым голам – повод задуматься и не переоценивать чью-то победу, но нужно обязательно рассмотреть, как именно сложился xG и на каком отрезке матча.

Именно поэтому к показателю xPts (ожидаемые очки), который пересчитывает ожидаемые голы в очки, нужно относиться ооочень осторожно. Оценивая их суммарно, уже невозможно учесть контекст матчей (как именно команды набрали xG) и очень просто сделать неправильные выводы. Как аттракцион – отлично, но как инструмент для аналитики – не всегда точно. 

Пока мы оценили только совпадения в исходах матчей, но для полноты картины нужно сравнивать xG и голы количественно – числа с числами. 

Заблуждение #2: xG не имеет никакого отношения к реальным голам

Кратко: на дистанции в неделю у xG большие расхождения с реальными голами, но на дистанции 5 лет показатели почти сходятся в одну точку. Поэтому ожидаемые голы полезны как ориентир. Раньше у нас была просто статистика ударов по воротам, а сейчас она поумнела – учитывает и качество момента, который привел к удару (это и есть xG). 

Для начала возьмем рандомный тур АПЛ – например, 1-й в сезоне-2022/23. И посмотрим на зависимость голов от xG. Точки на графике – команды. На горизонтальной оси – их ожидаемые голы. На вертикальной – реальные. 

Линия – сглаженная кривая, а серая зона – доверительный интервал (не будем углубляться в нюансы его расчета, лишь уточним: предполагается, что в него попадает большинство точек на определенном отрезке). Узкий доверительный интервал = маленькая разбежка результатов в выборке, широкий – большая. 

Итак, в нашей выборке 20 команд (10 матчей тура).  

Точки будто рандомно рассеяны по графику. У 50% команд два гола за тур, но показатель xG у них скачет от 0.6 до 2.4. Какую-то зависимость выявить сложно. И если смотреть на это, то вопросы Валерия Карпина можно понять. Что это? Зачем это? 

Дальше строим точно такой же график, но уже не за тур, а за сезон АПЛ. На осях среднее количество xG и голов за 38 матчей.  

Да, отклонения все еще есть, но их меньше, а разбежка в результатах – уже. Зависимость между реальными голами и ожидаемыми прослеживается четче, чем на предыдущем графике. 

Теперь давайте выйдем за пределы АПЛ и нанесем на график все команды топ-5 за прошлый сезон.  

Точки выстроились еще ровнее. Доверительный интервал в выборке сузился, скользящее среднее значение очень близко к результату большинства (не у всех конечно – аномалии никто не отменял). 

Но идем еще дальше! И берем все топ-5 лиги за 5 сезонов! 

И здесь прямая зависимость между голами и xG на дистанции еще четче.

Вывод: чем шире выборка, тем больше концентрация точек вокруг синей линии. А это значит, что показатели ожидаемых голов стремятся к реальным.  

Хммм, зачем тогда вообще нужны ожидаемые голы, если на дистанции они приближаются к реальным? 

Ответ простой: так как футбол малорезультативная игра, ожидаемые голы – инструмент для восприятия результатов. В XX веке для более глубокого понимания игры просто считали количество ударов, сейчас этот показатель просто усовершенствовался. Теперь мы считаем не только количество, но и качество, что помогает нам раньше и четче фиксировать тренды. 

Например, в 90-е мы бы насторожились, если бы какая-нибудь сборная вышла из группы на ЧМ, нанеся за три матча пять ударов. Эта статистика выполнила бы две функции (их сформулировал Тен Кнудсен из Statsbomb).

1. Описательную. Кажется, сборная не очень любит массированно атаковать, ее реализация аномальна. 

2. Прогностическую. Скорее всего, на дистанции продолжить такой тренд трудно, она вряд ли пройдет слишком далеко.

То есть количество ударов позволило бы более трезво посмотреть на результат. xG делает то же самое, но точнее. И здесь важно понимать: xG не объясняет причину результата, а просто лучше всего из существующих метрик описывает матч. И дает основания дать осторожный прогноз. Например, команда трижды подряд победила, но во всех матчах значительно уступила по xG, а это значит, что серия не так крепка, как кажется.

Но это понимание может привести к еще одному заблуждению…

Заблуждение #3: если форвард/клуб забил больше ожидаемого, то в следующем забьет меньше ожидаемого

Кратко: если футболист забил за сезон 15 голов при xG 10, то в следующем сезоне ошибочно ждать, что он зеркально просядет в реализации и забьет 5 при том же показателе xG (10).

Здесь мы попадаем в ловушку, которая называется Ошибка игрока. Интуитивно мы не всегда осознаем, что вероятность каждого следующего события не зависит от исхода предыдущих. 

Простейший пример: мы играем в монетку. Так совпало, что аж пять раз выпал орел. Делая шестой бросок, мы уверены: сейчас точно будет решка. Но математически ничего не изменилось: монетка не потеряла форму, а значит – вероятность выпадения решки в шестом броске будет той же, что и в предыдущих пяти. Да, вероятность шести орлов подряд ниже, чем пяти орлов подряд – если оценивать ее ДО начала игры. Но к шестому броску это не имеет никакого отношения, там вероятность орла все еще 0,5.

Важное уточнение: если орел в монетке – случайное событие, то футбол гораздо сложнее. Если кому-то удавалось взламывать даже рулетку (в лондонском «Рице» в 2004-м компания балканцев заработала миллионы, воспользовавшись неровностью колеса), то что говорить об ударах по мячу. Нужно признать, что в футболе прошлые результаты в некоторой степени влияют на психологию и уверенность игрока – чем чаще забиваешь, тем раскованнее себя чувствуешь.

Но от среднестатистического футболиста мы все еще ждем реализации 1 гол = 1 xG. Пример из вакуума: игрок Х провел дебютный сезон в топ-лиге и забил 22 гола при xG 15. 

❌Неверно: в следующем сезоне ждем от него 8 голов при xG 15. 

❌Неверно: в следующем сезоне ждем от него 22 гола при xG 15.

✅Верно: в следующем сезоне ждем от него 15 голов при xG 15. 

Уточнение про вакуум и среднестатистического игрока – ключевое. И здесь мы переходим к следующему заблуждению.

Заблуждение #4: метрика универсальна для каждого футболиста

Кратко: в основе xG – среднестатистическая ценность удара среднестатистического футболиста. Но каждый реализовывает моменты по-разному, это нужно учитывать. 

Модель xG от Opta построена на базе 2,5 млн ударов футболистов разного уровня. Это значит, что она отражает среднестатистическую ценность удара среднестатистического футболиста.

Проблема в том, что не каждый удар среднестатистический и не каждый футболист среднестатистический. 

Например, вот график Эрлинга Холанда за карьеру в топ-5 лигах. Красная кривая – голы, синяя – xG. Если красная выше, значит Холанд забивал больше ожидаемого. 

Вывод: четыре сезона Холанд на дистанции забивал ощутимо больше ожидаемого, реализация упала только прошлой весной. Космический уровень, вряд ли достижимый для кого-то из других современных форвардов. Возможно, доля везения есть, но она точно не определяющая. Способности Холанда явно выше среднестатистических. 

А теперь статистика Кая Хавертца в «Челси». 

Почти всю лондонскую карьеру немец забивал меньше ожидаемого, лишь ненадолго выходя в плюс. 

Причин разницы в реализации может быть множество, она может меняться от сезона к сезону, от позиции к позиции, от команды к команде (например, в «Байере» показатели Хавертца были лучше). Возможно, топ-клуб создает условия для реализации, пока не уловимые продвинутыми метриками (пространство, темп или что-то еще).

Вывод: xG – среднестатистическая отсечка, которой мы определяем уровень реализации. Регрессия к среднему определенно есть на дистанции, но это не значит, что не может быть исключений. При этом нужно с опаской относиться к аномальным отклонениям как в плюс, так и в минус – особенно на короткой и средней дистанции (месяц, сезон). Очень вероятно, что это временное явление.

Каждый случай нужно оценивать с контекстом.

Заблуждение #5: или безоговорочно доверяем xG, или безостановочно критикуем

Кратко: xG – это не универсальный показатель, как количество угловых, аутов или ударов. Каждый провайдер считает ожидаемые голы по-своему. А еще метрика с каждым годом все точнее – учитывает больше и больше факторов. 

Во-первых, методика подсчета у разных провайдеров и статистических сайтов может меняться. Ценность удара из пределов вратарской и других зон они могут оценивать по-разному. Все зависит от используемых параметров. 

xG – не стандартизированная метрика, разбежка в показателях одного и того же удара может быть огромной. Поэтому если критиковать, то конкретную методику, а не принцип в целом. 

Во-вторых, xG умнеет. Нынешняя версия несравнимо точнее, чем та, что была в 2012-м.

Ниже – простой пример от Opta.

Прежняя версия оценивала этот удар форварда «Ливерпуля» Жоты в 0.68 xG – ниже, чем пенальти. Новая выдает более реалистичный показатель – 0.9.

За счет чего? Учитывается положение тела игрока относительно ворот (боком, спиной или лицом), уровень давления от защитников, позиция вратаря, какой частью тела бьет игрок, отскок ли это или первое касание после паса и еще множество факторов. 

Поэтому вполне возможно, что удар Силаса из «Штутгарта», о котором говорит Нагучев, улучшенными моделями оценивается по-другому. 

Вероятно, что xG и в будущем ждут изменения – возможно, когда-нибудь она будет учитывать и реализацию конкретного футболиста, уровень его формы, давление трибун в большом матче, а также состояние мяча (влажный или сухой). 

Но критика все равно останется, и это отлично – значит, прогресс продвинутых данных продолжится, избавляя их от старых недостатков и удовлетворяя новые запросы. 

Но еще важно, чтобы вместе с продвинутой статистикой развивалась и качество ее интерпретации. Заблуждаться из-за недостатка информации – нормально. Главное видеть ошибки и двигаться дальше. 

Телеграм-канал автора

Почему растет пропасть между богатыми и бедными (АПЛ уходит в отрыв)? Игра в монетку объяснит ооочень упрощенно

Фото: Michael Baucher, Simon Traylen/Global Look Press