xG - бесполезная статистика. Или нет?
Пару лет назад показатель xG произвел настоящий фурор в футболе. От никому неизвестной гиковской метрики модель ожидаемых голов проделала путь до вполне себе привычной рядовому зрителю статистики, которую теперь можно нередко увидеть на экранах телевизора в одном ряду с такими заурядными вещами, как владение мячом и количество угловых у команды.
Вслед за популярностью к xG пришла и извечная проблема - неправильная трактовка. Ожидаемые голы постигла та же участь, что и многие другие статистические показатели, требующие правильной интерпретации.
«У «Атлетико» на целых 7 ударов меньше, чем у «Барселоны», да еще и владение всего 38%, но при этом они выиграли? Да это же отскок!» - именно такие суждения раньше были слышны в уголках любого спортивного бара. А что теперь? «Да у «Сити» же на 0.73 xG больше - конечно, на победу наиграли, чего уж там!» На деле же суть не поменялась. Любые данные, какими бы точными и проработанными они не были, нужно уметь верно трактовать. Поэтому сейчас мы и поговорим о правильной трактовке детальнее.
Что значит показатель xG в конкретно взятом матче?
Первое, что нужно хорошо понимать - это сама суть xG. Показатель ожидаемых голов в конкретной игре не всегда показывает, насколько опасными были атаки у команды, и уж тем более не отображает качества её игры. Число xG демонстрирует лишь то, сколько забивают команды в среднем, нанося удары из конкретных позиций и при конкретных условиях. Другими словами, количество ожидаемых голов в матче означает лишь то, насколько опасными были удары команды (и насколько много их было).
Простой пример. Идет прострел в чужую штрафную, где открывается нападающий, освободившийся от защитников. Казалось бы, еще секунда - и взятие ворот будет зафиксировано, но форвард банально не дотягивается до мяча. Удар не был нанесен, и опаснейшая атака, которая едва не завершилась голом, получает xG, равный нулю.
В январе «Бернли» сенсационно обыграл «Ливерпуль» на Энфилде, прервав 68-матчевую беспроигрышную серию «мерсисайдцев» на своем стадионе. После матча многие болельщики «красных» сетовали на невезение, подтверждая свои слова показателями xG в матче.
Действительно, «Ливерпуль» нанес 27 (!) ударов по воротам соперников. Парадокс в том, что, несмотря на большее xG, «Ливерпуль» имел также и бОльшую вероятность не отличиться в матче ни разу - 18% против 17% у «Бернли». Все потому, что «красные» наносили множество ударов, не представлявших угрозу воротам соперника - средний xG был всего 0.06, а показатель выше 0.11 был только у удара Дивока Ориги в перекладину.
Это ярко демонстрирует, что, помимо самого числа xG, важен ещё и контекст - действительно ли исходила угроза от этих ударов. Создавая целую кучу полумоментов вместо двух-трёх голевых, ты получаешь как шанс отгрузить 7 мячей в ворота соперника, так и риск не забить ни одного.
Существует еще одна ловушка, связанная с оценкой матча на основе xG. Классический сценарий - середняк играет на контр-атаках в матче с топ-клубом. Имея тотальное превосходство во всех стадиях игры, гранд (для лучшего понимания назовем его «Баварией») неожиданно пропускает случайный гол за 10 минут до конца поединка. После этого тотальный контроль игры вполне может превратиться в хаотичные навесы, а летальный до этого контрпрессинг испариться, оставляя огромные свободные зоны для контр-атак, чем может воспользоваться опонент, организовав пару выходов 1 на 1. Таким образом, середняк победит как по счету, так и по xG, но модель ожидаемых голов не отразит того перевеса, который был у «Баварии» до этого, ведь ничего не значащие моменты в концовке оцениваются одинаково с доминированием по ходу всего матча.
О чем может говорить несоответствие xG и реальных голов на дистанции
Существует расхожее мнение о том, что если команда забивает меньше (больше), чем должна забивать средняя команда согласно показателю xG, то ей просто-напросто не везёт (везёт). Конечно, всегда удобно находить простые объяснения сложных проблем - вместо того, чтобы погрузиться в контекст и детальнее изучить вопрос, можно все списать на неудачу. Однако вчитайтесь еще раз в саму формулировку. Быть может, если команда реализует свои моменты не так, как средняя, то она и не является средней в этом показателе?
Рассмотрим, к примеру, «Тоттенхэм». В своем составе «шпоры» имеют двух потрясающих завершителей. И Сон Хын Мин, и Гарри Кейн за последние 7 сезонов (что говорит о хорошей выборке) перебрали более 20 голов относительно показателя xG. Если в твоей команде два основных голеодора настолько хорошо реализуют свои возможности, то нет ничего удивительного, что ты будешь внушительно оверперформить на протяжении многих сезонов подряд. В этом нет никакой аномалии или везения, а есть наличие потрясающих футболистов в группе атаки.
Есть, конечно, и обратный пример - любимая команда хейтеров xG, «Брайтон». В прошлом сезоне команда недобрала больше 8 голов, а в этом и вовсе должна быть в числе претендентов на Лигу чемпионов. По крайней мере, если верить модели ожидаемых очков. На самом же деле «чайки» все еще не гарантировали себе выживание в этом сезоне. Все потому, что нападающие «Брайтона» невероятно транжирят свои моменты. Но можно ли это назвать аномалией? И да, и нет. С одной стороны, форварды команды никогда не славились хладнокровностью. Нил Мопэ второй год в Премьер-лиге демонстрирует как хорошее умение открываться в штрафной и освобождаться от защитников, так и плохую реализацию, Дэнни Уэлбэк за последние сезоны в чемпионате забил на 8 голов меньше ожидаемого, а молодой Аарон Коннолли, кажется, перенимает негативные характеристики у своих опытных коллег. Сказывается и тот факт, что в команде нет хорошего штатного пенальтиста - в этом сезоне уже три футболиста «Брайтона» пробивали одинадцатиметровый, и каждый успел смазать хотя бы по разу.
С другой стороны, андерперформанс действительно слишком внушительный, чтобы списывать все на плохую реализацию. Шепотом действительно можно говорить о том, что команде Грэма Поттера в этом сезоне не хватает не только летальности у чужих ворот, но и чуточку удачи. Но надо понимать, что аномалии в статистике - это нормально, что, по сути, и лишает их такого статуса. Вероятность того, что конкретно взятой команде будет так сильно не фартить низка, но то, что такая команда найдется в топ-5 лигах в любом сезоне (а как правильно и не одна) - это ожидаемо. Другими словами, аномалией как раз было бы отсутствие аномалий. Вероятность того, что случайно выбраный человек родится с вами в один день, равна 1/365, то есть меньше 0.3%. Но вероятность того, что такой человек найдется из тысячи, уже близка к 95% - уже больше, не так ли?
А что с индивидуальным xG футболистов?
Последнее, что хотелось бы уточнить - это влияние персонального xG на оценку реализации футболиста. Часто делается вывод, что если игрок оверперформит (то есть забивает больше, чем должен), то он - очень хороший завершитель. Это куда ближе к правде, но тоже требует уточнения. Один из моментов, требующих рассмотрения, это карта ударов футболиста и зоны, из которых эти удары были нанесены.
Филипе Коутиньо - мастер дальних ударов. В «Ливерпуле» он буквально клал их пачками, что стало одной из причин помутнения в умах боссов «Барселоны», провернувших этот не самый удачный трансфер, но и в других клубах скилл бразильца никуда не исчез. Статистика подтверждает это - Коутиньо забил 22 гола из-за пределов штрафной вместо 10.75, которые предсказывала модель ожидаемых голов - более чем вдвое больше. Однако в штрафной показатели уже не такие радужные - 27 голов вместо 29.7. Посмотрев на соотношение ожидаемых и реальных голов, можно подумать, что он очень хорош в реализации, когда как на деле эта разница набита за счет лонгшотов, а вблизи ворот он бьет даже хуже среднего. Обратный пример, кстати, у Роналду - тот наносит очень много ударов из-за штрафной, но делает это хуже, чем другие (вот такая неожиданность).
Последнее, что хочется сказать - это завет тем, кто любит делать статистические выводы. Всегда необходимо следить, чтобы выборка была репрезентативной, ведь, как мы уже убедились, аномалия - это нормально. Особенно это касается реализации, которая порой не очень хорошо переносится из сезона в сезон. Два года назад многие ставили крест на Роберте Левандовском после плохого сезона поляка. На самом деле он провел сезон 2018/19 даже лучше остальных в плане количества моментов - просто количество не переходило в качество. Левандовски забил на 11 голов меньше ожидаемого, а потом доказал, что это было случайностью.
Подытожим. Ко всем показателям нужно подходить аналитически. xG, как и любая друга метрика, требует как правильной трактовки, так и хорошей выборки. Поспешные выводы, сделанные без одного из этих аспектов, на практике могут оказаться полной чушью, но это не является проблемой статистики - это проблема человека, дававшие такие суждения только из-за того, что было лень погрузиться в проблему детальнее и изучить её. А если вы эти годы и были тем самым человеком, то помните, что никогда не поздно исправиться - Левандовски это доказал.
Вот и вся разница! А так как большинство глоров «болеют» за клубы лишь для того, чтобы поковырять перед сверстниками о том, какой из клуб «крутой» не важны никакие XG и прочие! Важен только конечный счёт!