10 мин.
2

Как Иван лежа на печи xG считал

Есть такая профессия Родину защищать метрика Xg, которую пихают последнее время везде.

Тренеры говорят, что она их не интересует

Комментаторы и эксперты говорят, что тренеры лукавят

Болельщики смотрят на нее и оправдывают поражения своей команды в своих же глазах невезением: по xg же набрали больше чем соперники!

Я постараюсь ниже разобраться, что это за метрика и как ее трактовать, ведь ее истинное понимание приходит только если посидеть и самостоятельно попытаться посчитать несколько туров подряд

Упражнение было таково, что сначала я считал сам, а потом сравнивал с источниками. К слову, все источники дают порой очень отличающиеся результаты, что говорит к слабому доверию

Ремарка. Все, что я считал, я считал еще в прошлом году на матчах РПЛ

Источники

Считаю важным привести известные мне источники

  1. Yandex Спорттех https://t.me/yandex_sportstat. У них есть тг-канал где они публикуют, то что насчитали.

  2. раньше было в приложении Sports но куда исчезло (по крайней мере у меня)

  3. Матч ТВ показывает в своей трансляции минут за 15 до конца матча

  4. https://soccer365.ru/ - наверное больше всего нравится

  5. телеграмм РПЛ публикует (но похоже что это Яндекс)

  6. https://understat.com/ - раньше был жив но сейчас зашел - что то не грузится. Да и данные после сравнения со своими замерами, мне в последнее время казались странными

Терминология

Xg - это сумма ожидаемых голов команды в матче. Сумма: удар по воротам*вероятность забить из этого положения (средняя вероятность)

Пример расчета:

Допустим у команды А было 3 удара по воротам

  • 1-й из положения откуда забивают каждый 5-й гол - 0,2 по xg

  • 2-й из положения откуда забивают каждый 2-й - 0,5 по xg (это откровенный выход 1 на 1)

  • 3-й из положения откуда забивают каждый 10-й - 0,1 по xg

суммарный Xg будет 0,8 - несмотря на то что команда имела 2 отличных момента, а 0,2 - это очень хорошо, команда на гол так и не наиграла

Важные ограничения на примерах и неочевидности при вычислении

  1. Самый важный, который чаще всего ломает вообще всю логику показателя, пример - это пенальти. Считается что вероятность забить пенальти 0,8 - соответственно вклад в xG будет 0,8. Представьте, что вратарь отбил и было добивание - в этом случае в xg войдут оба удара и пенальти и само добивание и часто xg этого момента будет 1,5!

  2. Тут же важен и xg самого пенальти - пенальти бывают созданные, а бывают левые. Левый - например, когда мяч случайно попадает в руку на краю штрафной, наверное смешно говорить о том что в этом случае команда наиграла на 0,8 xg

  3. если был прострел и игрок не дотянулся 1мм до мяча для удара в пустые ворота - xg будет 0 - удара не было

  4. Если был чистый выход 1 на 1, но вратарь бросился в ноги и забрал мяч - xg будет 0

  5. Если был дальний удар, вратарь ошибся и скинул мяч на голову сопернику в пустые ворота - xg будет 0,7 или около

  6. неназначенные пенальти и микровнеигры - тоже никогда не добавляют в xg, хотя есть явные ошибки арбитра и миллиметровое везение защитника защищающейся команды

  7. Очевидно что уровень мастерства повышается от лучших чемпионатов к худшим, поэтому xg в разных чемпионатах сравнивать можно но наверное не совсем корректно

  8. из 2 следует что xg так то и между командами одной лиги рознится так как и от исполнителей тоже зависит много, но я не видел чтобы это где то исследовали и мы этим тоже пренебрежем

Трактовка и заинтересованные стороны

Главный вывод из всего вышесказанного: Показатель Xg значит ровно то, что он значит по ОПРЕДЕЛЕНИЮ и ничего больше. Да, возможно, в 60% - 70% случаев она отражает распределение сил на поле и атакующий потенциал команд.

Но самый главный вопрос: кому нужны эти 60-70% процентов? В особенности, когда нет приличных источников веры. В футболе больше интересны конкретное состояние конкретной команды в конкретный промежуток времени. Все очень круто меняется от матча к матчу в зависимости от того, какие составы, как часто играл и кучи других метрик

Тренеры/аналитики команд - эти ребята готовятся к конкретным соперникам. Из вышесказанного маловероятно что их интересует xG - они сами посмотрят игры и посчитают атакующие потенциалы так, как им интересно

Болельщики: возможно, если игру ты не посмотрел а порубиться с друзьями за игру нужно

Эксперты и комментаторы: наверное это самые большие заинтересанты, они делают контент и наверное не всегда смотрят все матчи или смотрят все, но их очень много и трудно удержать все в голове

Внешние ребята которые занимаются оценкой команд - капперы, букмейкеры, независимые аналитики (не путать с экспертами, хотя иногда телеэксперты тоже разбираются и др.) - им очевидно эта метрика тоже не к селу ни к городу. На кону стоят большие деньги, которые такой метрике не доверишь

Мой вывод из этого всего: кто-то когда-то придумал метрику, в контент она вписалась и все продолжают бездумно ее считать подавая ее как атакующую силу команд

А какая метрика бы подошла?

Я, условно, причисляю себя к группе внешних аналитиков. Когда я считал Xg моей целью было реально оценить атакующий потенциал команд и силы команд в конкретной игре, поэтому я невольно задался вопросом - а какая метрика мне нужна, так как xG оказалась несостоятельна

Пофантазируем и назовем ее xxG

  1. метрика должна решать проблем с частотностью. Это значит, что должно быть понятно сколько и какого качества моментов создали команды

  2. xg одного игрового момента не должен быть больше 1

  3. очевидные моменты для гола должны учитываться даже если не было удара (с дисконтом). К примеру это тот же самый 1 на 1

  4. отскоки должны считаться по первоначальному удару с премией за удачу. Пример: изначальный удар был с xg 0,07 а отскок - xg 0,7. Я для себя решил в таких моментах добавлять просто 0,15 xxg - надбавка за удачу (условно за то, что тот к кому попал мяч добежал и добежал возможно в то самое место куда был должен добежать или находился там где должен )

  5. должна отражать частотность моментов с xg более 0,15 (моменты с ударами и без) - это в целом может быть отдельная метрика моменты, но я добавил все в одну

  6. XG в периоды отсечки должен считаться отдельно: для себя я выбрал 4 универсальные ситуации

Как выглядит проектируемая метрика на примере

  • 1 цифра - сумма xxg с моментами <=0,25 xg

  • через плюс добавляем явные голевые моменты- c xg > 0,25 - их всегда очень мало или нет совсем но их надо увидеть отдельно

  • если пенальти то учитываем как xg момента но добавляем что это пенальти, например 0,25п

  • если пенальти левый 0п

  • так как xg момента у меня всегда меньше 1, то 2 удара в створ, с xg, например по 0,7, считаем как единый момент по формуле xg1м + (1- xg1м)*xg2м - таким образом он никогда не будет больше 1

Таким образом получим следующее отображение

xxG: 1,05(0,7+0п+0,35о) VS 1,6(1,2+0,4)

по фактам события матча команда 2 создала больше моментов и была лучше. В ЭТОМ ПРИМЕРЕ ПАРАМЕТР РАСЧИТЫВАЕТСЯ В СКОБКАХ А ЗА СКОБКАМИ ЭТО СУММАРНОЕ ЗНАЧЕНИЕ ДЛЯ ТОГО, ЧТОБЫ ПОТОМ СРАВНИТЬ С Xg

xG для сравнения: 2,2 VS 1,6 - команда 1 лучше команды 2, если принять что 0,35о состоял из момента 0,2xg и добивания после отскока на 0,5xg

Заключение:

Для себя я пришел в итоге к абсолютной бесполезности xg для какого-то прикладного применения. По поводу своей метрики я не претендую на какую-то эксклюзивность или идеальность, но она точно лучше xg показывает силу команд: надеюсь и уверен, что свои адекватные крутые метрики есть во всех тренерских штабах и компаниях, связанных с внешней аналитикой

P.S. посмотрим как это работает

сравнение xg (возьму от яндекса) и xxg (упрощенный, суммарный для целей сравнения цифр) для 22 тура РПЛ (я считаю xxg)

Ахмат - Ростов (xg хорошо отражает реальность)

xG: 0,39 - 1,67

xxG: 0,5 - 1,77

full xxG:

1т 0,35 + 0,15п - 0,07

2т |от 0 - 1 + 0,7

Комментарий: еще один матч, который заставляет задуматься - основной xg ростов внес последние 10 мин. Ужасный 1т Ростова. Отсечку поставил из за травмы Богосавца, вероятно игрока Ахмата было не очень хорошо.

Балтика 4 - 0 Сочи (xg хорошо отражает реальность)

xG: 2,46 - 0,12

xxG: 2,07 - 0,17

full xxG:

0,8 + 0,4 + 0,4 - 0,07

0,47 - 0,1

Комментарий: отличный 1т от Балтики и невнятный второй несмотря на количество голов.

Динамо 1 - 3 Зенит

xG: 0,41 - 1,24

xxG: 0,75 - 1,26

full xxG:

0,3 - 0,4 + 0пн + 0,33

0,3 - 0,4 |от 0,15 - 0,13

Комментарий: несмотря на все хвалебные речи после этой игры в сторону Зенита они сыграли обычную выездную игру, в которой имели один отличный момент. Другое дело, что и Динамо сыграло матч, который легко встал в ряд последних игр - почти без моментов.

Краснодар 5 - 0 Пари НН (xg хорошо отражает реальность)

xG: 2,7 - 1,1

xxG: 3,14 - 1,05

full xxG:

0,52 + 0,5 + 0,5 + 1 - 0,3

0,42 - 0 |от 0,2 - 0,5 + 0,25п

Комментарий: можно увидеть, что во 2т команды были примерно равноостры несмотря на град голов в ворота Пари НН.

Крылья Советов 0 - 0 Рубин (xg хорошо отражает реальность)

xG: 0,44 - 0,28

xxG: 0,49 - 0,5

full xxG:

0,37 - 0,35

0,12 - 0,15

Локомотив 5 - 0 Акрон

xG: 2,15 - 0,76

xxG: 2,97 - 1,25

full xxG:

1,6 - 0,05 + 0,5 |от 0,62 - 0,1

|от 0,35 + 0,4 - 0,6

Комментарий: если смотреть на 1т то локо насоздавал огромную кучу моментов 1,6xg низкочастотных моментов - это огромное количество, а Акрон создал всего один хороший момент. Во 2т команды сыграли примерно равномикроостро. |от - означает что локо повел в 3 гола

Оренбург 0 - 2 Спартак

xG: 0,99 - 2,14

xxG: 1,1 - 1,53

full xxG:

0,25 - 0,4 + 0,33

0,45 + 0,4 - 0,8

Комментарий: мы видим что Оренбург и Спартак создали по одному отличному моменту, в остальном Спартак чаще создавал моменты, но по сумме ожидаемых голов ушел не далеко

ЦСКА 3 - 1 Динамо Мх

xG: 2 - 0,4

xxG: 2,54 - 0,95

full xxG:

0,65 + 0,9 - 0,32 + 0,33

0,15 + 0,5 - 0,3 |от 0,34 - 0

Комментарий: несмотря на огромный xg у ЦСКА видно что большая часть уложилась в 2 момента. у Динамо только момент с голом должен быть в классике 0,6 - 0,7, странные цифры от Яндекса на мой взгляд. В тоже время мы видим что кроме гола у дмх были только полумоменты но на общий гол они наиграли. Можно сказать и по другому - молодая связка защитников Лукин-Данилов точно наиграла на пропущенный гол по xg. Также можно видеть что до 3гола ЦСКА во 2т ничего не создал.