Основы xG
Для удобства смоделируем ситуацию. Представим, что вы сделал очередную ставку на фаворита футбольного матча. Сам поединок вы не можете посмотреть. Глядя на результаты матча вы видите, что аутсайдер взял верх.
Что такое иксДжи? ИксДжи — это совокупность показателей, которые помогут вам разобраться в том, почему же аутсайдер выиграл в конкретном матче. Начнём.
Сама абревиаутра расшифровывается, как экспЭктед гОлс, ожидаемые голы. Основная идея xG-моделей заключается в придании каждому удару своего коэффициента опасности. Этот коэффициент выводится при помощи формул, содержащих в себе объективные футбольные факторы. Простыми словами, xG определяет колеблющуюся от 0 до 1 вероятность забить гол после какого-либо удара. Распределение баллов происходит в зависимости от точки, из которой нанесен удар по воротам, части тела, которой произведен удар, типа предшествующего удару паса, типа атака. Одним из создателей данного подхода считают Эгила Ольсена, тренера сборной Норвегии пару десятков лет назад. Из более современых людей углубленно занявшихся иксджи можно отметить Майкла Келли, который около пяти лет назад создал продвинутую иксджи модель.
Подобно классическому подсчету побед, забитых и пропущенных голов, в иксДжи модели существуют иксПоинты, которые при сложении образуют значение. Если сделать те же подсчеты и в играх других команд лиги, то получится таблица по версии иксДжи.
Как измеряют xG сейчас
Единственной, удобной и подходящей всем формулы для измерения xG сейчас нет. Существует большое количество различных xG-моделей, каждая из которых может проявить свои преимущества (или недостатки) относительно других только на очень длинной дистанции. Должно пройти какое-то время, пока разные источники статистики утвердят какие-то общие правила подсчета, но уже сейчас можно ориентироваться на крупные площадки. Такие как Opta.
При помощи огромной базы из сотен тысяч примеров, имеющейся у этой компании для анализа, они выделили для каждого опасного момента свои коэффициенты (от 0 до 0,99 в зависимости от того, как часто забивают в подобных случаях на дистанции). Исходя из позиции, положения защитников, этапа игры, расположения вратаря и даже части тела с которой бьет игрок — около 10 параметров влияют на конечный итоговый xG каждого момента. Далее по ходу игры каждый момент суммируется в общий показатель, и уже по истечению всего времени матча мы можем видеть “ожидаемый счет”. Почему иксджи нельзя верить на 100%?
В данном случае вступает в дело удача и везение, именно из-за фортуны нелья на 100% верить ни моделям ожидаемых голов, ни показателям реальных набранных очков. иксджи так же имеет и самый главный недостаток. Проблема, которую никто никак не может решить — как перевести людей в цифры. В иксДжи не учитываются навыки игрока, который наносит удар.
Недостатки большинства моделей
Так как система подсчета вероятности забитых голов по xG только формируется, у текущих моментов есть несколько существенных проблем. Решения для них пока не очевидны, но ознакомиться с ними для понимания ситуации обязательно стоит:
1) Если момент не закончился ударом, то по нему большинство моделей xG не учитывают. Это огромный минус, так как есть очень много случаев, когда игрок либо из-за брака техники, либо из-за внешних факторов не успевает бить по пустым воротам, например. Таким образом если бы удар был выполнен, его xG мог быть 0,98 но так как игрок не отправлял мяч в ворота, то и плюсовать модели (когда модель ориентируется по ударам) нечего.
2) Если в игре получилась ситуация, когда ворота оказались незащищенными (вратарь вышел на угловой, например), игроки с большей вероятностью стараются моментами такими пользоваться, бьют чуть ли не с центра поля. Однако, основанные на аналогичных позициях xG-модели скажут, что вероятность попадания таких ударов стремится к нулю. Очевидно, это не так. Сразу виден более сильный недостаток многих моделей — мало где учитывается расположение игроков обороны.
3) Из-за того, что модель не учитывает мастерство игрока атаки, многие коэффициенты для опытных форвардов не будут верными. Точно также как мы знаем, что средние показатели реализации в чемпионате Венгрии, например, ниже чем в чемпионате Испании, знаем и то, что нападающий в Ла Лиге с большей вероятностью забьет в пределах штрафной площади, чем нападающий Вышки венгерского дивизиона. Но xG-модели никак не учитывают этот момент. Для них есть одна и та же цифра, независимо от полей и исполнителей. Наверное, в этом контексте стоит подумать об индивидуальных моделях для каждого игрока, но что тогда должно быть основой первичных данных?
4) Автогол или пенальти никак не учитывается, берутся только моменты “с игры”. Это одновременно и плюс, и недостаток, поскольку очень часто они становятся итогами опасных атак без ударов. А о проблеме атак без ударов мы уже знаем (смотри пункт 1). Несомненно, у данного подхода к футбольной статистике огромный потенциал и, возможно, именно вы сможете построить идеальную иксДжи систему. Все ресурсы для этого есть.
Напоследок добавим немного иксДжи терминологии.
xG-Plot. ИксДжи Плот — позволяет увидеть динамику ИксДжи по ходу матча, например, сравнить какуй половину встречи лучше проводит ваша команда.
xA. Икс Эй — ожидаемые голевые асисты. В этой модели идет подсчет пасов, которые приводят к ударам.
Packing. Пэкинг отражает сумму соперников, которые остаются за линией мяча после паса. этот показатель помогает оценить эффективность пасующего игрока.
Тема очень обширная и в этом материале представлена только часть информации, чтобы понять основы ИксДжи.
Спасибо за внимание!
По поводу дистанции Вы правы, т.к. в одном отдельно взятом матче может случиться всё что угодно, тот же Ливерпуль по xG должен был забивать и МЮ, и Спартаку, но так и не смог. Тем не менее нам это даёт информацию, что атака у красных в порядке и страдает реализация, рано или поздно команду должно "прорвать", и вот они уничтожают Марибор со счётом 0-7.
но "..Распределение баллов происходит в зависимости от точки, из которой нанесен удар по воротам, части тела, которой произведен удар, типа предшествующего удару паса, типа атаки" - поэтому в отношении xG правильнее говорить о моменте, а не только ударе
Например тривиальный кросс оценивать в условные 0,1, а проникающую передачу между защитниками на ход - в 0,3 какие-нибудь.. После быстрого розыгрыша в касание - еще +0,1.. и т.д. Вообще по-моему чем больше факторов учитывает модель - тем лучше. В этой связи не пойму, почему нельзя в моментах учитывать индивидуальные скиллы игроков? Для универсальности? Ну так у всех бывает вставание не с той ноги.. - на то и показатели момента, которые это отражают по сути.
---------------------------------
Ну, во-первых не все, а во вторых - разве это чем-то ограничивается, кроме числа параметров уравнения? А разве это ограничение?