Ваши ожидания ваши проблемы: points vs xPTS в АПЛ. Сезоны 2015-2026
Вводная часть: Оценка справедливости результата через xPTS
На создание данной статьи меня подтолкнули разговоры про потенциальное чемпионство Арсенала, как незаслуженной чемпионство самой слабой команды (возможно после Лестера) за последние годы. Всё начиналось как сравнение метрик Арсенала с чемпионами других сезонов, в итоге ушло немного дальше. Не переключайтесь, ниже будет много занимательных графиков.
Как оценить справедливость или «заслуженность» того или иного места в чемпионате? Оценка «заслуженности» вещь субъективная, кому-то необходима тотальная игровая доминация (ха-ха), кому-то регулярная острота созданных моментов, смелость и высокая игровая интенсивность, кому-то запредельный уровень организации команды в совокупности с наличием нескольких инструментов для взламывания обороны противника (привет Арсенал), а кому-то достаточно результатов в итоговой таблице сезона. Всё это дело вкуса. Но есть вещи которые мы можем оценить более-менее объективно в пространстве чисел. Это кол-во и опасность созданных (xG) и допущенных (xGA) моментов командой в каждой конкретной игре и, как следствие, относительную «справедливость» результата всего сезона. Если команда регулярно создаёт больше опасных моментов чем допускает, то согласно некоторой интерпретации она заслуживает быть выше остальных. Соотношение xG и xGA в каждом конкретном матче трансформируется в метрику Ожидаемых очков (xPTS), которая достаточно наглядно демонстрирует сколько очков «заслужила» команда в данной игре на основании соотношения xG/xGA. Конечно, xG-модель имеет свои недостатки и может не учитывать некоторые важные составляющие игры, но это лучше чем оценка качественная, т.к. она слишком неоднозначна. Все, приведенные в статье, данные взяты с ресурса Understat, который хранит в открытом доступе информацию по метрикам xG, xGA, xPTS ( и многим другим), начиная с сезона 2014/2015 года.
Пример метрики xPTS
Значение xPTS, так же как и обычные очки по итогам матча, может находится в диапазоне от 0 до 3, не ограничиваясь при этом дискретными значениями 0, 1, 3. Приведу в пример матч последнего тура АПЛ Арсенал-Эвертон (2-0). xG Арсенала - 1.91, xG Эвертона - 1.18. Значение xPTS (ожидаемых очков) для Арсенала - 1.93, для Эвертона - 0.82. Таким образом Арсенал набрал на 1.07 очков больше ожидаемого, а Эвертон недобрал 0.82 очка. Вот здесь и формируется ключевая разница которую мы будем оценивать в дальнейшем.
Как рассчитывается метрика xPTS?
На первый взгляд странные значения 1.93 и 0.82 ожидаемых очка объясняются достаточно просто.
Для каждого матча Understat выполняет 10 000+ симуляций, в каждой из которых возможны 3 исхода:
победа первой команды (A)
ничья
победа второй команды (B).
Как получается исход матча:
Для каждого удара в матче генерируется случайное число от 0 до 1
Если это число ≤ xG удара - удар считается голом (есть поправки на удары в одной атаке)
Так обрабатываются все удары в матче
Получается один виртуальный счёт
Процесс повторяется тысячи раз
По итогам симуляций получаем количество каждого из исходов, которое можно трансформировать в долю (или процент) от общего количества симуляций. В итоговой статистике матча на ресурсе Understat указанные значения представлены в разделе CHANCES.
Теперь как считается xPTS?
Точный расчёт метрики может отличаться в зависимости от ресурса. Но концепция расчёта следующая:

Умножаем долю победных исходов на 3 и прибавляем долю ничейных исходов, получаем xPTS. Проверим так ли это для xPTS Арсенала в указанном матче.

Доля исходов с победой Арсенала 0.56, ничейных исходов - 0.25. xPTS - 1.93. Проверяем расчёт:
xPTS (Арсенал) = 3 × 0.56 + 1 × 0.25 = 1.68 + 0.25 = 1.93
Вуаля! Мы только что посчитали ожидаемые очки Арсенала в матче.
Теперь мы можем зафиксировать разницу между фактическими очками (points) и ожидаемыми очками (xPTS), которая покажет нам сколько очков «перебрала» или «недобрала» команда в матче, назовём эту разницу Δ (Дельта).
Δ = points - xPTS
Можно сказать, что эта разница показывает насколько эффективна и везуча была команда в матче. По итогам сезона для каждой команды есть суммарное значение xPTS и фактическое количество очков, набранное в сезоне. Δ между этими значениями грубо характеризует насколько справедлив итоговый результат команды в сезоне. Всё, на этом с матчастью окончено. Возможно просто и неполно, но для дальнейшего понимания графиков этого будет достаточно. Приступим!
Points vs xPTS команд АПЛ в сезонах 2015-2026: топ «везучих» и «невезучих»
Т.к. архив данных на ресурсе начинается только с сезона 2014/2015, на графиках будут представлены результаты за 12 сезонов (2015-2026). Для сезона 2026 результаты получены банальной экстраполяцией через пропорцию для того чтобы можно было их приблизительно сравнить с остальными сезонами (если за 30 матчей у команды столько очков, то за 38 будет столько, xPTS получены через текущую Δ). Метод грубый но для условного сравнения годится.
Посмотрим на первый график. По оси X - xPTS, по оси Y - Points для всех команд АПЛ начиная с сезона 2015. Топ-10 команд, «перебравших» очки, отмечены зеленым на графике и приведены в таблице ниже. Для топ-10 «недобравших» цвет на графике и в таблице красный. Числа на графике - места команд в сезоне (указаны топ-4 и 17-20 места)



Первое, что бросается в глаза, это соответствие в среднем значений xPTS и points - есть команды, которые недобирали очки, есть команды которые набирали больше чем ожидалось, но все они распределены вокруг линии y=x, то есть соотношения points:xPTS 1 к 1. Фиксируем, что подавляющее большинство команд из топ-4 набирает больше ожидаемого, а большинство команд 17-20 мест - меньше. При этом все команды чемпионы набирали больше ожидаемого в каждом из 12 сезонов. Указанные зависимости можно объяснить достаточно просто, топ-команды имеют более качественный подбор игроков по сравнению с другими командами лиги, поэтому реализуют больше (сильнее нападающие) и пропускают меньше ( топ голкиперы) ожидаемого. Можно пойти от обратного, командам в течение сезона откровенно везёт, поэтому они располагаются высоко, соответственно командам с последних мест, наоборот, не везёт. Интерпретация дело ответственное, поэтому обойдем его стороной.
На первом месте среди самых везучих (эффективных) команд находится «Ливерпуль» 2019/20. В этот сезон команда Клоппа набрала, практически, на 25 очков больше чем ожидалось. На графике точка с данным результатом явно выделяется среди остального массива данных. Также выделяется второе и третье место рейтинга, команды максимально эффективных (и где-то везучих) тренеров - «Манчестер Юнайтед» Моуриньо 2017/18 (2-е место) и чемпион сезона 2016/17 - «Челси» Антонио Конте. Из недавнего - экстремальный перебор очков «Ноттингем Форест» в прошлом сезоне (+15) и «Астон Виллой» в текущем (+14 на данный момент). Интересный факт, что команды, демонстрирующие экстремальные отклонения фактических очков от ожидаемых, в следующем сезоне регрессировали к среднему (соответствие points xPTS) либо демонстрировали подобное отклонение в обратную сторону. К примеру, одна из самых «перебравших» команд - «Ноттингем Форест» сезона 2024/25 до этого набрала экстремально меньше ожидаемого (-14 очков). Самой невезучей командой согласно метрике xPTS официально можем признать «Брайтон» сезона 2020/21, команда набрала на фантастические 20 очков меньше чем ожидалось ( и это не объяснить отсутствием качественных исполнителей). Отметим, что большинство из топ-10 невезучих команд заканчивали сезон в зоне вылета либо около неё.
Что там в топ-4?
Давайте теперь перейдем к самому интересному. Проанализируем отношение xPTS vs points для топ-4 каждого сезона начиная с 2015 года. 1-е места каждого сезона подписаны «команда ‘сезон». Остальные места указаны цифрами. Точки одинакового цвета - команды из одного сезона.

На этом графике ничего неожиданного. Наиболее «справедливый» чемпион - «Манчестер Сити». Во всех чемпионских сезонах их xPTS превышали xPTS конкурентов. Топ-3 значения xPTS также принадлежат этой команде: 90+ xPTS в сезонах 2018, 2019 и 2022 года (подробнее о топе по xPTS позже).
Самый «несправедливый» чемпион по данной метрике - «Ливерпуль» сезона 2019/20, несмотря на фактическую разницу в 18 очков между ним и вторым местом - «Манчестер Сити» (99 и 81 очко соответственно), разница в xPTS +12 очков в пользу «Манчестер Сити». В тот сезон у команды Клоппа был запредельный уровень мотивации, концентрации, а также шикарный подбор игроков в своем праймовом возрасте и форме (и, возможно, немного удачи), что позволило создать такую аномалию в результатах. Манчестер Сити в этом сезоне, к слову, недобрал 5 очков.
Самый «слабый» чемпион не является для нас неожиданностью - это легендарный, аномальный «Лестер» сезона 2015/16. Количество ожидаемых очков в том сезоне - меньше большинства команд топ-4 за весь период, а количество фактически набранных - одно из наименьших за последние 30 лет. Чудеса случаются! В тот сезон, кстати, «Арсенал» стал чемпионом по xPTS с отрывом 8 очков (вот они, математические трофеи).
На этом графике более наглядно подтверждаем факт, что все чемпионы набирали очков больше чем ожидалось (кто-то невероятно больше).
Если в текущем сезоне «Астон Вилла» сохранит темп набора xPTS и 4-е место, то станет самым «слабым» 4-м местом за все 12 сезонов (фиолетовая точка в левом нижнем углу).
Давайте теперь взглянем более предметно на количество xPTS и их перебор для каждого места из топ-4. Столбец - величина xPTS, красный цвет - перебор, синий - недобор фактических очков (насыщенность - величина, см. цветовой бар справа). Красная пунктирная линия - медианное значение xPTS для каждого места.

В среднем команда-чемпион играет на уровне 82-83 ожидаемых очков в сезоне. Интересно и неожиданно заметить, что «Ливерпуль» прошлого сезона «заслужил» больше очков, чем монструозный «Ливерпуль» Клоппа ковидного сезона. При этом меньше ожидаемых очков среди чемпионов чем «Ливерпуль»-2020, набрал только «Лестер» (вот здесь мы начинаем явно чувствовать, что метрика может давать сбой). Если «Арсенал» сохранит темп набора xPTS (и станет чемпионом), то его результат будет медианным, то есть не лучше и не хуже обычного. Обратим внимание на второе место: в среднем около 75 ожидаемых очков. «Ливерпуль»-2019, «Манчестер Сити»-2020, «Ливерпуль»-2022, «Арсенал»-2024 - уровень медианной чемпионской команды. Очевидно не повезло с соперниками в гонке («Манчестер Сити» и «Ливерпуль»). Третьи места по какой-то причине набирают очки максимально в соответствии с xPTS. Исключение составляют «Манчестер Сити»-2017 (85 xPTS - чемпионский уровень) и «Ньюкасл»-2020. Еще раз напоминаю «Астон Вилла» текущего сезона и 2024 г. - худшее 4-е место (конечно же только по ожидаемым очкам).
Давайте теперь расширим границы нашего обозрения и посмотрим сколько очков в каждом сезоне перебирали (недобирали) команды из условного топ-8. Значение в ячейке - разница points-xPTS, индекс с # - место в сезоне.

Как видим, командой с наибольшим перебором очков в топ-8 является «Манчестер Юнайтед» (в среднем +5.0 сезон). Самой недобирающей - «Челси». В среднем она набирает столько же очков сколько ожидается (-0.2). Стоит отметить, что различия скорее всего являются статистически незначимыми (то есть на фоне разброса значений, различие средних неотличимо от нуля). Однако факт есть факт. Отметим также, результаты сезонов следующие за аномальным перебором (недобором) очков. «Манчестер Юнайтед» в сезоне 2024 набрал на 15 очков больше, чем ожидалось и уже в следующем сезоне недобрал 10 очков. «Ливерпуль»-2019, 2020 +13 и +25 очков соответственно, следующие 6 сезонов - перебор не более чем 5 очков либо недобор (текущий сезон). Самая статистически «правильная» команда - «Манчестер Сити», ни в одном сезоне Сити не набирал более 9 очков сверх ожидаемого.
Кто лучший по xPTS?
Теперь посмотрим на топ-20 команд по xPTS за 12 сезонов. Цвет столбика - место команды в сезоне.

Весьма «неожиданно» первые 8 из 10 мест занимает «Манчестер Сити» Гвардиолы. Команда сезона 2022 - абсолютный лидер со значением 91.9 xPTS. «Манчестер Сити»-2018, набравший рекордные 100 очков за сезон, идёт следом 91.1 xPTS. В том сезоне они действительно не давали шансов противнику практически в каждой игре. В топе отсутствуют чемпионы сезонов 2016 и 2020. Но делать заключение о том, что команда Клоппа не заслужила чемпионство было бы глупо. Команда сезонов 2019 и 2022 в топ-10 результатов по xPTS, однако фактический результат - второе место. Причина всем известна. Третье место сезона 2017 - «Манчестер Сити», 6-е место по xPTS за 12 лет. Чемпион этого же сезона в самом конце списка (но всё же в нём).
С лидерами закончили, выводы либо заметки делайте сами.
Departures ✈️: что там в зоне вылета?
Детальную аналитику для соотношения xPTS vs points команд 17-20 места оставляю для читателя. Приведу графики аналогичные графикам для лидеров чемпионата. Подписи в синей рамке для команд, сохранивших прописку в указанном сезоне.


*Кому-то («Уотфорд»-2020, «Вест Бромвич»-2018, «Фулхем»-2021) очень не повезло

Это, пожалуй, прокомментирую. 5 команд из последних 3-х сезонов входят в топ-6 худших команд по xPTS за 12 лет. Большинство из них прокатились на лифте - сначала вверх (выход в АПЛ), после стремительно вниз. Разрыв между уровнем игры в Чемпионшипе и АПЛ растёт? Только две из 20 худших по xPTS команд АПЛ сохраняли прописку в лиге на следующий сезон. «Ньюкасл»-2020 и «Борнмут»-2023, вам очень повезло!
Занавес! Надеюсь, материал был интересен, по крайней мере частично.











Вообще, xG (и деривативы) в зависимости от хода матча (и по времени матча) довольно забавной метрикой может оказаться. Если угодно, это способ оцифровать "психологию".
Всё просто. Фулхэм пробил 5 раз: четыре раза на 0,06 xG и меньше. Но однажды они создали момент с углового – Джошуа Кинг промазал с пары метров. Этот промах дал Фулхэму 0,74 xG из 0,93 – больше 80 % опасности за матч! Ноттингем ударил 11 раз, а их самый опасный момент оценён на 0,32 xG.
Честно ли давать огромный перевес в xPTS когда нет перевеса хотя бы в 0,5 xG? Для меня такой подход нечестен. Нельзя давать огромную фору в xPTS той команде, которая не добилась огромного перевеса в ожидаемых голах. Разница в 0,11 xG – разница на ничью, с 1 дискретным очком каждой команде, как и получилось в реальности. А 1,51 очко ближе к 3 дискретным очкам, чем к 1. Разница колоссальна.
Без дискретной привязки невозможно выявить реальную разницу между силами команд в таблице. Многие команды будут слишком близки к друг другу, xPTS не будет отражать их разницу в уровне в ситуациях где надо решать моменты.
Второй глобальный минус xPTS: что значит ожидаемые очки в матче команд были получены симуляцией 10000 вариантов одного матча? Они должны быть основаны ТОЛЬКО на сыгранной в реальности игре после её конца. Остальное – нонсенс.
xG считают не на основе симуляций ударов которых не было в реальности, а на основе базы пробитых ударов. Отсюда и вытекает второе отличие в уместности xG от xPTS: вероятности в xG существуют на базе ударов с одних и тех же позиций. Какие-то удары качественные, какие-то отвратительные, какие-то нужны чтобы бы не потерять мяч и не дать сопернику убежать в контратаку. Здесь уместны вероятности.
Представьте что ожидаемые голы по матчу Ноттингем-Фулхэм будут обсчитываться не по всей базе ожидаемых ударов, а по базе ударов только игроков Ноттингема и Фулхэма в прошлом, и ожидаемые голы будущего матча будут высчитываться заранее, на основе этой базы. Математично же!
xPTS себя дискредитирует и отсутствием привязки к дискретным 0,1,3 очкам, и ожиданию очков заранее, а не ожиданию очков по событиям конкретной игры. xPTS работает потому что минусы сказываются на всех, а не на ком-то одном. Но этого недостаточно.