Футбол ооочень зависит от случайностей. Но насколько?
Представьте, вы с подругой бросаете игральный кубик. Первый раунд – поражение. Второй – тоже. Третий… проигрыш.

Какой вывод? У вас плохая тактика? Кубик не того цвета? Вы плохой игрок и вас нужно заменить на нового друга? Означает ли это, что вы проиграете следующий раунд?
Нет, просто в первых трех вам не повезло.
Прочитав заголовок, вы догадались, к чему пример, и, наверное, посчитали его глупым. Потому что футбол гораздо сложнее, чем игра в кости. Потому что на топ-уровень попадают исключительные таланты, которые заслужили карьеру многолетней работой. Потому что на игру влияет миллион факторов: от тактической схемы до того, ест ли форвард говяжьи сердца на обед. Все это даже не обсуждается. Но фактор везения не менее важен, и об этом говорят реже, чем следовало бы.
Что если бы на исходе финала Евро-2024 защитник сборной Англии Марк Гехи пробил на 10 сантиметров правее? Тогда Дани Ольмо не совершил бы сэйв на линии, Англия перевела игру в дополнительное время и, возможно, победила бы в серии пенальти. А уволенный в реальном мире Гарет Саутгейт принес бы стране первый титул европейских чемпионов, получил новый контракт с зарплатой 20 млн фунтов в год и периодически мелькал бы в списке возможных спасителей «МЮ». Как много «бы». 10 сантиметров – и мы в другом мире.

А если бы на 90+2 ответного матча 1/8 финала прошлогодней ЛЧ тот же Дани Ольмо, который тогда играл за «РБ Лейпциг», попал бы не в перекладину, а в ворота «Реала»? Кто взял бы трофей? И кто сейчас тренировал бы Килиана Мбаппе в Мадриде?
Футбол – не только игра сверхталантов, но и случайностей. Мелочи иногда определяют историю. Если бы футбол был предсказуем, как стрелка часов, его давно заменило бы другое зрелище. И обратное: если бы он был полностью случаен, как рулетка, тоже заменило бы.
Можно сказать, футбол случаен в меру. Но какова эта мера, фактор удачи? Этот вопрос однажды задали директору «Брентфорда» Филу Джайлзу.
«Около 80 процентов», – ответил он.
80 процентов? Не слишком ли лихо?
«Брентфорд», как и «Ливерпуль» с «Брайтоном», считается одним из самых рациональных клубов мира. Продвинутые данные и принципы Moneyball – основа их философии. Никаких эмоций, только взвешенные и подтвержденные статистикой решения. Не секрет, что в основе аналитических моделей этих клубов (и многих других) – ожидаемые голы, полезнейшая метрика с очень плохим названием.
Давайте кратко вспомним их суть. xG пришли, чтобы заменить статистику ударов. Ведь удар может быть как опасным, так и не очень. Модели xG, обработав десятки тысяч попыток, объясняют, насколько опасна конкретная – учитывая точку, игровую ситуацию и другие факторы. После матча можно суммировать ценность всех ударов и осторожно сравнить полувшееся число с реальным счетом. Осторожно, потому что всегда важен контекст: как именно набралась сумма xG, при каком счете, в каких ситуациях. Как правило, ожидаемые голы лучше передают суть матча, чем результат. Мы понимаем, насколько остро атаковала команда и заслужила ли она победу/поражение.
Оптика xG применима и к сезонам – нужно лишь перевести ожидаемые голы в очки. Но усложнив подход: за победу 1,5-1,4 по xG дается не 3 очка, а с поправкой на разницу.
Аналогичную модель использовал аналитик «Ливерпуля» Иан Грэм, когда оценивал Юргена Клоппа перед приглашением в Британию. Если помните, сезон-2014/15 получился неудачным для «Дортмунда» – лишь седьмое место в Бундеслиге и ранний вылет из Лиги чемпионов. Но Грэм через ожидаемые очки разглядел, что «Боруссия» была так же хороша, как и раньше с Клоппом. Просто мяч по каким-то причинам не пересекал линию ворот. И да, Грэм понял это, не посмотрев ни одного матча.

Благодаря ожидаемым очкам Грэм Поттер остался в «Брайтоне» в сезоне-2020/21, когда финишировал перед зоной вылета с 41 очком. Владелец Тони Блум понимал, что дело в невезении. «Брайтон» набрал больше 60 ожидаемых очков и должен был финишировать пятым. Поттер остался и на следующий сезон прорвался в топ-10. Футболом «Брайтона» восхитился весь мир, и вскоре тренера с компенсацией утащил «Челси». А ведь многие владельцы уволили бы Поттера после первых неудач, изобразив видимость контроля над ситуацией. Но Блум был достаточно умен, чтобы признать, что какие-то вещи контролировать невозможно.
Есть и обратный пример. В сезоне-2014/15 «Брентфорд» с 21-й зарплатной ведомостью (из 24 команд) в Чемпионшипе боролся за выход в АПЛ вместе с тренером Марком Уорбертоном, который вывел команду из первой лиги. Футболисты, болельщики и журналисты его обожали. К Рождеству «Брентфорд» шел третьим в чемпионате, а это зона плей-офф с большими шансами на повышение. Но математическая модель владельца Мэтью Бенхэма (как и Блум, пришел в футбол из беттинг-индустрии, знает толк в числах и формулах) показывала: команда не наиграла на третье место, по ожидаемым очкам она лишь одиннадцатая, во второй части сезона ожидается регрессия к среднему. В феврале Уорбертона уволили – не только из-за ожидаемых очков. В том числе и потому что он был тренером классической школы, а Бенхэму нужен был тот, кого не передергивает от слова xG. В 2021-й «Брентфорд» наконец-то добрался до АПЛ и стал еще одной сенсацией лиги.
В этом сезоне «Брентфорд» снова перебирает – 11-й по реальным очкам и только 14-й по ожидаемым. Но Томас Франк, кажется, в безопасности – именно такого открытого к новому миру тренера и искал Бенхэм.

«Брентфорд» – конечно, не главный оверперфоманс сезона.
«Ноттингем Форест» благодаря невиданной реализации форварда Криса Вуда набрал на 11 очков больше ожидаемого и запрыгнул на третье место, на которое наиграла другая сенсация сезона… «Борнмут».
Если вы включали матчи команды Андони Ираолы, то, наверное, знаете, как она хороша. Агрессивный прессинг и контрпрессинг (вторые по успешному давлению, первые по высоким отборам с последующим ударом), полное отсутствие страха и не совсем заслуженное седьмое место. Таблица ожидаемых очков указывает на такие отклонения и воздает должное тем, кому не везет.
И еще сигнализирует, что положение «Ман Сити» в АПЛ могло быть еще хуже…
Интересно, что в Лиге чемпионов у команды Пепа обратная роль… Почти 13 ожидаемых очков и всего 8 реальных. Удивительный недобор, который может стоить «Ман Сити» плей-офф.

В случае раннего вылета топ-клуба из ЛЧ кто-нибудь обязательно скажет о провале Пепа и необходимости перемен. Богатейший клуб мира не попал в топ-24 Лиги чемпионов, оказавшись ниже «Брюгге», «Селтика» и «Бреста» – что может быть хуже. Разговоры, что «Сити» просто не повезло, назовут оправданием слабаков. Так устроен футбол, здесь не любят говорить о том, на что повлиять невозможно.
Но если «Сити» вылетит, это и правда будет большим невезением. Ожидаемые очки это подтверждают. А еще подводят вас к вопросу…
А почему я вообще должен доверять ожидаемым очкам? Кто доказал, что они не врут?
В конце 19 века британский ученый Фрэнсис Гальтон сравнил рост сотен родителей с ростом их детей и выяснил удивительное: если рост родителей выше среднего, то ребенок, как правило, ниже и на некоторую величину ближе к среднему росту. Если родители ниже среднего, то наоборот: ребенок выше и тоже на некоторую величину ближе к среднему росту. С тех пор в статистике распространилось понятие регрессия к среднему.
Если предположить, что ожидаемые очки врут и показывают случайные числа, значит на дистанции никакой регрессии не будет, реальные и «выдуманные» очки должны жить параллельно. Это легко проверить.
Возьмем данные АПЛ за 7 лет и посмотрим: что происходило с командами на следующий сезон после оверперформа (или недобора) по очкам. Итак…

Вывод: чем больше перебор по очкам, тем ниже вероятность, что в следующем сезоне команда сохранит такую разницу. Чем больше недобор, тем выше вероятность, что в следующем сезоне команда сократит пропасть между реальными очками и ожидаемыми.
Например, «Ливерпуль» в сезоне-2019/20 набрал почти на 29 очков больше, чем показывала модель xG. В следующем сезоне откатился – всего 1 очко выше ожидаемого. Регрессия к среднему.
Тот же «Брайтон» в сезоне-2020/21 недобрал 20 очков. В следующем сезоне недобрал всего 3 очка. Регрессия к среднему.
Это лишь ярчайшие примеры, есть и сотня других, подтверждающих закономерность.
Но нельзя игнорировать и другую особенность: чемпионы часто оверперформят, а аутсайдеры недобирают. Как и в случае с xG, причины в уровне реализации: сильные лучше используют моменты, чем слабые. Но на большой дистанции разница теряется. Например, коэффициент корреляции между ожидаемыми очками и реальными в рамках сезона колеблется от 0,85 до 0,95, что означает высокую зависимость. А на дистанции пяти сезонов и более он достигает 0,99, что означает очень высокую зависимость. То есть реальные очки стремятся к ожидаемым (именно так, не наоборот), что иногда незаметно в отдельном матче, но всегда заметно на больших отрезках.
Вообще, сезон – не такая большая дистанция, на которой может случиться всякое. Стандартная разница между реальными очками и ожидаемыми в рамках одного розыгрыша АПЛ – 8 очков. Это значит, что среднестатистическая команда может финишировать в диапазоне от еврокубковой зоны до десятого места.
Но вспомнит ли об этом владелец клуба, который поставил задачу выйти в ЛЧ и не достиг желаемого? А ведь бывают еще и аномалии. Как у «Ливерпуля», «Брайтона» или, например, «Ман Сити» в главном еврокубке.

Турнир из 8 матчей, как нынешний основной этап ЛЧ – вообще спринт. Стандартное отклонение после 7 туров составляет 3,5 очка (расстояние от 8-го места до 25-го), а чемпион Англии недобрал 5, что вообще катастрофично.
Возможный вылет из Лиги чемпионов назовут величайшим провалом «Ман Сити» эпохи шейхов, а параллельные неудачи в Премьер-лиге станут лишним доказательством кризиса. А как еще, ведь мы говорим о клубе с третьей зарплатной ведомостью в Европе (больше только у «Реала» и «Баварии»).
Но еще это будет ярчайшим примером, как сильно случай влияет на футбол. И на результат, и на наше мировосприятие.
Оценка «80 процентов» от директора «Брентфорда», возможно, уже не кажется перебором.
А что если… трансферы переоценены?
Фото: Spada/Keystone Press Agency, Federico Gambarini/dpa, IMAGO/Mark Cosgrove/News Images/Global Look Press
Сперва сложилось впечатление, что будет предложен модуль оценки вероятностей в футболе с целью анализа влияния такого фактора, как "везение".
Автор же проанализировал такой модуль, как xPoints - ожидаемые очки. Это чистая статистика с поправкой на субъективную оценку - количество ударов, признанных автором модуляции опасными, с долей вероятности оценивают возможность забить гол, и разницу совокупностей с обеих сторон (обеих команд) равняют друг с другом. В чью сторону корреляция, тот и должен был победить. Система необычна тем, что у каждого статистического портала своя градация подсчета xG. Да и в принципе споры про необходимость вообще обращать внимание на xG не затихают по сей день.
Спасибо автору за материал, но чуток расстроен - подумалось, что получится глубинная аналитика вероятностей, а не очередной вывод по xG/xPoints...
Это оценка свершившихся ударов за определенный период в пропорции забитых из текущих позиций на общее количество из текущих позиций.
Но насколько применим подобный аспект в оценке игры в целом с точки зрения влияния вероятности на итоговый результат - вопрос очень дискуссионный.
Очень многое решается на основе тренерского подхода. Много добавляют стандарты (невозможно предсказать возникновение пенальти, и их оценка не может рассчитываться наравне с обычными ударами, поскольку футболист бьет в статике без помех с определенного расстояния). Но голы с пенальти идут в оценку наравне с обычными голами.
Очень многое решается на основе факторов погоды, времени года, наличия домашних болельщиков, травм - к голому xG должен применятся усложняющий коэффициент, чтобы было понимание того, как сильно на результат может повлиять и что-то извне.
Но xPoints плох тем, что эта система чересчур упрощена.
Удары и их опасность в совокупности. Все. Но как же вероятность автогола? Вероятность того, что ветер собьет траекторию полета мяча? Вероятность того, что судья отменит чистый гол или наоборот - позволит засчитать гол, забитый с нарушением правил?
И таких вероятностей, которые напрямую повлияют на исход матча, довольно много. чтобы не учитывать их все, требуется смоделировать тот самый коэффициент, который будет применяться к нашей сводной статистике как правило. Но чтобы его смодулировать, придется учесть буквально все, что может повлиять на результат. А голый xPoints вообще не должен всерьез рассматриваться болельщиками - это наименее показательная величина в контексте набора очков.
Наверное, это был первый случай, когда успешность геологоразведки объясняли через xG.
Но зашло хорошо:)
Идеи о том, что мы можем контролировать, а что нет — универсальны и должны быть поняты каждым.
А так, конечно, любой тренер скажет, что статистика в отрыве от матча ничего не даёт для анализа. Помню, здесь была статья с интервью у клубного аналитика, который прямо говорил, что спортивный анализ журналистов в общем-то бесполезен. В том числе и потому, что различные расширенные метрики нужно уметь правильно применять и интерпретировать. Вот как раз в этом материале этого не наблюдается, и это сразу бросается в глаза.
И вообще: как можно говорить о везении (глобально), не говоря о травмах? В итоге получается, что Сити ожидаемо типа +- на своем месте в АПЛ, хотя не сломайся Родри, все однозначно было бы иначе.
Причина расцвета культуры xG и подобных показателей связана с появлением среди владельцев клубов людей, с футболом не связанных, не умеющих отличить на поле игрока великого от посредственного, да и просто не знающих правила футбола. Таким людям нужно что - то знакомое, вроде биржевых котировок, чтобы просто понимать как идут дела у приобретенного ими бизнеса.
Вслед за такими владельцами в футбол потянулись "аналитики", которые, грубо говоря считают сколько раз за матч мяч отскочит от газона и получают за это зарплату.
Но как биржевые котировки далеко не всегда отражают истинное положение дел в бизнесе, так и математические модели могут как приносить пользу, так и искажать реальную картину того что происходит в клубе.
Не нужны математические модели для понимания того, что в нынешнем сезоне Ноттингем прыгнул выше головы. Команда, с Крисом Вудом в нападении, вряд ли дотянет до ЛЧ по итогам сезона. Чтобы видеть кризис в МанСити тоже математика не нужна: его причины ясны абсолютно всем, кто следит за АПЛ.
С другой стороны, к примеру, назначение Поттера в Челси после увольнения Тухеля сразу выглядело сомнительно, но показатели xG маскировали очевидный провал, и владельцы долго тянули с увольнением. Тот же Тен Хаг оправдывал то, в какую катастрофу погрузился при нем МЮ той же "приемлемой статистикой".
В "продвинутой статистике" нет ничего плохого. Это просто инструмент. Его надо уметь использовать. И основная проблема в том, что умеют корректно использовать этот инструмент и делать правильные выводы далеко не все владельцы и менеджеры клубов.
Марк Гехи мог пробить на 10 см в другую сторону и это принесло бы ничью, если бы Испания не забила ещё раз? Скучно. Джуд Беллингем мог пробить на 10 см в другую сторону и гарантировать Англии ранний вылет с турнира.
Противостояние "Лейпцига" и "Реал Мадрида" в 1/8? Ха-ха. Что, если бы Салах в финале ЛЧ чуть резче исполнил бы один из 9 ударов в створ ворот Куртуа?
Что, если бы "Брайтон" назначил за Грэма Поттера компенсацию раза в 2 выше. Решились бы "Челси" на переход или оставили бы Тухеля?
Мы никогда не узнаем.