Чемпионат без невероятных сенсаций

Уже вовсю идут разговоры, что этот чемпионат мира стал самым непредсказуемым. Не знаю, аккуратного сравнения с предыдущими ЧМ не видел. Но сверка с реальными цифрами показывает, что непредсказуемость этого чемпионата преувеличена. А местами он наоборот до невозможности предсказуем.
Это вообще типичное заблуждение: людям свойственно фокусироваться на самом вероятном сценарии, и любые отступления от этого сценария они воспринимают как сюрприз. Но ведь когда речь идет о цепочке, состоящей из множества событий с неопределенным исходом (а футбольный турнир – именно такая цепочка), вероятность реализации любого конкретного сценария в разы, а то и на порядки меньше суммарной вероятности реализации других сценариев (каждый из которых при этом является куда менее вероятным).
Простой пример. Допустим, есть команда-фаворит, которая играет 4 матча с более слабыми командами. Вероятность победы фаворита в каждом матче – 70% (70% против 30% - это кейс с явным фаворитом; это больше, чем скажем вероятность победы англичан над шведами). Просто перемножение дает оценку шанов на то, что фаворит выиграет все 4 матча, в скромные 25% (даже чуть меньше). То есть 4 подряд «ожидаемые» победы фаворита менее вероятны, чем победа «андердога» в отдельно взятом матче.

Ну хватит теории. Возьмем для примера прогноз FiveThirtyEight (projects.fivethirtyeight.com/2018-world-cup-predictions/, внизу страницы есть переключатель на “Forecast from before tournament», т.е. на прогноз, сделанный до турнира). Прогноз основан на статистической модели, учитывающей предыдущие результаты команд в последние годы, уровень клубов, в которых играют игроки сборной, и преимущество «родных стен» у российской сборной и, в куда меньшей степени, у остальных европейцев. Я беру эту модель не потому, что она чем-то лучше других, а просто для примера – ну и потому, что в ней все прогнозы удобно выражены в процентах вероятности, а не в коэффициентах ставок, как у букмекеров. Если взять для оценки «непредсказуемости» какой-то другой источник, то конкретные цифры будут другие, а общие выводы – примерно те же (если кто-нибудь поделится табличкой предтурнирных ставок букмекеров на прохождение команд, скажу спасибо).
Так вот, если внимательно посмотреть для примера на прогноз Fivethirtyeight (и чуть-чуть досчитать цифры на его основе), то окажется, что ничего особо невероятного на нынешнем чемпионате не происходит. Пойдем по порядку:
1. Вероятность невыхода Германии из группы до старта чемпионата оценивалась в 10%. Немного – но это грубо говоря означает, что раз в 40 лет немцы не должны выходить из группы. А они кажется до сих всегда из группы выходили. То есть по сути аномалия – не в том, что Германия не вышла из группы сейчас, а в том, что она все время выходила раньше. Более того, по предтурнирному прогнозу Fivethirtyeight невыход Германии из группы (10%) – примерно столь же вероятное событие, как победа Германии на чемпионате (13%) или ее поражение в финале (9%). Однако первое все восприняли как сенсацию, а два других исхода никого особо не удивили бы.

2. Невыход Германии воспринимается как суперсенсация, потому что до начала чемпионата она считалась наименее вероятным неудачником групповой стадии. Даже для Бразилии вероятность невыхода оценивалась чуть выше – 11%. Но при этом шансы на то, что из группы выйдут все шесть супердержав (Англия, Аргентина, Бразилия, Германия, Испания, Франция), оценивались всего в 39% - т.е. с вероятностью более 60% хотя бы кто-то один из шестерки должен был вылететь (и кстати с вероятностью 21% таких неудачников должно было быть несколько, а не один). Что вылетела именно Германия – лишь чуть менее вероятный вариант реализации ожидаемого, чем вылет например Бразилии или Испании.
3. Если же рассматривать результаты группового турнира (не в смысле исходов конкретных матчей, а состава участников плей-офф) в целом, то они оказываются наоборот невероятно предсказуемыми. Можно отсортировать все 32 команды по предтурнирной оценке от Fivethirtyeight вероятности выхода из группы. И окажется, что из 16 наиболее вероятных участников плей-офф туда вышли 14! Два исключения – это Германия, о которой уже много сказано выше, и Польша (скромное 14-е место в этом рейтинге, вероятность выхода 55%). Их места заняли следующие две команды в списке (т.е. 17-я и 18-я) – Мексика (46%) и Япония (43%). В отличие от прошлых чемпионатов, в плей-офф не оказалось ни одного по-настоящему неожиданного участника. Вероятность того, что в топ-16 попадут только ожидаемые участники (входившие в число 18 команд с наибольшими шансами на выход из плей-офф) составляет всего 1.6% (на самом деле даже меньше, поскольку например в сценарии невыхода из группы Марокко растет вероятность выхода из группы их прямого конкурента, Ирана). Подобное должно случаться примерно раз в 250 лет. Но случилось именно сейчас. Вот кажется самая большая неожиданность чемпионата – отсутствие неожиданных участников плей-офф.
4. Теперь про 1/8 финала. На этой стадии выбыла Испания (не только Испания, но они – самый неожиданный неудачник этой стадии). До начала чемпионата вероятность выхода Испании в четвертьфинал оценивалась в 71%, а вероятность невыхода – соответственно в 29%. Сработала вторая «ставка» – менее ожидаемый, но вполне вероятный исход. Более того, вероятность выхода в четвертьфинал обоих фаворитов турнира – и Испании, и Бразилии – по предтурнирному прогнозу составляла всего 47%, меньше половины. То есть вылет на этой стадии как минимум одной из двух эти команд – более вероятный сюжет, чем проход дальше и Испании, и Бразилии.

5. Ну а победа России над Испанией (правильней сказать – прохождение дальше России, а не Испании) – это неожиданность? Формально да. В прогнозе перед началом плей-офф Fivethirtyeight давал России вероятность прохождения в следующий круг только 22% (меньше было только у мексиканцев против Бразилии – 17%; впрочем шансы России тут наверное были занижены просто в силу особенностей методики Fivethirtyeight – которая почти не учитывает то, что Россия в двух из трех матчей группового этапа играла лучше ожиданий, а Испания – хуже ожиданий). Однако смотрите: из 8 пар в пяти случаях был фаворит с вероятностью прохождения дальше 60% и больше (Бразилия, Испания, Бельгия, Хорватия, Англия). Вероятность, что прошли бы все пятеро, составляет всего лишь 19% - против 38% для сценария, что прошли бы 4 команды из 5 (как и случилось) и 43% для сценария, что вылетели бы на этой стадии несколько (две и более) команд из этой пятерки. Так что каких-то неожиданностей на этой стадии следовало ожидать, и что эта неожиданность случилась именно в матче испанцев, можно считать просто «лотереей».
6. Поехали дальше. В восьмерке четвертьфиналистов самые неожиданные участники – Россия (предтурнирная оценка вероятности – 26%) и Швеция (17%). По предматчевым раскладам получались шансы на уровне 3 из 4 (76%) на то, что в четвертьфинале окажется кто-то более неожиданный, чем шведы. Но не случилось.
7. Если взять восьмерку фаворитов (кроме вышеперечисленных 6 «супердержав», это еще Бельгия и Португалия), то судя по предтурнирному прогнозу Fivethirtyeight, из 8 команд в четвертьфинал должны были пройти 4.6 «землекопа». Прошло 4. Да, фавориты выступили чуть хуже прогноза – но лишь совсем чуть-чуть. Можно сказать, что не смогли выступить лучше прогноза.

8. В четвертьфинале вылетел главный фаворит – бразильцы. Да, в конкретном матче Бразилия-Бельгия победа первых считалась более вероятным исходом. Но если брать турнир в целом, то изначально вероятность попадания бразильцев в полуфинал оценивалась в 46%. А непопадания – в 54%. Реализовался более вероятный сценарий J
9. Ок, можно сфокусироваться на том, что в полуфиналы не прошел никто из тройки главных фаворитов (Бразилия, Испания, Германия). Это действительно не самый ожидаемый вариант – но предтурнирная оценка его вероятности составляет 17% (и ~14%, если сделать корректировку на то, что главной угрозой на пути Бразилии и Германии к полуфиналу считалась возможность их очной встречи на пути к 1/8 финала). Примерно как шансы кинуть кубик и получить 6 очков.
10. А вот посмотрим с другой стороны. За 5 чемпионатов с 1986 по 2002 год список стран, когда-либо игравших в полуфиналах, пополнился 5 командами (Бельгия, Болгария, Хорватия, Турция и Южная Корея). А за следующие три чемпионата (2006-2014) – ни одного новичка. Но там хотя бы были команды, которые останавливались в шаге от попадания в этот список, т.е. от выхода в полуфинал: Украина, Парагвай, Коста-Рика. На чемпионате же 2018 года даже в восьмерке четвертьфиналистов исключительно те сборные, в истории которых уже есть попадания в четверку лучших (ну если конечно сборную России считать наследницей сборной СССР). То есть титул разыгрывают команды все из того же круга претендентов, что и раньше.

Резюме: если отталкиваться от предтурнирных оценок, то фавориты выступили конечно слабенько – но это «слабенько» лежит вполне в диапазоне вероятных сценариев. А вот наименее вероятная часть сюжета, по крайней мере по состоянию на утро второго дня четвертьфиналов, – это отсутствие в плей-офф по настоящему неожиданных участников.
P.S. Все вышесказанное не означает, что чемпионат неинтересный. Он по сюжету очень даже интересен.
Автор: Борис Овчинников
Автору большое спасибо