Дома хорошо, а в гостях лучше
Накануне Нового Года, пока проходят игры в Англии и Италии, остро ощущается нехватка Российской Премьер-Лиги, этого особенного ребенка русского футбольного зрителя. Однако сотрудники научно-учебной лаборатории исследований спорта НИУ ВШЭ Артем Гехт и Егор Зайцев решили скрасить ожидание нашего чемпионата исследованием на тему «ложных» домашних стадионов. А что, ложные девятки есть, ложные фулбэки тоже, так что почему бы и нет? Поясняем, в чем дело.
Вопрос этого мини-исследования заключается в следующем: есть ли на самом деле преимущество игры дома, если команды играют на одном и том же стадионе (как те же «Интер» и «Милан»), и как оно отличается – если вообще отличается – от выгоды домашнего поля с другими соперниками? Играть дома лучше, как принято считать, по нескольким причинам. Основные – эмоциональное и психологическое преимущество домашней команды из-за своих фанатов, преодолеваемое гостями расстояние, удобство своего поля (размеры, высота газона, etc.), статус домашней команды и соответствующие ожидания. Подобная работа позволяет избавиться от большинства факторов, оставив лишь номинальное звание хозяев.
Проблема не нова: год назад Андреа Пуополо уже провел исследование для итальянских команд и пришел к выводу, что в Серии А это преимущество очень незначительно (подробнее на английском – тут) относительно «несоседских» команд. Но что происходит в РФПЛ? Вдруг результаты окажутся другими?
Итак, были использованы данные по всем сезонам РФПЛ, начиная с 2002-го года. Мы сохраним метод автора: сначала необходимо найти все случаи, когда команды в сезоне играли на одном и том же стадионе (их оказалось 33), затем для каждой команды из пары (66 – вдвое больше количества пар, все логично) вычислить, на сколько больше очков получает команда дома, чем в гостях, так называемую proxy statistic – количество очков в «домашней» встрече минус количество очков «в гостях». Это не так сложно, как кажется: например, «Спартак» в 2006 году на «Лужниках» одолел «Торпедо» со счетом 3:1, будучи номинальным хозяином поля, а «в гостях» сыграл вничью 1:1 – тогда для «Спартака» proxy будет равен 3 (победа дома) минус 1 (гостевая ничья) равно 2 (соответственно, 1 для «Торпедо» того сезона). Если одна из команд выигрывает оба матча (ЦСКА-2015/16 против «Динамо» – 1:0 дома и 2:0 в гостях), то каждая получит показатель 0. Таблица – здесь (для каждой команды вне зависимости от домашнего или гостевого статуса сначала пишутся забитые голы, а потом пропущенные).
Теперь, чтобы сравнить выгоду фактора домашнего поля для «заклятых соседей» и остальных, нам нужно найти примерное распределение proxy со случайной, другой командой с большой выборкой – иначе говоря, бутстрапом получить нужное распределение:
Для каждой из 66 команд случайно выбрать соперника из того же сезона, при этом не соседа по стадиону;
Вычислить для каждого выбранного proxy statistic;
Найти среднее всех полученных proxy;
Повторить процедуру 10000 раз (для состоятельности выборки).
Результаты нас, мягко говоря, шокировали. После 10000 измерений был построен график распределения результатов выборки. Красной линией выделен реальный результат (среднее значение чисел в последнем столбике вышеприведенной таблички оказалось равно -0.59), синей – минимальный из полученных бутстрапом. Проще говоря, команды в «домашних» матчах на общем стадионе набирают в среднем на 0.59 очка меньше, чем в «гостевых». Среднее значение получилось 0.46 – это можно назвать «средним преимуществом» обычной домашней команды. Дисперсия получилась равна 0.19, а график напоминает нормальное распределение, что говорит нам о достаточном количестве объектов в нашей выборке. Но самое интересное вот что: всего в 82 случаях из 10000 (меньше 0.1%) значение лежит левее нуля. Среди тех 10000 усредненных показателей proxy было лишь одно значение меньше -0.25, а наше значение – -0.59 – вообще оказалось левее всех значений, полученных бутстрапом. Думаем, можно без статистических тестов сделать вывод о том, что эффект «домашнего поля» в ситуации с общим стадионом полностью исчезает с вероятностью выше 99%, так как p-value оказался ниже 1%.Далее мы решили проверить – может быть, эффект вообще противоположен? Вдруг номинальное домашнее поле в России, наоборот, играет на руку «гостям», как получилось у нас?
Полученный p-value = 0.004 (меньше, чем 0.05) говорит о том, что фактор «ложного» домашнего поля играет на руку номинальным гостям. Иными словами, когда в России две команды делят стадион и играют на нем друг с другом дважды за чемпионат, то преимущество стадиона будет не за хозяевами, а за гостями. Вот такой парадоксальный у нас чемпионат!Однако в нашем исследовании и работе Андреа Пуополо есть различия. У него в выборке присутствуют настоящие соседи по стадиону (то есть почти нет временных): «Милан» и «Интер», «Рома» и «Лацио», «Дженоа» и «Сампдория», веронские «Кьево» и «Эллас» – все они уже давно делят стадион, и только «Ювентус» и «Торино» (4 года во время реконструкции «Стадио Делле Альпи») примерно подходят под наши реалии, где ЦСКА мотался по разным частям Москвы в поисках временного дома.Более того, в нашем наборе есть перенесенные на домашний стадион номинальных гостей (!) матчи вкупе с плохими погодными условиями. Если убрать все случаи переносов матча, то показатель будет еще поразительнее: средний proxy окажется равным -0.7, так что эффект их присутствия только смягчает полученный результат. Смягчаться еще больше из-за переносов, кстати, он больше не будет – с этого сезона проведение командами домашних матчей на стадионе соперника запрещен. Произошло это после инцидента с загибающимся уже «Амкаром», которому не хватало денег даже на смену плохого газона, и «Локомотив» предложил 20 млн рублей в обмен на перенос игры на «РЖД Арену».
Пермский клуб в итоге и выиграл, и получил деньги, но резонанс подействовал на РФС – в руководстве наконец увидели, что клубы уже не арендуют стадионы друг у друга.Конечно, к исследованию есть еще пара замечаний, которые потенциально можно рассмотреть подробнее: к примеру, средний уровень команд из выборки высок относительно всего чемпионата – в основном там московские команды, которые часто в топе, а это значит, что разница в силе команд меньше. Или же влияние отдельных клубов на итоговый результат и их личные показатели. Если читателям будет интересно, то можете ждать в будущем проверки в виде коротенького дополнения-исследования на эти темы. Пишите свои догадки, почему результат получился таким удивительным и что ещё можно изучить!
Работали над исследованием Артем Гехт и Егор Зайцев.
Подписывайтесь на блог нашей лаборатории и с Новым Годом!