Футболономика в России. Что такое российский футбол в понимании Стефана Шимански
В своем блоге «Критика спортивного разума» я затеял цикл заметок, посвященный современному российскому футболу. Точнее, этот цикл – попытка применить некоторые научные модели для понимания процессов, происходящих в РФПЛ. К моей вящей радости, Тимофей Загорский предложил поделиться моими изысканиями с аудиторией блога «Привет из России».
Первый пост задает как общую картинку современного российского футбола, так и горизонт ожидания для читателей. В фокусе внимания – дюжина сезонов российской Премьер-лиги с сезона 2004 г. по сезон 2015–2016 гг. Объяснительная модель – модель британского экономиста и теоретика спорта Cтефана Шимански (см. тут). Концептуализируем ее так: в среднесрочной и долгосрочной перспективах заработная плата объясняет около 90% вариации положения клуба в лиге. Если совсем упростить, можно понять это так: за 20 лет существования футбольной лиги 18 раз ее выиграет тот клуб, который тратит больше других на зарплату игрокам (для тех, кого это упрощение возмутило, см. Проблема №1 ниже).
Здесь необходимо сделать две оговорки (не сделать их было бы несправедливо к читателям). Одна часть касается нескольких, на мой взгляд, серьезных недостатков модели. Вторая – происхождения и обоснования моих данных. Я выделяю эти пункты звездочками (***), и если вас не интересуют методологические пояснения, то можете смело пропустить эту часть и смотреть графики и таблички (enjoy!).
***
Проблема №1: Статистика против реальности. Выше, для привлечения внимания, было сказано, что за 20 сезонов 18 раз лигу выиграет тот клуб, который тратит на зарплату больше всех. Само собой, это не так. В лучшем случае – за 20 сезонов клуб с наибольшей зарплатной ведомостью выиграет 10 раз. Остальные 10 раз выиграют клубы, скажем, со 2-й, 3-й или 4-й зарплатными ведомостями (или, если хотите, 9 раз, а на 10-й выиграет «Лестер»). Все дело в том, что зарплатные ведомости 1-й, 2-й, 3-й и 4-й команд могут разниться совсем немного. Потому, когда выигрывает 2-я, 3-я или 4-я команда, закономерность все равно будет подтверждаться, хотя и не 1-я команда окажется чемпионом. Это говорит о том, что к любому статистическому исследованию стоит относиться с осторожностью.
Проблема №2: Математика против спорта. Речь идет о том, что в этой модели результат команды (итоговое место) – это просто число. Потому команда может занимать за 10 сезонов, в среднем, место равное 1,7, или место равное 4,2. Раз место – это просто число, то разница между 1-м и 2-м местом такая же, как между, скажем, 4 и 5, т.е. единица. Но в спорте действует принцип «все или ничего». И в этом смысле разница между 1 и 2 местом огромная – ты либо чемпион, либо нет. Кроме того, разница между 2 и 3 местом, скажем, в РФПЛ, тоже огромная. Потому что 2 место – это шанс на Лигу чемпионов, а 3 место – это Лига Европы. Стоит ли говорить, какая большая разница между 5 и 6 местами (это разница в евротурнир), 7 и 8 местами (эта разница всем до лампочки) и 14 и 15 местами (это шанс на сохранение места в лиге)? В общем, к любому статистическому исследованию стоит относиться взвешенно.
*За четкое понимание этих двух проблем я благодарен комментариям Виктора Смита
Проблема №3: Космос против статистики. Это самая большая методологическая проблема данной модели (по крайней мере, как смог ее эксплицировать я). Зарплата игроков складывается из окладов и бонусов. Бонусы зависимы от итогового места в команде. Следовательно, зарплата (независимая переменная нашей модели) зависит от места (зависимая переменная нашей модели). Это т.н. эндогенность модели, т.е. наша независимая переменная зависима от чего это еще, что мы бы должны объяснить, но не объясняем. Это проблема, которую я не представляю как можно здесь исключить. Но как мне объяснили, эта проблема возникает почти всегда: мы живем в мире (или, как сказали бы мудрые эллины, в космосе), где все, так или иначе, зависит от всего. Иными словами, все связано. Потому, хотя скепсис это нормальная реакция почти на любое статистическое исследование, мы все же можем сделать значимые для нас выводы и увидеть, как применимо исследование.
***
Теперь о данных. Данные взяты мной из серии спортивных симуляторов Football Manager. Я не буду расхваливать этот блестящий симулятор (кто знает, тот поймет), но назову три причины, по которым, мне кажется, мы можем считать эти данные релевантными.
Во-первых, никаких других данных за этот период получить невозможно. Наш футбол, во многих смыслах, герметичен. Не является исключением и финансовые показатели клубов. Потому, если мы хотим понять наш футбол (в надежде изменить его к лучшему), мы должны быть готовы ориентироваться на любые систематические данные, какие можем получить.
Во-вторых, в самой футбольной сфере, данные симулятора котируются высоко. Ряд профессиональных клубов имеет партнерские отношения с FM (например, «Эвертон», «Уотфорд» или «Удинезе»), т.е. платят разработчикам большие деньги, дабы получить используемые данные раньше ежегодного релиза. Это говорит о том, что в профессиональной среде данные считаются релевантными. Конечно, «феномен Цыгалко» это не отменяет. Но если мы хотим понять наш футбол (в надежде изменить его к лучшему), мы должны быть готовы ориентироваться на любые систематические данные, какие можем получить.
В-третьих, скуднейшие официальные данные клубов РФПЛ, которыми мы обладаем, в целом, соответствуют данным FM. Я смог проверить по «Зениту» в 2014 году (данные УЕФА) и по «Кубани» в 2013, 2014 и 2015 финансовых годах (данные «ФК Кубань»). Данные сравнительно сходятся, хотя я был удивлен, что наши клубы по данным УЕФА тратят больше, чем это предполагают разработчики симулятора.
Я думаю, что эти три аргумента, вкупе, позволяют относиться к дальнейшему анализу со всей серьезностью.
***
Теперь будут картинки, теперь будет веселее.
Итак, первая табличка – среднее место клубов по зп, среднее итоговое место.
Таблица 1. Среднее итоговое место, среднее место клубов по зп
Далее – график. На графике ось x – это среднее место по игроцкой зарплатной ведомости, ось y – это средняя позиция в лиге. Коэффициент детерминации (R2) равен 0, 85, что, во-первых, хорошо для модели (это значит, что зарплаты, т.е. независимая переменная, аж на 85% объясняет вариацию позиции в лиге, т.е. независимую переменную), во-вторых, это хорошо для нашего футбола (это значит, что результат дает качество игроков, а не подковёрные игры). Грубо говоря, команды, оказавшиеся по левую сторону от линии усредненного значения – это «отстающие» (underachievers), т.е. чем дальше влево от линии, тем большие эти команды неудачники. У них либо плохое управление (т.е. так себе игрокам систематически переплачивают), либо плохой подбор тренеров (т.е. норм игроки не показывают по каким-то причинам свой уровень). Соответственно, команды, оказавшиеся по правую сторону от линии – это «преуспевающие» (overachievers), т.е. чем дальше вправо, тем круче команда использует свои ресурсы. Либо управленческие (ищут игроков, которые недооценены, а значит не раздувают запросы по зп), либо тренерские (тренеры выжимают из игроков больше их максимума).
График 1. среднее место клубов по зп, среднее итоговое место
В целом, думаю, ничего удивительного для любителей российского футбола. «Зенит» и ЦСКА в лидерах последних лет, хотя фанаты «Зенита» должны быть чуть более несчастны и требовательны к своей команде, а фанаты ЦСКА – очень довольны выступлениями команды. Болельщики «Спартака», если они реалисты, должны быть довольны, потому что команда играет даже лучше, чем должна бы была. Хотя славное прошлое наверняка делает их слегка несчастными идеалистами (верим в Валеру, Диму, Карреру). «Краснодар» явно делает все с умом и идет с опережением графика. Наверное, удивит почивший ФК «Москва» (хотя, если вспомнить, что Слуцкого уволили за 4 место, то может и нет), потому что этот клуб умел «делать» футбол. И совсем не удивит «Ротор», «Сибирь» и «Арсенал» – единожды замеченные за 12 лет, им и рассчитывать с такими бюджетами на зарплату игрокам было не на что.
Все, что показывают эта табличка и график интересно (оставляю простор для интерпретации). Но такой подход убог: разница между 1й и 2й командами в рейтинге зарплат может быть больше, чем сумма всех разниц оставшихся команд. Т.е. если 1я команда тратит на зарплаты в 10 раз больше, чем вторая, то психика болельщиков «богатеев» будет уничтожена, займи их команда 3-е место. Иными словами, нужно как-то соотнести «мест по зп» с реальными тратами.
Сделать это на раз-два нельзя. Некоторые команды за 12 лет провели в РФПЛ 12 сезонов, другие – по одному. Да и очевидно, что в далеком 2004 сразу несколько команд могли содержать всех своих игроков на годовую зарплату Халка-2014 (Зарплата Халка в 2014 г. составила 7 млн. евро, в 2004 году на эти деньги можно было содержать всех игроков клубов «Ротор», «Кубань», «Алания» и «Амкар»). Здесь необходимо нормирование. Я сделал его так: в каждый год определил какой процент от общей зарплатной ведомости лиги составляет зарплатная ведомость каждого клуба, а затем вывел средний процент. Речь везде, напомню, идет именно и только о зарплатах игроков, но не персонала и пр.
Соответственно, табличка получается намного интереснее, потому что позволяет сравнивать конкретные величины (разница между 1-м и 2-м средним местом по зп кажется маленькой, а вот разница в средние 10% от общей зарплатной ведомости ЛИГИ – это намного серьезнее).
Таблица 2. среднее итоговое место, средний процент от общей зп ведомости лиги
Ну и график. Ось x – это средний процент от общей зарплатной ведомости лиги, ось y – это средняя позиция в лиге. Коэффициент детерминации (R2) равен 0,82, опять же, по двум вышеозначенным причинам это хорошо. Чтобы было не скучно, я изменил направление графика, соответственно, здесь слева от линии усредненного значения - «преуспевающие» (overachievers) клубы, а справа - «отстающие» (underachievers). Обращает на себя внимание, что «Зенит» тратит таааак много, что делает среднюю позицию в лиге ЦСКА почти неприличной. Опять молодцами выглядят «Краснодар» и ФК «Москва». Стоит ли говорить про транжирство «Анжи» и «Динамо»? Обратите внимание на «Ростов» – прошлогодняя феерия стала расплатой за 11 лет отставания, если бы не прошлогоднее 2 место, «Ростов» бы оказался среди отстающих.
График 2. Средний процент от общей зп ведомости лиги, среднее итоговое место
О некоторых вещах хочется сказать подробнее. Например, когда руководство «Зенита» говорило о том, что они выстраивают команду с прицелом на победы в Европе, оно подтверждает это делом. Зарплатная ведомость «Зенита» сопоставима с европейскими грандами (в прошлом сезоне – в 20ке самых больших зп ведомостей в Европе), правда это накладывает отпечаток на восприятие результатов клуба в РФПЛ. Такая гигантская зп ведомость в России попросту не нужна, это вопиющее транжирство. Даже если бы «Зенит» продал бы не только Халка и Гарая, но и еще 5-6 стабильных игроков основной обоймы, то они все равно бы должны были бы бороться за чемпионство. Если нет – у болельщиков должны появиться серьезные вопросы к тому, как обращается с деньгами их руководство.
Другой пример, «Спартак». Когда один тренер «Спартака» говорит, что ему нужно еще 2-3 игрока уровня Промеса, а один руководитель Спартака говорит, что он делает все для того, чтобы Спартак стал чемпионом (я не оспариваю значение постройки стадиона, речь здесь только о подборе игроков), Федун один из них точно врет. «Спартак» может стать чемпионом, но без 2-3 Промесов – это будет стечение обстоятельств, удача, а в следующем году произойдет откат назад в лиге и опять станет уныло. При всем при этом, стоит отметить, что «Спартак» живет вполне по средствам. Какой есть подбор игроков, такой и результат. Т.е. вложенные в клуб, в игроков деньги дают адекватный результат. Только ностальгия пилит сердце и заставляет желать большего.
В 2004 году «Зенит» тратил на зарплату всем игрокам состава меньше, чем в 2014 - на зарплату одному Халку
Еще один пример, «Терек». Как видно из графика, «Терек» немного недовыполняет свою норму, т.е. занимает место ниже, чем можно ожидать исходя из зарплат. Здесь есть очевидное объяснение – руководству приходится несколько переплачивать игрокам, дабы они согласились ехать в Грозный (хотя бы просто в силу стереотипов). Но если предположить, что за «Тереком» стоит некий административный ресурс, то результаты команды с 2004 года должны быть выше, чем они есть. Я согласен, что в некоторых случаях, отрицать попрание спортивного принципа, на мой взгляд, невозможно (иначе руководство «Урала» стоит уволить, а команду расформировать – но об этом в будущем). Но в целом, т.е. в среднесрочной перспективе, «Терек» играет именно так, как должен (или даже чуть хуже, если мое объяснение переплат через стереотипы Вас не удовлетворило).
Наконец, контрадикторные случаи «Ротора» и «Арсенала». Два клуба использовали принципиально разные стратегии вылета: агония «Ротора» (убрать тренера, убрать другого, убрать третьего, вернуть второго, вернуть первого) и стоицизм «Арсенала» (достойный, стоит сказать; мб, именно поэтому два года назад болельщики болели до последнего, а сейчас почти потеряли веру после 14 туров). Вывод один – если вы не обладаете достаточными средствами, чтобы набрать игроков уровня РФПЛ (не то что уровень высок, просто у игроков с паспортом запросы серьезные) – вам нечего делать в РФПЛ (этой темы я тоже коснусь в ближайшем будущем).
Итак, это не все выводы, которые можно сделать. На мой взгляд, модель Шимански (при всех ее недостатках) и мое миниисследование (при всех его недостатках) достаточно наглядны. Что важнее, здесь есть пища для размышления. У меня нет ответов на все вопросы, потому буду рад услышать ваши мнения в комментариях!
В заключение, еще два рассуждения. Первое, про рынок зарплат. Один из главных выводов Шимански про английскую Премьер-лигу состоит в том, что рынок зарплат футболистов эффективен. Чем лучше игроки, тем больше им платят, тем выше команда оказывается в лиге. Хотя модель на данных РФПЛ и работает, на мой взгляд, это не значит, что рынок зарплат РФПЛ эффективен. Это значит, что лимит вынуждает переплачивать, но переплачивают все, а потому ситуация выравнивается. Второе, про административный ресурс. Для Шимански вообще не стоит вопрос о неспортивных факторах, влияющих на результаты команд. У нас же вопрос об административном ресурсе часто всплывает. Да, этот ресурс используется, и да, это омерзительно. Иногда это напрямую влияет на спортивные результаты (например, получив взаймы 3 очка, команда может остаться в РФПЛ). Но если вы взяли взаймы три очка, то вы должны будете их отдать. И если каждый сезон вы берете взаймы по три очка, то через 10 лет вам придется отдать 30, что невозможно. Хотя в некоторых случаях спортивный принцип оказывается у нас попран (а это недопустимо в принципе), в среднесрочной и долгосрочной перспективах, спортивный принцип в РФПЛ торжествует. Время все расставляет по местам.
Если вам понравился этот материал, пожалуйста, поставьте плюс и расскажите друзьям!
В дальнейшем я надеюсь обсудить с вами проблему больших спонсоров в отечественном футболе, влияние трансферов на итоговое положение команд в РФПЛ, кто из тренеров РФПЛ круче всех, а кто переоценен больше всех, вопрос о влиянии болельщиков на результаты команды. Буду рад, если подпишитесь и на мой блог!
Подписался на ваш основной блог.
Единственный момент. На графике № 2 вы выделяете Ростов. Найти его там без лупы очень непросто. (но это мелочи)
Хотелось бы высказать свою мысль на счёт Зенита (т.к. являюсь болельщиком этого клуба и за остальными слежу в значительно меньшей степени) и про полежение Зенита и ЦСКА на графике 2.
"«Зенит» тратит таааак много, что делает среднюю позицию в лиге ЦСКА почти неприличной"
Тут скорее совокупность нескольких факторов, повлиявших на такой разыв и дело не только в большей зарплатной ведемости Зенита по отношению к ЦСКА. Как вы, несомненно верно, указали что руководство Зенита тратится в расчёте на успех клуба в Европе. Но как раз из-за стремления добиться большего в еврокубках ПЛ отходила на второй план и достаточное количество очков терялось в осенней части чемпионата. Именно этих очков могло и не хватать для того, чтобы занять первое место в чемпионате. В связи с этими потерями(но не только из-за них конечно же) чемпионом становился ЦСКА. В итоге и получилась такая колосальная разница на графике.
И тут уже вопрос даже не к руководству клуба, а к бывшим и нынешнему тренерским штабам. Почему они не смогли лучше распределить силы между 2мя турнирами и в одном из них откровенно провалили поставленную задачу (чемпионство), имея такой подбор игроков.
Ваш Властимил Петржела.
Да, с картинками у меня пока не ладится (точнее, с моим выкладыванием именно графиков). Постараюсь впредь делать более удобоваримыми :)