6 мин.

Очищенная статистика матчей РФПЛ

Текст представлен независимым автором, мнение редакции может не совпадать с нижеизложенным мнением. Картинки кликабельны.

Прежде всего, огромное спасибо Марсело за создание данного блога и отражении в нем статистики посещаемости Российской Премьер-Лиги, и вам, дорогие читатели блога, особенно за комментарии к предыдущему посту. Обратная связь – самое ценное, и это безумно приятно.

На блог я подписался, поскольку мне всегда были интересны цифры и факты, которые являются фундаментом для анализа тех или иных бизнес-кейсов – это помогает понять, где ты сейчас находишься и куда нужно двигаться. Однако, показатели, оторванные от контекста, на мой взгляд, могут исказить реальную картину действительности, заставить сделать неправильные выводы и привести к ошибкам в будущем.

Данная статья является первой в запланированном цикле публикаций углубленной аналитики посещаемости клубов РФПЛ на примере футбольного клуба ЦСКА, и в ней мне хотелось бы расставить все точки над i, объяснить суть методологии проведенного анализа, привести аргументы в защиту будущих цифр и данных. Это позволит давать ссылку на этот пост, не отвлекаясь в дальнейшем на техническую сторону вопроса.

Итак, начнем.

   Дано: сухие цифры домашней посещаемости футбольного клуба ЦСКА с 2002 по 2018 год.

ЦСКА

   Задача:

1) Определить насколько данные цифры отражают интерес болельщиков к Клубу – нет ли за ними иных факторов, которые могли повлиять на посещаемость?

2) Если есть – очистить цифры от этих факторов, получив новые, более объективные данные.

3) Выстроить новый «очищенный» график посещаемости, подготовить анализ и выводы по нему.

4) И выяснить, что же, черт возьми, случилось в 2010 и в 12/13 - 15/16 гг.?

   Вводные данные:

Сведя информацию домашних матчей за 16 лет – как РФПЛ, так и Лиги Чемпионов да Лиги Европы – мною были отмечены  существенные перекосы в некоторых цифрах, что позволяет ответить на первый поставленный вопрос: есть ли иные факторы, повлиявшие на посещаемость. Ответ – да, есть.

   В качестве примера:

Сезон 13/14, в котором ЦСКА провел 4  домашних матча подряд (!) на 4 разных стадионах(!!) , в 3 разных городах (!!!)

13-14

В т.ч. матч с Динамо на стадионе «Сапсан Арена» (ранее МСА «Локомотив») - кто из Вас помнит, что такое событие вообще имело место быть в истории проведения чемпионатов России?

Сапсан

 

Это, кстати, до сих пор, единственный матч РФПЛ на данном стадионе, а пришло на него в тот день - 7 700 человек (при вместимости в 10 000).

Теперь посмотрим, насколько это выбивается из общей статистики посещаемости матчей ЦСКА-Динамо:

Динамо

Довольно существенно.

Делаем вывод: данная посещаемость в 7,7 тыс. человек (при средней в 11,8 тыс.) не является следствием угасания интереса к Клубу, а результат форс-мажорных обстоятельств. Следовательно, если бы матч состоялся на стадионе «Химки» или им. Стрельцова (как другие домашние матчи в том сезоне), можно было ожидать бОльшую посещаемость. Подставим вместо 7,7 среднюю посещаемость в 11,8 (что бьется в предыдущим и следующим годами) – на выходе получим среднюю по году в 9 867 вместо 9 593 чел.

  Следующий пример:

Сезон 16/17, матч с Ахматом (тогда Тереком) – посещаемость 26 420 человек. Есть ли дополнительные факторы, повлиявшие на эту цифру? Да, конечно, этот матч – Открытие стадиона. Он собрал бы те же 26 тысяч вне зависимости от того с кем ЦСКА играл в тот день - даже на товарищеский матч с условным Партизаном.

Поэтому, это не результат возросшего интереса болельщиков красно-синих или работы Руководства по привлечению новых людей на стадион, а просто доп. фактор, который следует исключить для получения "чистых" цифр.

Смотрим средний показатель по матчам с Ахматом:

Ахмат

9 397, и корректируем данные по году: вместо 14 454 получаем 13 319 человек (- 1,1 тыс. , довольно существенно).

Надеюсь, принцип Вам понятен, ему мы будем следовать в дальнейшем.

 Следующий момент: экстремумы.

Безусловно, при анализе такого массива данных также следует применить принцип математического анализа, исключающего экстремумы как по году, так и по конкретным соперникам. Это приведет аналитические данные к более корректному среднему показателю, убрав «перекосы», в случае их наличия. Опять-таки, приведем пример:

Матчи с Томью и Кубанью:

12

Красным и зеленым цветом выделены ячейки с минимальной и максимальной посещаемостью с данными командами соответственно. Показатель «Средняя» - это среднее значение по всем матчам, «True» – без экстремумов.

Как видно на данном примере, на матчи с Томью никогда не приходились значимые события и показатели отличаются всего на 3 человека за 9 лет. Статистика сходится, все в порядке.

Матч же с Кубанью с посещаемостью в 17 500 не типичен для данного соперника. Ажиотаж вызван ключевым событием: 29 тур, последний домашний матч сезона, в котором ЦСКА может оформить чемпионство – впервые за долгое время. Доп.фактор, причем очень существенный. Уберем его, как и матч сезона 14/15 (октябрь, -2 градуса, Химки - худшая посещаемость) и получим средний показатель в 8 517 вместо 9 347 = разница в 830 человек, сравните с Томью.

В этой же логике будет рассмотрен каждый сезон и каждый соперник.

В целом это все общие факторы, и примеры, которые я хотел упомянуть в вводной статье, а потом, разбирая каждый год отдельно будем учитывать как и их, так и конкретные события тех или иных лет – свиной грипп, успехи сборной на мундиалях, переезд в Химки и прочее. Есть, о чем вспомнить :)

А ответы на остальные вопросы будут получены в следующих постах, когда мы разберем все 16 лет.

Стадион ЦСКА

Если Вам есть, что добавить – пишите, обязательно учту при подготовке материалов.

Подписывайтесь, оставляйте комментарии, ставьте плюсики за понравившийся отчет. Поле ровное, мяч круглый, трибуны прямоугольные. При копировании материала указывайте ссылку на блог.

Подвал

Фото: sport-expess.ru, vm.ru, wikipedia.org, stadiundb.org, eurosport.com.