7 мин.

На несколько болельщиков больше

Среди прочих факторов интереса болельщиков к футбольным матчам одними из самых футбольных можно назвать зрелищность и равенство уровня команд, участвующих в матче.

Действительно, логично предположить, что те накал и энергия, которые проявляются в более ожесточенной борьбе команд за место под солнцем в чемпионате, вызывает гораздо больший интерес болельщиков, чем ничего не решающие в турнирном отношении игры. Важно отметить, что для разных команд с разными возможностями понятие «места под солнцем» означает различные позиции в турнирной таблице. Для кого-то, как для Барселоны, это только победа, для других, как для Ливерпуля в текущем сезоне, – места в еврокубках, а для третьих и позиция вне зоны вылета будет считаться достойным результатом.

Ну, а зрелищность поединка, которая может измеряться, например, количеством забитых голов или количеством ударов по воротам, кажется, трудно переоценить в отношении любви к ней футбольных болельщиков.

Так действительно ли эти футбольные факторы имеют отношение к нашему с вами интересу к матчам?

Основа анализа

Для анализа будут использоваться статистические данные о средней посещаемости топ-5 чемпионатов за последние пять сезонов, как некоторый показатель интереса к матчам лиги. Для оценки зрелищности матчей лиги рассмотрим показатель среднего количества голов за тур. В качестве меры конкуренции и насыщенности чемпионата предлагается использовать стандартное отклонение очков, набранных командами по результатам сезона (или в сезоне 2014/15 – на момент написания статьи). Причем, по моему мнению, будет разумным рассчитать такое отклонение для верхней части турнирной таблицы и для нижней по-отдельности – все-таки, как писалось выше, перед разными командами стоят разные цели и неправильно борьбу за чемпионство отождествлять борьбе за выживание. Более того, нужно учесть, во-первых, что число туров и, соответственно, максимально возможное количество набранных очков для разных лиг могут отличаться (примером может быть Бундеслига, в которой количество туров, если кто не знает, равно 34). Во-вторых, понятно, что сезон 2014/15 еще не закончен, и неверно сравнивать уровень конкуренции в этом сезоне с другими сезонами из-за разного количества набираемых очков. Поэтому разделим указанный выше показатель на количество туров, сыгранных на момент написания статьи.

Необходимо учесть, что мера стандартного отклонения тем выше, чем меньше конкуренции в чемпионате. В итоге получаем показатель, который можно интерпретировать как средний вклад каждого сыгранного тура в уменьшение степени конкуренции в лиге или в увеличение степени ее монополистичности. Но давайте не будем пользоваться таким ужасным термином из другой области знаний и все-таки попытаемся найти показатель, который будет соответствовать уровню конкуренции. То есть всем будет понятнее, если большое значение показателя будет соответствовать бОльшему уровню конкуренции и наоборот. Для этого можно просто посчитать величину, обратную высчитанной ранее метрике (средний вклад каждого сыгранного тура в уменьшение степени конкуренции). 

Итак, в результате всех математических преобразований получаем показатель, который мы будем интерпретировать как вклад каждого тура в увеличение степени конкуренции чемпионата.

Так, например, для верхней половины турнирной таблицы испанской Примеры сезона 2013/14 стандартное отклонение равно 15.76; разделив его на количество прошедших в Примере в том сезоне туров, получим показатель, равный 0.41, а разделив 1 на последний, получим 2.44.

Не будем выдумывать ничего нового для того, чтобы оценить связь между интересом болельщиков и насыщенностью чемпионата – воспользуемся обычным коэффициентом корреляции.

Уровень конкуренции

Для начала было бы интересно посмотреть на уровень конкуренции в целом, сравнить ее значения для разных чемпионатов и для всех сезонов в среднем.

Средние показатели уровня конкуренции чемпионатов за 5 сезонов для верхней части таблицы заметно меньше, чем тот же показатель для нижней части. Причем, в большинстве лиг первый показатель превосходит второй в 2 раза и более, тогда как в Италии наблюдается более гладкая картина в отношении насыщенности разных частей таблиц. Самая большая амплитуда уровня конкуренции в разных частях турнирной таблицы в испанской Примере.

Далее представлены те же самые показатели, но по сезонам.

Несколько моментов, заметных невооруженным глазом:

  • Наименьшая конкуренция в верхней части таблицы наблюдается в испанской Примере, в нижней – в итальянской Серии А

  • В целом, самая высокая конкуренция в верхних частях турнирных таблиц наблюдалась в 2010/11 и 2014/2015 сезонах

  • Самая ровная картина по конкуренции в верхней части таблицы на протяжении пяти сезонов наблюдается в Испании и Германии, в нижней – в Италии.

  • Самое высокое значение уровня конкуренции в верхней части таблицы наблюдалось в сезоне 2010/2011 во Франции, самое низкое – в Примере в сезоне 2011/2012.

  • Самое высокое значение уровня конкуренции в нижней части турнирной таблицы наблюдалось опять же во французской Лиге 1, но в сезоне 2011/2012, самое низкое – в итальянской Серии А в текущем сезоне.

Первым шагом для анализа зависимости зрительского интереса и конкуренции в лиге будет построение диаграмм рассеяния для всех лиг в целом, которые, я надеюсь, отразят общие зависимости между показателями. На следующих рисунках приведены такие диаграммы для обеих частей турнирных таблиц.

Во-первых, стоит отметить, что эти диаграммы дополняют предыдущие. Так, например, небольшой разброс значений конкурентности в первой половине турнирной таблицы Примеры здесь отображается как плотная группа точек, не растянутая по оси X. То же можно сказать и про итальянскую Серию А на второй диаграмме.

Во-вторых, диаграммы рассеяния и коэффициенты корреляции, приведенные на графиках, показывают, что сильной взаимсосвязи между двумя показателями нет. Однако, для верхней части турнирной таблицы, судя по значению корреляции -0.42, можно наблюдать среднюю тесноту связи, а это значит, что средняя посещаемость матчей чемпионатов все-таки, в целом, зависит от интриги в верхней части турнирной таблицы.

Другой вопрос в том, как эта зависимость выглядит. Интересным наблюдением является то, что, судя по знаку коэффициента корреляции, посещаемость матчей лиги зависит от «накала страстей» в матчах первого эшелона обратным образом. То есть, чем больше конкуренция в верхней части турнирной таблицы, тем меньше средняя посещаемость матчей! Конечно, такой вывод противоречит здравой логике и его можно объяснить, глядя на диаграмму. Есть Бундеслига, в которой конкуренция в целом меньше среднего уровня сочетается с большой посещаемостью, и есть Франция и Италия, где гораздо меньшая посещаемость сочетается с более высокой конкуренцией верхней части таблицы – все это наталкивает на мысль о первоначально неверно выбранных предпосылках: все-таки существуют и другие факторы, которые обуславливают огромную разницу в посещаемости, например, в той же немецкой Бундеслиге и во французской Лиге 1. Поэтому дальнейший анализ правильнее пров одить для каждой лиги по-отдельности.

Вердикт: существующая слабая зависимость необъяснима, необходим дополнительный анализ.

Зрелищность

 

Далее рассмотрим не менее интересную тему зрелищности футбольных лиг, используя показатель среднего количества голов за тур.

Что мы видим:

  • Во французской Лиге 1 в среднем забивается наименьшее количество голов, ее можно назвать наименее зрелищной лигой из рассматриваемых.

  • Все меньшее и меньшее количество голов забивается в АПЛ.

  • Самый большой показатель среднего количества голов за тур наблюдался в Примере в сезоне 2012/13, а также в немецкой Бундеслиге в прошлом сезоне.

  • В Италии наблюдается тенденция к росту среднего количества голов, хотя в текущем сезоне зрелищность этой лиги (в рассматриваемом контексте) меньше, чем в предыдущем.

  • В текущем сезоне количество забитых голов на тур во всех чемпионатах заметно меньше, чем в предыдущем. Можно надеяться, что оставшиеся туры исправят данную картину.

А теперь рассмотрим тесноту связи между средней посещаемостью и зрелищностью при помощи тех же диаграммы рассеяния и коэффициента корреляции.

Для начала отметим, что и в данном случае возникают те же проблемы с различным влиянием прочих факторов в разных чемпионатах. Несмотря на это коэффициент корреляции подсказывает нам, что существует прямая связь между интересом болельщиков и зрелищностью игр, рассчитанной через количество забитых голов. Этот коэффициент немного превосходит значение 0.4 – это значит, что связь скорее средняя, чем слабая.

Вердикт: связь между посещаемостью и зрелищностью есть, но не имеет особой силы.

Всем вердиктам вердикт: Как бы не хотелось использовать результат, полученный на последнем шаге исследования, на диаграммах рассеяния видно, что для отдельных чемпионатов зависимость сильно разнится, а иногда, вообще, наблюдаются противоположные результаты. Это особенно видно на примере со зрелищностью в АПЛ, где корреляция скорее отрицательная. Поэтому делаем вывод, что на посещаемость больше влияют «нефутбольные», «околофутбольные» и прочие факторы. Есть идеи, какие?