Если бы все решали деньги: как трансферы влияют на рейтинг УЕФА?
В данной статье результаты исследования вопросов – сколько нужно инвестировать европейскому клубу, регулярно выступающему в еврокубках, чтобы повысить свои шансы на успех за счет трансферной политики? Как бы выглядел рейтинг УЕФА за предыдущие 5 сезонов, если почти все определяли трансферные расходы (при прочих равных по другим факторам)?
Методология
Для анализа отобраны клубы, которые участвовали в еврокубках минимум 4 раза за последние 5 сезонов, за исключением «Челси» (осталось 57 клубов). Аристократов исключили из-за аномального показателя соотношения расходов к рейтинговым баллам, что заметно бы смещало линию тренда в статистических моделях и от этого страдали бы клубы в нижней части рейтинга (прогноз по ним тогда начинает сильнее отклоняться от факта). По каждому клубу собраны данные с сезона 20/21 по 24/25: (1) трансферные расходы и доходы, (2) рейтинговые баллы УЕФА.
Для оценки влияния трансферных расходов и доходов на баллы УЕФА применили три математические модели: (1) множественная линейная регрессия (множественная потому что используем два фактора – расходы и доходы), (2) полиномиальная регрессия 2 степени только с учетом расходов. (3) полиномиальная регрессия 2 степени с регуляризацией с учетом расходов, доходов и их разниц (трансферный баланс). Предложенные в статье модели успешно прошли проверку на статистическую значимость (p-value меньше 0.05), мультиколлинеарность и распределение остатков.
Результаты
Модель 1 (простая – менее точная)
Множественная линейная регрессия объясняет больше половины вариаций рейтингов – 51.1%, т.е трансферы определяют примерно половину рейтинговых очков. Однако нужно отметить, что в формуле только два фактора и они не объясняют 48.9% других значений, так как не учтены другие важные факторы (при их добавлении вес расходов на трансферы может измениться). Формула модели:
Рейтинг = 35.92 + 0.0678 × (расходы) + 0.0460 × (доходы)
35.92 – это базовый рейтинг, который в математической модели клуб получил бы при нулевых расходах и доходах. Для повышения рейтинга на 1 балл необходимо увеличение расходов на 14.74 млн евро. Показатель доходов не имеет высокой предсказательной силы рейтинга (также немного не хватает статистической значимости, т.е сила связи не очень надежна).

Красная линия на графиках – это «идеальная кривая», которую нашла модель, чтобы наилучшим образом объяснить разброс реальных данных (синих точек – пересечение рейтинговых баллов и расходов на трансферы по клубам). Чем ближе к линии, тем модель точнее объясняет рейтинг. Если точки ниже линии, значит клуб демонстрирует более низкий рейтинг, чем ожидается при его уровне расходов. Если точки выше линии, значит клуб достигает более высокого рейтинга, чем прогнозируется при его уровне расходов. Достаточно много клубов далеки от идеальной модели (+ / – 35 баллов).
Модель 2 (посложнее – более точная)
Полиномиальная регрессия второй степени с использованием данных только по расходам дает результат получше – объясняет 54.7% вариаций рейтингов.
Рейтинг = 30.94 + 0.188 × (расходы) × -0.00012 × (расходы)²
30.94 – это базовый рейтинг, который в математической модели клуб получил бы при нулевых расходах и доходах. Модель считывает убывающую отдачу от инвестиций – дополнительные расходы дают все меньшую отдачу в виде рейтинговых очков.

До 150-200 млн. евро зависимость практически линейная – при вложении 5.4 млн евро рейтинговый балл увеличивается на 1 единицу. После расхода более 400 млн евро эффективность уже в 2 раза ниже – для 1 балла нужно около 10 млн евро. После 700 млн евро отдача еще сильнее уменьшается и 1 дополнительный балл набирается за счет более 17 млн евро. После 938 млн евро эффективность становится отрицательной в первую очередь из-за «Манчестер Юнайтед», «Тоттенхэма» и «Челси» (если бы остались в модели). Модель пытается объяснить настоящие рейтинговые баллы по расходам на трансферы. Если подставить 1735 млн расходов «Челси» в формулу, то получим результат в районе 30 места, а если бы их включили в анализ, то результат был бы немного другой, но тогда бы заметно снизилась объяснительная сила модели.

Если бы все определяли расходы на трансферы
Тогда бы топ-10 рейтинга УЕФА за предыдущие 5 сезонов должен был выглядеть примерно следующим образом:
🥇 Тоттенхэм — 106.7 баллов (+26 позиций)
🥈 Арсенал — 106.7 баллов (+9 позиций)
🥉 Ювентус — 105.9 баллов (+18 позиций)
4️⃣ Манчестер Юнайтед — 105.2 баллов (+6 позиций)
5️⃣ Манчестер Сити — 103.8 баллов (-3 позиций)
6️⃣ ПСЖ — 102.8 баллов (-1 позиция)
7️⃣ Бавария — 102.0 баллов (-4 позиций)
8️⃣ РБ Лейпциг — 99.4 баллов (+10 позиций)
9️⃣ Ливерпуль — 98.3 баллов (-5 позиций)
🔟 Наполи — 92.4 баллов (+20 позиций)
При сравнивании прогнозного рейтинга УЕФА с фактическим рейтингом максимально высоко поднимается «Реал Мадрид» – по прогнозу должен был занимать 22 место. В верху рейтинга самые большие значения рейтингов соответственно поэтому самые большие расхождения прогноза с фактом. Согласно модели Аякс мог бы претендовать на большее в рейтинге УЕФА, однако, мы тут не учитываем доходы (с ними модель становится менее надежной для всех клубов в среднем). В негативную сторону нужно отметить «Милан» – если бы трансферные расходы были со средним уровнем эффективности (при прочих равных), то занимали бы 13 место (+5 позиций).
Самая негативная с точки зрения неэффективности инвестиций среди всех клубов с отрицательным трансферным балансом у «Тоттенхэма» (-26 позиций), «Марселя» (-22) и «Наполи» (-20). Самая лучшая разница с миром где все решают расходы у «Реала» (+21), «Ренджерс» (+21) и «Вильярреала» (+16). Клубы с соответствием расходов к результатам в еврокубках: «ПСЖ», «Атлетико Мадрид», «Бенфика» и «Аталанта». Их фактические позиции в рейтинге УЕФА почти идеально совпадают с прогнозом, основанным на расходах. При этом стоит отметить, что «ПСЖ» и «Атлетико» находятся в зоне высокой неэффективности, в то время как «Бенфика» и «Аталанта» демонстрируют отдачу от трансферов выше среднего.

Модель 3 (сложная – наиболее точная)
Не буду приводить формулу модели, так как она очень длинная. Она дает лучший результат – объясняет 59.4% вариаций рейтингов. Используются перекрёстные признаки, т.е модель учитывает эффект совокупного влияния расходов и доходов.

Если бы все определяли расходы и доходы с трансферов
Тогда бы топ-10 рейтинга УЕФА за предыдущие 5 сезонов должен был выглядеть примерно следующим образом:
🥇 ПСЖ — 114.4 баллов (+4 позиций)
🥈 Манчестер Юнайтед — 113.8 баллов (+8 позиций)
🥉 Тоттенхэм — 108.2 баллов (+24 позиций)
4️⃣ Арсенал — 104.5 баллов (+7 позиций)
5️⃣ Манчестер Сити — 101.8 баллов (-3 позиций)
6️⃣ Ювентус — 99.9 баллов (+15 позиция)
7️⃣ Бавария — 95.2 баллов (-4 позиций)
8️⃣ Ливерпуль — 88.5 баллов (-4 позиций)
9️⃣ Наполи — 87.0 баллов (+ 22 позиций)
🔟 Лейпциг — 86.6 баллов (+7 позиций)

Добавление доходов и взаимодействий с расходами существенно перераспределило прогнозные позиции клубов. «ПСЖ» выходит на первое место, а «Тоттенхэм» на третье. «Манчестер Юнайтед» поднимается на второе место с четвртого. «Манчестер Сити» и «Бавария» сохранили свои позиции в топ-10. «Арсеналу» улучшенная модель снизила оценку и передвинула с 2 на 4 место. «Интер», «Боруссия Дортумнд» и «Рома» поднимаются в рейтинге. Заметно снижается позиция у «Лейпцига» (с 8 на 11) и «Бенфики» (с 16 на 19) так как у клубов большой положительный баланс.

Подписывайтесь на мой telegram-канал – graph_metrics.

















































Пара вопросов по фактуре для более полного понимания контекста: откуда брались расходы и доходы по трансферам? Затраты из бюджета капитализируются у каждого по своему, а для УЕФА и вовсе прописан отдельный стандарт. Здесь мы видим комплексные затраты, или амортизированные с расчетом на срок контрактов и всеми возможными статьями расходов (включая оклад и комиссионные)?
Расходы брались из трансфермаркт, точно такие же как во многих предыдущих статьях (но нужно было и здесь прописать конечно). Комплексные расходы получается. На комиссионные и прочие расходы было бы конечно круто замахнуться.
А ведь команды победнее, наверняка, в разы эффективней.
Нет ли желания сделать аналогичный анализ, но по средней оценке трансферной стоимости игрока клуба?
(или может быть, уже было?)
на этом, собственно, все
понятно, что идея лежит на поверхности
что стоило бы попробовать - во-первых каждый игрок отдельно, ведь каждая когорта (клуб) неодинакова и наверняка интерполируется без весов. во-вторых, стоит каким-то образом задать распределение стоимости игроков в одной и той же размерности. в принципе, среднее и дисперсия (среднее и медиана как альтернатива), построить 3д плот, может там будут какие-то зависимости (условно, наилучшая эффективность на величине среднего трансфера х при дисперсии у), в-третьих, рейтинговые баллы практически точно нелинейная шкала (балл в секторе 50->51 не равен баллу в секторе 100->101), использование аппроксимирующих кривых здесь субоптимально, в четвертых сейчас Анкалаев-Перейра, поэтому я остановлюсь.
еще раз повторюсь, идея здравая, но из данных можно выжать побольше
для любого датасета с N элементами можно построить полином N-ной степени который в этом случае объяснит 100% варианса
лучше уж какой-нибудь катбуст с кроссвалидацией попробовать. возможно там по-настоящему и нет даже этих 59%