Влияет ли сила команды на реализацию моментов?
В этом материале мы проверим гипотезу о том, что на реализацию команды и ее соперников влияет общий уровень команды, а также качество защиты и нападения.
Переменные и выборка
В терминах модели ожидаемых голов реализация определяется отношением nPG/xG. При хорошей реализации значение будет выше единицы, при плохой - меньше. Уровень защиты и нападения определяется как xGa_0per90 (ожидаемые голы соперника без учета пенальти за 90 минут при равном счете) и xG_0per90 соответственно. Общий уровень зададим как разность последних двух переменных: xGdiff_0per90 = xG_0per90 - xGa_0per90.
В качестве выборки используются данные за этот сезон по топ-5 + РФПЛ - всего 114 команд, проведших 1160 матчей.
Почему мы выдвигаем такие гипотезы?
Кажется логичным, что условная Бавария, где уровень исполнителей явно выше, чем у условного Анжи, должна реализовывать на более высоком уровне. Для обороны уже неочевидно, нужно ли соперникам условного Атлетико больше моментов, чтобы забить, чем оппонентам какой-нибудь Гранады.
Проверка гипотез
Используя самый обычный МНК (все предпосылки выполняются), сначала проверим следующие регрессии:
Модель 1 - влияние уровня атаки на собственную реализацию.
Казалось бы, связь должна быть положительной. Но нет же, коэффициент b отрицателен, причем верхняя граница 90% доверительного интервала лежит в нуле, R^2 = 0,02.
Ось X - качество атаки, ось Y - реализация
Следовательно, точно об обратной зависимости мы говорить не можем, но (в среднем случае) уровень атаки гарантированно не влияет положительно на реализацию. Как ни странно, Левандовски, Бейл и другие игроки топ-клубов в среднем случае должны реализовывать также, как и аутсайдеры. Для подтверждения вывода следует проверить регрессию для отдельных игроков, но это может говорить о том, что уровень нападающего определяет в первую очередь качество его моментов, а не их реализация (по ссылке статья Бобби Гардинера, в которой он делает аналогичное утверждение; обязательно к прочтению, если для вас Кавани - плохой нападающий).
Модель 2 - влияние уровня обороны на реализацию соперника
Вычисления показали, что уровень обороны практически не зависит от реализации - значение коэффициента b при переменной отрицательно, но середина 95% доверительного интервала ближе к нулю, чем оба его конца, R^2 = 0,006.
Модель 3 - влияние общего уровня на свою реализацию
После результатов Модели 1 кажется, что коэффициент также должен быть отрицателен. Но теперь уже он положителен, хоть и не сильно. Это наталкивает на мысль, что следует проверить влияние качества защиты на свою реализацию у чужих ворот.
Модель 4 - влияние общего уровня на реализацию соперника
В данном случае коэффициент при регрессоре близок к нулю и совсем не значим. Делаем вывод о независимости реализации соперника как от качества обороны, так и от общего уровня команды.
Модель 5 - влияние обороны на свою реализацию
В данной регрессии коэффициент b отрицателен, 99% доверительный интервал целиком меньше нуля, R^2 = 0,07. Так как высокое качество обороны означает низкое значение xGa_0per90, можно с высокой долей уверенности утверждать, что в среднем случае лучше защищающаяся команда будет лучше реализовывать моменты у чужих ворот. Вероятно, это можно связать с тем, что и уровень обороны, и в несколько меньшей степени реализация определяются степенью организованности команды.
Что получилось в итоге?
Итак, мы сделали следующие выводы:
Качество атаки отрицательно влияет на реализацию моментов (этот и последующие выводы действуют только в среднем случае). UPD: Правильнее сказать не "отрицательно влияет", а "не влияет положительно"
Реализация не является главным критерием оценки нападающего.
На уровень реализации соперника не влияет ни качество обороны, ни общий уровень команды.
Чем лучше команда обороняется, тем лучше она реализует моменты у ворот соперника.
Любите математику и не забывайте о трех видах лжи.
По модели 1 - разные команды делают ставку на (простите за повторение и банальность) разные стили. Быстрый контратакующий предполагает более высокую реализацию, при, возможно, меньшим числе ударов. С другой стороны вспоминаются матчи Ливер, Боруссии или Ман.Сити с их числом ударов и крайне низкой реализации.
Очень важный тезис по поводу форвардов, соглашусь, их качество не только реализация
Здесь мб все-таки не линейная зависимость , возможно, логарифмическая. Но как бы средняя ценность удара тоже важна, но ее включать нельзя из-за мультиколлениарности.
Какой может быть показатель указывающий на вертикальность? Точность передач, средняя длина передач...
С учетом того, что надо избегать эндогенности, я так и не смог придумать, что еще можно включить в модель - число доступных нам параметров не так уж и велико, все же. Единственное, можно было попробовать включить в регрессоры качество атаки вместе с качеством защиты, но в таком случае значимость по сравнению с моделью 5 не выросла бы, да и нужна проверка на эндогенность.
В общем, вывод из модели 5 явно верен, из модели 1 степень уверенности уже гораздо ниже.
Если интересно, можете написать в личные сообщения для обсуждения.
Спасибо за комментарий по существу.
По первому абзацу Вашего комментария - с чего вдруг слабые команды должны иметь лучшие моменты?
А за пустые отсылки к Перельману в этом блоге и правда стоит тереть комментарии
Вертикальность можно измерить отношением числа пасов за матч к ударам, но, если честно, не верится, что там будет значимость. Постараюсь проверить сегодня