5 мин.

«Зенит» – лучшая команда по качеству игры в последних турах. xG-обзор 7 тура РФПЛ

С тех пор, как блог обновлялся последний раз, была проделана достаточно приличная работа. В первую очередь не мной, а Андреем Кривоноговым, который написал программу для того, чтобы xG считались гораздо быстрее. Вдобавок удалось гораздо улучшить систему – ввести больше параметров, чтобы сделать модель точнее. Понятно, что приходится идти на определенные хитрости – у нас нет подписки на Опту, поэтому приходится заниматься пиратством. Ну что ж, с другой стороны, это пиратство, как кажется, не идет никому во вред.

Со следующего тура уже будут более подробный разбор каждой игры РФПЛ с комментарием. Пока же просто xG-карты, статистика по явным голевым моментам за тур и две сводные таблицы. И, конечно, некоторое пояснение от Андрея по модели и его участку работы.

«Хотелось бы сказать пару слов о том, как мы вычисляем xG. За основу взята модель Кэйли, подробна описанная год назад: http://cartilagefreecaptain.sbnation.com/2015/10/19/9295905/premier-league-projections-and-new-expected-goals

Затем был написан небольшой калькулятор (с ним можно поиграться взяв отсюда https://github.com/krivonogov/xg), а также ещё некоторые автоматизации для упрощения процесса.

Единственное отличие от модели Кэйли состоит в отсутствии подгона xG под реализацию разными игроками ударов, во-первых, потому что я не до конца понял, что именно он делает, во-вторых такой подгон оправдан только для игроков, которые совершили больше 100 ударов за последние 5-6 лет, а таких в РФПЛ, я думаю, немного. Ещё одна проблема, ведущая к небольшому отличию от результатов Кэйли (я тестировал на последних выложенных им картинках), состоит в том, что без просмотра матча иногда сложно понять был ли удар нанесён в контратаке и вообще, что этому удару предшествовало, однако эту проблему с горем пополам удалось разрешить и свести отличие наших вычислений от результатов Кэйли до минимума.

Кроме того, для финальных результатов матчей мы применяем формулу полной вероятности, уже описанную Никитой в этом блоге».

Статистика по явным голевым моментам в туре (с игры):

«Оренбург» – «Спартак» 0:1

«Крылья» – ЦСКА 1:1

«Зенит» – «Рубин» 3:0

«Локо» – «Уфа» 0:0

«Краснодар» – «Ростов» 1:0

«Урал» – «Анжи» 0:0

«Терек» – «Амкар» 0:1

«Томь» – «Арсенал» 0:0

В этой таблице в таблице:

xG – суммарная опасность созданных моментов (без учета пенальти)

xGa – суммарная опасность допущенных моментов (без учета пенальти)

BigCh – число созданных явных голевых моментов (без учета пенальти)

BigChA – число допущенных явных голевых моментов (без учета пенальти)

xGdiff = xG – xGa

BigChdiff = BigCh – BigChA

Pen_diff – разница между пенальти в пользу и против команды

NPG/xG – число голов, забитых командой (без учета пенальти), разделить на xG

NPGa/xGa – число голов, пропущенных командой (без учета пенальти), разделить на xGa

xG/Shots – средняя опасность удара команды

xGa/ShotsA – средняя опасность удара, который команда допустила

Выводом по таблице очень много интересных.

К примеру, результат «Анжи» сильно переоценен, и команда, по-хорошему, должна стоять на вылет. Разговоры о качественной обороне «Амкара», как залоге успеха команды, подтверждаются тем, что на качественно ином уровне по сравнению с пермяками защищается только ЦСКА. То есть по итогам 7 туров можно сказать, что у Перми – вторая защита в чемпионате, и это не будет лукавством.

«Зенит» по качеству игры – лучшая команда чемпионата последних трех туров. Они всегда набивали с игры минимум 1 xG, что в нашей модели достаточно много. Проблемы ЦСКА в атаке подтверждаются статистикой – серьезное отставание от «Спартака» и Питера. Ну и дальше много всего интересного. 

Таблица при гипотезе 0,6 xG = 1 гол. Правда в данном случае еще учитываются пенальти – если разница между командами меньше 0,15 xG внутри игры, то той, которая била пенальти, я пишу победы. Считаю это справедливым достаточно.

Подписывайтесь на паблик ВК со статистическими и тактическими выкладками.