Интересная статистическая деталь в игре «Спартака»
Я недавно написал пост, в котором привел статистику по итогам первой части чемпионата России. Напомню основные выводы: "Спартак" входит в тройку лучших команд по владению мячом, количеству передач, точности передач; является лидером по ударам по воротам, занимает четвертое с конца место по ударам по своим воротам и является лидером по разнице ударов.
Все эти показатели говорят о том, что команда играет хорошо и заслуженно лидирует. Это не мои домыслы; есть аналитический пост (на английском), показывающий, что в ведущих европейских лигах, включая российскую, наблюдается существенная положительная корреляция между:
а) владением мячом и набранными очками
б) владением мячом и разницей ударов по воротам
в) разницей ударов по воротам и набранными очками
Другими словами, ситуацию можно описать так: команда, которая владеет мячом, контролирует ход игры; команда, которая контролирует ход игры, наносит много ударов по воротам соперника и допускает мало ударов по собственным воротам; команда, у которой хорошая разница ударов, чаще побеждает.
В то же время сейчас среди аналитиков принято считать, что модели ожидаемых голов (xG), которые присваивают разным ударам разный вес, предсказывают результаты лучше, чем модели, основанные просто на ударах по воротам.
Вот один пример (чем левее точка, тем лучше модель; последняя модель, All shots equal, - это и есть просто удары, а все остальные модели - это разные типы xG):
Вот еще пример (чем выше линия, тем лучше модель; красным показана модель xG, желтым - простые удары по воротам):
Сильно углубляться в детали я здесь не хочу, кому интересно и кто знает английский, может почитать по ссылкам.
Интересно все вышесказанное в свете того, что в Твиттере пользователь 11tegen11 выложил интересные картинки по итогам осенней части РФПЛ. Вот первая картинка. Здесь по горизонтальной оси показана разница ожидаемых голов за игру (чем правее, тем лучше разница), по вертикальной - "удача", т.е. реализация моментов командой и ее соперниками (чем лучше реализует моменты данная команда и чем хуже ее соперники, тем она выше, детали здесь):
Видим, что "Спартак" по разнице ожидаемых голов идет всего лишь на 7-м месте, но зато очень удачлив.
Вот вторая картинка. По горизонтальной оси показано число нанесенных ударов по воротам соперника, во вертикальной - их качество (среднее xG за один удар):
Видим, что "Спартак" очень много бьет по воротам соперника, но среднее качество ударов низкое. "Зенит" бьет по воротам меньше, но из гораздо более выгодных позиций.
Вот третья картинка. По горизонтальной оси показано число допущенных ударов по своим воротам, во вертикальной - их качество (среднее xG за один удар):
Видим, что "Спартак" мало дает бить по своим воротам, но когда дает, то из очень хороших позиций.
Другими словами, если брать модель xG под авторством 11tegen11, получается, что "Спартак" - это скорее середняк, которому много везет, чем уверенный лидер. Более того, у команды не все получается в атаке (много ударов, но не очень хороших) и не очень надежная оборона (хоть соперники и бьют по воротам "Спартака" редко, но качество этих ударов высокое). Соответственно, если верить этой модели, то "Спартак" занимает не свое место и, если игра команды не улучшится, должен откатиться вниз в таблице.
Получается интересный статистический казус: есть две модели (условно говоря, первая основана на владении мячом, вторая - на ожидаемых голах), которые обычно хорошо предсказывают результаты команды. И необычность нынешнего "Спартака" в том, что он очень хорош, если верить первой модели, но сильно уступает тому же "Зениту", если верить второй.
Мне сложно сказать, чем этот казус вызван, но стоит отметить, что "Ростов", который плохо выглядит в модели xG, второй год показывает достаточно хорошие результаты. Может быть, дело в том, что модель xG не очень применима к России (например, в плохую погоду и на плохих полях удары издали опаснее; или же в России нападающие плохо реализуют "качественные" шансы); может быть, модель xG в целом верна, но отдельные команды/тренеры могут ее "перехитрить" (лучше блокируют удары, лучше выводят своих игроков на удар, лучше готовят вратарей); может быть, модель xG недооценивает "Спартак", потому что судьи не ставят пенальти в ворота соперников (а должны были поставить как минимум 5 или 6, что дало бы прибавку где-то в 0,2 xG за матч), но "Спартак" все равно как-то вырывает победы, несмотря на судейство.
Возможных объяснений много, и я не хочу спорить о том, какая модель лучше и почему. Я склоняюсь к тому, что "Спартак" играет хорошо, и его результаты закономерны, но переубеждать никого не собираюсь.
А вообще, было бы очень интересно спросить Массимо Карреру, как он относится к современной аналитике и, в частности, моделям xG. Даже если нам не нравятся выводы модели 11tegen11, стоит отметить, что на него в Твиттере подписан Унаи Эмери, который в футболе немножко разбирается.
xG модель субъективна, так как опасность удара вещь сложная и субъективная: бьет Месси или бьет Кокорин, прикрыта ли потенциальная траектория удара защитником, кто в воротах и на сколько правильную он занял позицию и т. п. Например гол Глушакова в ворота Амкара был шанс один из ста... Более того есть еще одна деталь: чем больше ты бьешь тем больше шанс, что ты забьешь из не удобной позиции просто по теории вероятности.
Первые матчи очный с Зенитом многое покажут.
Не совсем понимаю, при чем тут смена тренера и изменения тактики. Предпосылка модели xG в том, что сильная команда создает много хороших моментов (но играть при этом она может по-разному); другой вопрос в том, насколько эта предпосылка выполняется. Даже сам 11tegen11 признает, что его модель плохо объясняет игру Ростова. И как раз посыл моего поста в том, что сложно понять, из-за чего модель расходится с реальностью: из-за того, что команде несколько раз повезло, или из-за того, что модель плохо отражает ее игру.
"Более того есть еще одна деталь: чем больше ты бьешь тем больше шанс, что ты забьешь из не удобной позиции просто по теории вероятности." - понятно, что чем больше бьешь, тем больше шанс забить. Но шанс забить после 5 ударов с линии вратарской, как правило, выше, чем шанс забить после 10 ударов с 30 метров.
С другой стороны, возможно, что игроки Спартака оказываются в хороших позициях, но "забывают" бить по воротам (и в этом плане не используют моменты); тогда, действительно, xG будет низким, хотя команда и много атакует.
"Ростов" очень плотно и компактно играет в обороне. Да, команда позволяет сопернику наносить удары по воротам, но как правило эти удары наносятся издали и особо не представляют угроз.. При этом у ростовчан очень высокий КПД. Моментов создают не много, но за счет быстрого выхода из обороны сразу несколькими игроками ( как правило это происходит после перехвата мяча) создается голевой шанс который и реализовывается.. По-моему это и наглядно показывает эта модель...
В качестве сравнения, можно рассмотреть применимо к "Ростову" и положение в графиках "Амкара". Ровно такая же модель игры команды - компактная игра в обороне и резкий переход в атаку. По нанесенным ударам пермяки с ростовчанами одни из последних, только вот реализация у "Амкара" страдает, за счет не очень качественных исполнителей в атаке..
Ну и анализ графиков "Спартака" вполне показывает какую модель футбола он показывал в первой части чемпа.. Много беготни в нападении (соответственно и ударов по воротам) и часто высоким отбором на половине соперника (что не дает командам оппонентов наносить много ударов). А лидерство спартаковцев объясняется тем же большим количеством ударов по воротам соперника. Здесь получается из количества - в качество.
И еще раз: я не утверждаю, что модель xG хороша, мне интересно понять, специально или нет мы под нее не подходим. Например, быть может, Каррера видит, что соперники очень плотно и глубоко играют в обороне конкретно против Спартака, понимает, что близко к воротам подойти не получится, и поэтому просит игроков бить издали. Плотность и глубину обороны соперников модель не учитывает, а это ведь важные факторы.