Как «Фиорентина» провела первые девять туров: сухие цифры
В этот сезон «фиалки» оставляют очень неоднозначное впечатление: несмотря на, казалось бы, приемлемый промежуточный результат (шестое место в таблице) и неплохую по именам трансферную кампанию, создаётся впечатление, что команда могла набрать больше очков и оказаться выше, а ряд игроков (в частности, Симеоне и Пьяца) — оправдать высокие ожидания.
Совпадают ли наши ощущения с объективной реальностью? Это мы и решили проверить при помощи статистических данных и математических моделей.
Немного о данных, методе и погрешности выводов
Данные для анализа были взяты с ресурса understat.com. Таким образом, под рассмотрение попали все девять матчей Серии А, которые успела провести «Фиорентина». Достаточно ли их для того, чтобы делать надёжные выводы о том, насколько хорошо выступит в сезоне команда в целом и отдельные игроки в частности? Разумеется, нет. Можно ли наметить с их помощью тенденции в игре и попытаться оценить то, как провели стартовый отрезок чемпионата игроки? Вполне себе.
Одна из главных используемых метрик — Expected Goals (xG). Её цель — оценить опасность ударов, которые наносит команда/игрок по воротам соперника. Как она отличает опасный удар от неопасного? По ряду параметров: по позиции бьющего относительно ворот, части тела, которой наносится удар, близости к бьющему игроков соперника и т. п. Ниже — иллюстрация того, как позиция, из которой наносится удар, влияет на вероятность забить гол (красный — высокая вероятность, синий — низкая).
В чём нам может помочь метрика xG? Она позволит проанализировать качество создаваемых моментов и заглянуть дальше счёта на табло, предугадывая, каким он мог бы быть при прочих равных.
Турнирная таблица
Для начала предлагаем взглянуть на таблицу и посмотреть, насколько справедлива текущая позиция «Фиорентины» в ней:
Выборочная легенда таблицы: G — забитые голы, GA — пропущенные голы, PTS — очки, xG — величина ожидаемых забитых голов, xGA — величина ожидаемых пропущенных голов, xPTS — величина ожидаемых набранных очков.
Что мы можем увидеть из этих данных? Во-первых, то, что «Фиорентина» забила больше и пропустила меньше, чем должна была бы, но при этом набрала меньше очков, чем ожидалось. Как вообще такое возможно? Для ответа на этот вопрос нам необходимо спуститься на уровень ниже и посмотреть непосредственно на анализируемые показатели в отдельных матчах «фиалок».
Забитые голы
Как мы видим, основной вклад в негативную дельту между забитыми мячами и их ожидаемым значением вносит матч против «Кьево»: если исключить его из выборки, то разница сразу же станет положительной. Данный случай — наглядная демонстрация того, как отдельный выброс может исказить итоговое значение при маленькой выборке анализируемых данных.
Что касается вопроса о том, почему в матче с «Кьево» «Фиорентина» забила сильно больше ожидаемого, то здесь сильно повлияли голы:
Николы Миленковича из-за пределов штрафной (1-0, оценён в 0,01 xG в связи с расстоянием до ворот):
Джованни Симеоне (3-0, оценён в 0,06 xG в связи с тем, что удар был нанесён головой):
Марко Бенасси (5-0, оценён в 0,09 xG в связи с тем, что удар был нанесён левой ногой (нерабочей) с угла штрафной площади; кроме того, удар мог быть накрыт защитником):
Приведённый выше анализ позволяет сделать вывод о том, что наибольший вес для модели имеют удары, наносящиеся рабочей ногой с игры из выгодных положений (зона перед штрафной). В целом это коррелирует с реальностью, однако опять же не стоит забывать о том, что адекватность результатов сильно зависит от размера выборки.
Пропущенные голы
Отрицательную дельту между пропущенными голами и их ожидаемой величиной обеспечивают матчи против СПАЛ и «Аталанты». Как провела эти встречи «Фиорентина»?
Против СПАЛ:
Существенное превосходство по величине ожидаемых голов (1 балл — это очень существенная разница, в большинстве случаев такие матчи заканчиваются победами доминирующей стороны), существенное превосходство по количеству ударов (синими отмечены удары «фиалок», жёлтым — удары соперника). Главный момент СПАЛА (самая крупная жёлтая отметка), принёсший 0,42 xG, — это удар головой Микро Антенуччи. Итог: в данном матче «недобор» «Фиорентиной» пропущенных голов не повлиял на итоговый результат.
Против «Аталанты»:
Здесь ситуация несколько иная: преимущество по xG не так велико, чтобы гарантировать команде победу в большинстве случаев, а по ударам «Аталанта» и вовсе превзошла «Фиорентину» (17 против 7). Тем не менее, необходимо заметить, что большинство ударов бергамасков не представляли серьёзной опасности, так как были заблокированы или нанесены из-за пределов штрафной. Итог: победа «Фиорентины» всё равно была наиболее вероятным исходом (47% по оценке модели), однако этот матч вполне мог закончиться и ничьей (с вероятность в 34%).
Набранные очки
Согласно показателя дельты между набранными очками и их ожидаемой величиной, отдельного внимания заслуживают матчи против «Сампдории», «Интера» и «Аталанты». Матч с бергамасками уже был разобран в предыдущем разделе, потому можно лишь сказать о том, что в матче против «богини» «Фиорентина», скорее всего, должна была набрать одно очко вместо трёх. Что касается матчей с «Интером» и «Аталантой», то здесь всё интереснее.
Против «Интера»:
Как мы видим, преимущество «нерадзурри» по xG совершенно незначительно, а количество ударов примерно одинаковое (13 против 16 в пользу «фиалок»). По количеству действительно опасных ударов команды также оказались равны: «Интер» реализовал оба своих момента (пенальти Икарди и удар Д'Амброзио), «Фиорентина» же оба упустила (удар Кьезы был отражён Хандановичем, удар Бенасси — заблокирован). Судя по всему, ничья действительно стала бы гораздо более справедливым итогом. Это подтверждает и близкое к равномерному распределение вероятностей исходов: 38% у победы «Интера», 34% — у «Фиорентины», 28% — ничейный результат.
Против «Сампдории»:
Карта говорит сама за себя, разрыв между командами по xG трактуется однозначно. Из трёх моментов «фиалки» использовали лишь один: отличился Кристиано Бираги; Джованни Симеоне загубил свой момент после углового (самая большая жёлтая точка), а затем не смог забить из оптимальной позиции с игры (вторая по величине круглая точка). Модель оценила вероятность победы «Фиорентины» в этом матче в 71%; думаю, мы тоже можем сделать вывод о том, что в данной игре «фиалки» недосчитались двух очков.
Таким образом, можно утверждать, что в рассмотренных трёх матчах «Фиорентина» должна была брать на одно очко больше: ничья с «Интером» добавила бы одно очко, ничейный результат с«Аталантой» отнял бы два очка, а победа над«Сампдорией» вместо ничьей принесла бы ещё два очка; итого +1 балл.
Турнирная таблица по ожидаемым набранным очкам
Если бы всё было «справедливо», то сейчас «Фиорентина» могла бы идти четвёртой, xG добавили ещё 0,82 балла к нашим расчётам выше. Впрочем, надо заметить, что «фиалки» показывают примерно тот результат, который заслужили игрой: разницу в 1,82 очка между ожидаемым и реальным после девяти туров вполне можно назвать незначительной. Особенно по сравнению с результатами других команд: так, к примеру, «Аталанта» и «Эмполи» недосчитались 5,63 и 6,91 очков соответственно, а «Парма» и «Дженоа» обогатились на 5,85 и 4,41 балла. Повод ли это ждать в следующих турах от вышеперечисленных команд изменений в динамике набора очков и места в турнирной таблице? Отчасти да, но всё же не совсем: вновь необходимо напомнить о том, что статистические модели идеально работают только на больших выборках данных, т. е. если бы чемпионат состоял из 50 туров и более, то реальное распределение мест почти всегда бы совпадало с ожидаемым.
Как там Симеоне с Пьяцой?
Для анализа были отобраны лишь те игроки, кто провёл на поле хотя бы 360 минут (4 полных матча).
Симеоне на удивление мало бьёт для центрального нападающего — 1,63 удара в пересчёте на 90 минут, лишь четвёртый результат в команде. Джованни по этому показателю уступает не только Кьезе, но и Бенасси с Пьяцей. Такие данные могут свидетельствовать о том, что партнёры плохо выводят Симеоне на удар или сам игрок не очень хорошо двигается/открывается под партнёров и/или использует дриблинг для того, чтобы создавать моменты для себя самого.
Помимо вышеназванного наблюдения сказать о Симеоне что-то ещё пока, к сожалению, нельзя: выборка ударов слишком мала, чтобы сказать, что у форварда проблемы с реализацией моментов, но не забитые в матче с «Сампдорией» мячи однозначно повлияли на промежуточный результат команды и добавили негатива в отношении игрока со стороны болельщиков.
Что касается Пьяцы, то данные также не дают сделать каких-либо однозначных выводов: игрок довольно часто выходит на поле (те же 9 матчей, что у Симеоне), но сыгранных минут у Марко меньше, чем у любого другого игрока в выборке. По сравнению с Симеоне Пьяца в среднем больше бьёт и отдаёт больше пасов под удар, однако это может быть объяснено тем, что Марко обычно выходит с замены в ситуациях, когда команде необходимо активно создавать моменты.
Подводя итог, по игрокам можно сказать лишь одно: на данный момент их восприятие очень сильно искажается единичными, но очень неудачными матчами. Лишь дальнейшие выступления позволят сделать вывод о том, насколько хорошо/плохо выступают игроки.
Источники: understat.com, facebook.com/acffiorentina, www.futbologika.com
С прошлого сезона Симеоне оставил интригу по поводу своего прогресса... пока действительно не совсем ясная картина, но шансы стать настоящей звездой еще никуда не делись. Удачи фиалкам!
Что касается Симеоне, то сейчас основную интригу по поводу прогресса оставляет Бираги, на мой взгляд: от него вообще никто ничего не ожидал, а он внезапно для многих дорос до сборной (пусть и не от хорошей жизни) и не собирается останавливаться.