Что ждать от 27-го тура РФПЛ? Версия xG
Пару дней назад Леша Чернов написал с предложением начать новую рубрику – считать возможные xG в предстоящих матчах РФПЛ. По понятным причинам отказать я не мог, и мы взялись за дело, хотя важно понимать, что модель еще достаточно сырая. [nikitarfs]
Описание модели.
1. На длинной дистанции xG коррелирует с реальными исходами матчей
2. Ожидаемые созданные xG i-ой команды в матче против j-ой команды являются средним геометрическим от ожидаемых созданных xG i-ой команды и ожидаемых пропущенных xG j-ой команды.
3. На xG влияет форма команды за последние 5 матчей, причем ближайшие прошедшие матчи имеют более высокий коэффициент.
4. Команда может по-разному набирать очки в домашних и гостевых матчах. Коэффициент выводим, как отношение всех очков в другом статусе за матч разделить на число всех очков. То есть если команда играет дома, то выглядит это так:
Этот же коэффициент также будет стоять перед средним геометрическим, только в данном случае будет считаться уже прямое отношение. То есть, если команда играет дома, то будет браться отношение домашних очков ко всем очкам.
5. xG, созданные в матче с лидером и с аутсайдером имеют разный вес.
Естественно в моделе есть ряд недоработок:
1. Было бы неплохо считать проценты на победу хозяев, победу гостей и ничью, но пока непонятно, как это реализовать.
2. Было бы неплохо оценивать силу команд исходя не просто из числа набранных очков, а используя некоторую нормировку. Скажем, «Динамо» на старте сезона и сейчас – это две разные команды. Есть такой вариант: делить все игры на n групп, по степени удаленности. Скажем, первые несколько туров – одна группа, вторые – другая и т.д. Каждой группе присваивается свой вес (чем ближе к началу чемпионата, тем он ниже), который затем используется в виде коэффициента. Проблема в том, что это слишком энергозатратно.
3. Было бы неплохо подцепить к оценке силы команд не только их очки, но и их xG по ходу сезона. Задача, которая решается проще всего – достаточно посчитать xG за первые 20 туров.
[nikitarfs].
Расчеты для ближайшего тур
«Крылья Советов» – «Уфа»
Ожидаемые xG: 1,21 - 0,67
Последние матчи самарцев получились относительно качественными, чего не скажешь об уфимцах – 5 проигрышей по xG в 5 матчах. При этом, подопечных Перевертайло отличает неплохая реализация – они вполне способны сделать гол из единственного момента, поэтому победа «Крыльев» совсем не очевидна.
«Ростов» – «Локомотив»
Ожидаемые xG: 1,15 - 0,64
Несмотря на поражение от Мордовии, ростовчане сейчас на ходу, что нельзя сказать о железнодорожниках, уступавших по xG в последних трех матчах. Также хорошим подспорьем для дончан будут родные стены, впрочем, и Локо играет в гостях ничуть не хуже, чем дома. Логичным прогнозом на матч будет ничья или победа желто-синих с разницей в один мяч.
«ЦСКА» – «Терек»
Ожидаемые xG: 1,59 - 0,54
В четырех последних матчах армейцы уверенно переигрывали своих оппонентов - и в этот раз забуксовавшие грозненцы вряд ли окажутся непреодолимым препятствием для команды Слуцкого.
«Анжи» – «Зенит»
Ожидаемые xG: 0,93 - 1,39
В этой паре такое низкое предполагаемое преимущество петербуржцев связано с тем, что только в последних двух матчах оборона сине-бело-голубых не позволила создать много моментов у своих ворот, тогда как до этого провела несколько не самых уверенных игр. Анжи тяжело выглядел в матче с Краснодаром, но до этого неплохо смотрелся в матчах против соперников в борьбе за выживание.
«Кубань» – «Мордовия»
Ожидаемые xG: 1,88 - 1,30
Несмотря на то, что форма у Кубани еще хуже, чем у Мордовии, южанам сильно помогают родные стены, в то время как саранцы в гостях являются лишь бледной копией самих себя домашнего образца. Ожидаем небольшое преимущество краснодарцев с обилием голевых моментов.
«Рубин» – «Краснодар»
Ожидаемые xG: 0,87 - 1,05
Казанцы провели несколько неплохих с точки зрения xG матчей, команда Галицкого тоже уверенно прошлась по уступающим классом соперникам. Только вот с реализацией у Краснодара полный порядок, чего нельзя сказать о Рубине.
«Амкар» – «Урал»
Ожидаемые xG: 1,23 - 0,75
Находящемуся в плачевной форме Уралу придется тяжело в Перми. Амкар хоть и не блещет, но и не проваливается так, как шмели в матче с армейцами. При адекватной реализации можно ожидать непроигрыш пермяков.
«Спартак» – «Динамо»
Ожидаемые xG: 1,62 - 1,2
Хорошую игру в обороне спартаковцы показали только в последнем матче, поэтому, согласно модели, бело-голубые вполне могут рассчитывать на забитый мяч. Не стоит забывать и про не слишком уверенную игру красно-белых на своем новом стадионе. Впрочем, глядя на нынешнее Динамо и разыгравшихся игроков атакующей группы Спартака, можно ожидать, что хозяева создадут больше моментов у чужих ворот.
А почему силу соперника тоже нельзя оценивать во временном окне, вообще забыв про начало сезона? Что-нибудь типа количество очков в предыдущих 5 матчах? Ведь ситуация как у Динамо может быть и обратную сторону (см Лестер прошлого сезона).
И ещё такой вопрос: а какой-нибудь тест модели вы проводили? Или просто интуитивно исходя из написанных соображений её конструировали? Ведь параметры типа временного окна можно пытаться подбирать, чем 5 лучше, чем 3, например?
Вы уж простите, но для меня эти расчеты в первую очередь - предсказание счета матча.
Про начало сезона забывать все же не стоит, потому что возможна ситуация, когда команда в начале всех мочила, потом пошли травмы и следственно спад. А теперь все травмированные восстановились. Нельзя же силу этой команды оценивать на основании только последних игр ослабленным составом, верно?
На самом деле, я даже не представляю себе, как можно определить, какое окно лучше (для достоверного простого сравнения точности моделей нужно слишком много накопленных данных)
Все равно спасибо за отзыв - больше фидбэка - больше мотивации заниматься этим делом.
так что насчет перехода к усложненным xg моделькам, ждать?