Что о футболе знают топ клубы и не знаете вы ? Рассказываем про xG
Предисловие
С развитием технологий по подсчету и анализу статистики стало появляться бесчисленное количество моделей оценки различных аспектов игры с помощью конкретных фактов и данных. Сегодня мы поговорим про, пожалуй, самую распространенную модель, которая используется аналитиками лучших клубов мира для оценки выступления команд и игроков по отдельности. На повестке дня Expected Goals. Также появилось и много доступной информации про xG. Это подхлестнуло интерес к данной модели. Так, прошлой весной издательство The Guardian вышло со статьей про xG на первой странице. Также недавно новостной ресурс BBC опубликовал статью про xG . Наверняка вы видели подобные картинки на футбольных сайтах :
Разбираемся, откуда это все берется на основании методологии xG от Michael Caley.
Expected Goals
Я создал данную модель несколько ранее, и она уже претерпела ряд изменений. Основным способом улучшения своего метода я считаю просмотр большего количества футбольных матчей и последующее обсуждение их с коллегами. Чем больше я вижу процесс создания опасных моментов и их предотвращение, и чем больше я слушаю разбирающихся людей, говорящих про это, тем более эффективно я могу построить свой метод.
Моим основным вопросом на протяжении всего времени работы с этой системой был вопрос : “ Имеет ли это футбольный смысл ?“. Очень просто найти значительный эффект, когда вы делаете регрессии. Но это еще не значит, что это действительная находка для нашей системы. Всегда, когда я искал регрессии отдельных показателей, я прежде всего считал своим долгом заранее удостовериться в непосредственной взаимосвязи отдельных показателей и реального положения дел на поле. Вероятно, это привело к ошибкам в математике. Но я надеюсь, что это также значит, что логика системы может быть передана максимально ясно.
Моей целью было создать минимальное количество формул. Но иногда мне приходилось разделять опасные моменты и создавать различные формулы, но только если это действительно имело футбольный смысл, например, когда моменты имели серьезные отличия между собой. В конце концов я закончил, имея 6 разновидностей ударов и 6 уравнений. Они таковы :
Удары с прямых штрафных ударов
Удары после обводки вратаря
Удары головой после навеса
Удары головой НЕ после навеса
Удары НЕ головой после навеса
Удары НЕ головой НЕ после навеса ( или самые обычные удары )
( Я должен отметить, что понятие “Удар” включает в себя то, что Opta называет “ chances missed “, когда должен был быть удар, но игрок его не нанес по различным причинам и удар не был зарегистрирован. Я включил и подобные моменты тоже.)
Логика распределения их на разные категории состоит в том, что каждый удар имеет разную траекторию, разную зависимость между вероятностью забить гол и дистанцией до ворот, и разный угол между мячом и воротами. Для ударов после навесов угол с воротами не так важен, как для других разновидностей ударов. После навеса сложно плотно ударить по мячу, и поэтому угол не так важен, ведь в большинстве случаев, если вам удалось плотно попасть по мячу после навеса, то скорее всего голкипер уже ничего сделать не сможет независимо от угла. Конечно, даже в данном случае угол с воротами имеет значение, но оно несоизмеримо мало по сравнению со значением других факторов. Удары головой имеют различные траектории в зависимости от дистанции и от того, были ли он совершены после навеса. Намного проще добить головой мяч с нескольких метров после отскока, чем забить с той же дистанции после навеса. Но вот если подобная ситуация произойдет на более значительной дистанции, например, возле 11-метровой отметки, то игроку уже будет недостаточно силы одной только шеи для нанесения опасного удара по воротам после отскока. В это же время при ударе после навеса с 11 метров игрок может использовать естественный импульс мяча для придания мячу большей скорости. В таком случае удар после навеса с 11 метров выглядит куда опаснее удара после отскока с той же дистанции.
После определения этих 6 категорий мы должны приложить к ним и другие факторы.
Угол и дистанция
Это конечно же самое сердце любой xG системы. Забить намного легче, если находишься ближе к воротам и легче забить, когда ты прямо перед воротами, чем когда ты наносишь удар с угла. Но моделирование этих эффектов - своего рода безумие.
Эта диаграмма, показывающая вероятность того, что удар ( не головой и не после навеса ) конвертируется в гол в зависимости от положения на поле.
Вероятность гола в данном случае зависит от двух факторов. Первый - дистанция до ворот, второй - угол с воротами. Быть в 10 метрах от ворот под углом в 45 градусов значительно хуже, чем быть в 10 метрах от ворот под прямым углом к ним. Но здесь есть опаска. Темно красная зона разрастается только по центру перед воротами. Зоны по бокам от ворот очень быстро становятся мало опасными для нанесения удара из них.
Я перепробовал очень много способов создания единой формулы. Но понял, что сделать это невозможно в какой-либо простой манере. Выборка ударов играет большую роль. Игрок, находясь на крайней границе штрафной с боков, примет решение пробить только, если лучших вариантов просто нет. А вот если игрок получит мяч во вратарской и даже если пробить - не лучший вариант, то все равно, скорее всего, далее последует удар. Или, например, если игрок с мячом приближается к воротам под острым углом, то, скорее всего, он попытается отдать пас в центр. Но если, например, вратарь вышел из ворот или никого из игроков в центре нет, то игрок, скорее всего, пробьет. Таким образом, принятие решений игроком является третьим ключевым фактором.
Соответственно, вместо использования одного термина для обозначения дистанции моя формула включает в себя целых пять. А именно : дистанция до ворот, обратная дистанция до ворот, относительный угол до ворот и обратное ему значение, и обратная величина произведения угла и расстояния.
Для подсчета значения относительного угла до ворот, я сравниваю данный удар с ударом под прямым углом к воротам. Другими словами, если игрок, бьющий по мячу, находится на одинаковом расстоянии от обеих штанг, то относительный угол равен 1. А если игрок расположен не по центру, то мы высчитываем его угол к ближайшей штанге. Например, если игрок стоит под углом в 45 градусов к ближайшей штанге, то относительный угол до ворот равен 0.5.
Я обнаружил, что разные комбинации дистанций и углов были необходимы для каждой из шести различных категорий. Именно поэтому я их и разделил.
Далее мы добавим другие факторы. Наибольшей проблемой всех xG систем от Opta является отсутствие данных по позициям защитников. Это ситуация говорит о том, что если защита не оказывает сопротивление атаке, то момент опаснее. И поэтому большинство следующих факторов направлены на определение позиции защитников исходя из отдаленных факторов, ведь конкретных данных о положении защитников нет.
Как был ассистирован удар
В случае с пасом перед ударом это позволит нам смоделировать такую важную вещь как “ устранение защитника “. Мы тут отвечаем на вопрос : “ Может ли удачная передача отрезать защитника из игры и тем самым сделать момент куда более опасным ?”
Я обозначил две самых опасных разновидности ассистов : передачи на ход и передачи в опасной зоне ( передачи внутри штрафной площадки ). Я добавил еще одну особенность - удары после второго ассиста сквозным пасом. Обычно успешный сквозной пас отрезает большое количество игроков защиты, но если в данной комбинации было их аж два, то этот момент невероятно опасен. В таких случаях почти всегда игрок остается один-на-один с вратарем.
Для моделирования “ передач в опасной зоне “ я использовал постоянную систему. Это значит, что чем в лучшей позиции находится игрок, совершающий пас под удар, тем большее значение xG нужно добавить к удару после паса. Подумайте об этом как о факторе “ тики-таки “. Если игрок в хорошей атакующей позиции, тогда защитник должен попытаться предотвратить удар, и если данный игрок сумеет совершить пас, то он как минимум отрежет игроков, которые фокусировались на нем делать следующую передачу. Не всегда хорошая идея, риск потери мяча не всегда оправдан, если игрок и так находится в хорошей позиции для удара по воротам. Но если же все таки пас сделан и сделан успешно, то чаще всего это приводит к более опасным моментам. ( Барселона неудивительно лидирует в списке команд по созданным xG )
Следующие два графика показывают вероятность успешного окончания атаки в зависимости от того, откуда был совершен ассист под удар. Первый график показывает данные о навесах, а второй о пасах.
Далее есть еще две разновидности паса. Первый это срезка ( Катбэк. Когда игрок с фланга совершает передачу в центр, при этом направляя мяч не на ход и не по центру, а немного назад, в район штрафной линии по центру ). Это негативный фактор. Это может вас удивить. Это вовсе не значит, что срезки плохи. Далеко нет. Моменты после срезок это чаще всего удары ногой приблизительно с 18 метров из позиции прямо перед воротами. Это отличный момент! Из подобных ситуаций забивается большинство голов. Вы начинаете с очень высокого уровня опасности при срезках.
Но в плане “отрезания” игроков обороны срезки не очень хороши. Концепция срезки в том, чтобы оставить игрока одногорбым с мячом в районе линии штрафной перед воротами, и далее он может пробить или отдать пас в опасной зоне. Даже при самых лучших исходах, если игрок действительно будет один с мячом на линии штрафной, то как минимум несколько игроков обороны и вратарь будут между ним и воротами. А чаще всего игрок, получивший мяч после срезки в штрафную, не будет абсолютно один, а будет находится под давлением со стороны игрока команды соперника.
Срезки не так уж плохи, но аргументы, приведенные выше, правдивы и имеют смысл. Намного предпочтительнее было бы получить мяч после сквозного паса отрезавшего несколько защитников, но это осуществить намного сложнее. Чаще всего срезка в перспективе намного опаснее навеса, когда мы имеем дело с несколькими защитниками в штрафной.
Еще одной разновидностью паса является излюбленный способ Барселоны доставлять мяч в штрафную. Это пас вдоль линии ворот низом. Данная разновидность паса очень сложна в исполнении, так как велика вероятность перехвата мяча защитником, ведь в подавляющем большинстве случаев в зоне, куда совершается передача, всегда есть игрок линии обороны, способный с легкостью завладеть или вынести из опасной зоны мяч, катящийся по земле. Из этого можно сделать вывод, что если такой легкий для перехвата пас доходит до ног игрока атаки в штрафной, то в данной ситуации линия обороны была плохо организована позиционно, или защитники и вовсе отсутствовали в штрафной на пути мяча.
( Как я уже отметил ранее, удары, совершенные после навесов, очень сильно отличаются и ударов после низких пасов, поэтому я отделил их в отдельную секцию. Когда речь идет о подачах с фланга, то основной проблемой являются даже не защитники, а сложность нанесения акцентированного удара по летящему мячу.)
Тип атакующей игры
Я различаю несколько типов игр, выведенных из имеющихся данных. А именно это : розыгрыш углового (1), штрафной удар (2), контратаки и быстрые прорывы (3), позиционная атака, обусловленная установленным контролем над мячом на чужой трети поля (4) и обычная открытая игра(5).
Угловые удары - это наиболее защищенное положение для проведение атаки в футболе. Даже самые агрессивные команды оставляют в своей штрафной семь или восемь игроков для защиты при стандартных положениях. Это дает негативный эффект на xG после подач угловых. Стандартные положения тоже хорошо защищены, но прервать их намного сложнее, чем обезвредить подачу с углового.
Лучшей в плане xG разновидностью атаки является контратака или быстрый прорыв. Когда вы можете ворваться в свободное пространство на скорости, то вы ставите игроков обороны в некомфортное положение, защитники начинают паниковать и терять позиции, система рушится. Для этого типа построения игры я использую два индикатора. Первый - “ fast break “, как его называют программисты из Opta. Они знают, когда команда на скорости несется по полю, и пишут соответственный код. Это очень полезно. Но Opta очень строга в определении “fast break” - гол Хен Мин Сона в ворота Кристал Пэлас не был отмечен как быстрый прорыв, хоть было очевидно ясно, что это была контратака. Именно поэтому я придумал второй индикатор контратакующего стиля игры. Это действия команды, которые начинаются с возврата мяча и направлены исключительно на продвижение мяча к чужим воротам без излишнего передерживания мяча. Как только я взял в расчет контратаки и быстрые прорывы, “ голая скорость атаки “ перестали иметь какой либо весомый смысл.
Мы не знаем, насколько быстро команда должна двигаться, чтобы оставаться впереди защитной линии. Если защита команды достаточно хорошо организована , чтобы не терять формы, то вам. вероятно, потребуется очень быстро передвигать мяч, скажем 5-7 метров в секунду. Но если обороняющаяся команда уже проиграла позиционно, то даже передвигаясь со скоростью 3-4 метра в секунду, вы сможете достигнуть положительного завершения атаки. В данном случае важно не то, как быстро передвигаются игроки атаки с мячом, а могут ли при этом игроки обороны им что-либо противопоставить.
В конце концов, я обнаружил, что установление контроля над мячем на чужой половине поля несет в себе небольшой положительный эффект. Я принимал за установившийся контроль мяча все атаки, в которых было совершено пять или более успешных предай на чужой половине поля, не прибегая к возвращению мяча назад в линию обороны команды. Подобное доминирование, в конечном итоге, приводит к более опасным моментам, чем могли бы быть при другой игре в атаке.
Другие индикатора давления со стороны защиты
Есть два действительно значительных индикаторы предоставляемых Opta. Первый из них это “значительно опасный момент” (big chance), а именно это момент, при котором ожидается, что игрок с высокой вероятностью забьет. Если быть более конкретными, то примерно 40% значительных опасных моментов в конечном итоге завершаются голом, но это именно те моменты, когда оборона была сломлена. Если опасный момент обозначен как “значительный” (big), значит, давление со стороны защиты практически равно нулю, и игрок имеет отличную возможность для взятия ворот.
Вторым индикатором является “ошибка в обороне” (defensive error). Если удар наносится сразу после ошибки в обороне, то шансы на удачное завершение атаки так же очень высоки. Когда защитники ошибаются и дарят мяч игроку атаки в хорошей позиции ( Opta очень строга в определении “ошибка в обороне”, и чтобы момент был так обозначен, надо чтобы это была действительно большая оплошность), то скорее всего защитники уже не успеют занять нужные позиции и попытаться оказать сопротивление удару.
В обоих случаях я немного скептически отношусь к значимости эффекта. Думаю, кодеры Opta выполняют отличную работу, и я знаю, что их решения всегда перепроверяются. Но мне сложно поверить в то, что не будет смещения результата, например, опасность момента последующего забитому голу не будет переоценена или последующая ошибка в обороне не будет переоценена. Поэтому я решил немного уменьшить значение регрессии, данное для обоих этих факторов.
Следующим важнейшим фактором тут является дриблинг. Успешный дриблинг, по определению, это устранение из игры защитника, который должен был оказать сопротивление игроку с мячом. Игрок, который может создать пространство с помощью дриблинга, имеет более высокую вероятность забить. Далее, я заметил, что дистанция которую игрок пробежал с мячом ( от места получения мяча до места удара ) тоже коррелирует с вероятностью гола. Если вы можете пронести мяч ближе к воротам, значит, защита сыграла плохо, или вы оставили не у дел несколько игроков команды соперника.
Также я включил эффект отскока. Когда удар отражен, но все еще не находится под контролем, или когда удар попадает в каркас ворот, тогда атакующий игрок обычно имеет лучший момент, чтобы забить. Это довольно прямолинейно. ( Во избежание двойного зачета одного момента я добавляю только самый опасный из моментов при одном продолжительном действии. Например, если было несколько ударов после отскока, то команда в итоге не получит больше 1 xG за данную опасность у ворот. )
В конце концов, еще необходимо учитывать статус игры (например, какая команда проигрывает). Состояние игры имеет значимое влияние только для обычных ударов, а для ударов головой, ударов после навеса и штрафных это не имеет значения. И даже для обычных ударов эффект довольно мал, что отражает, по моему мнению, пока неучтенные различия между оказываемым давлением защиты проигрывающей и выигрывающей команды.
Продолжение скоро ...
Источники :
А можно вывод - простыми словами?:)
Не совсем ясно, что входит в chances missed? Если игрок не дотянулся до мяча после навеса, это missed chance? Или здесь только те моменты, в которых игрок лупит мимо мяча (Привет Ерохину в матче Россия-Мексика на КК2017)?