Альтернатива xG и Packing при оценке и прогнозировании результатов
На данный момент существуют следующие количественные модели оценки и прогнозирования результатов футбольных матчей – модель xG (и тесно связанная с ней модель ожидаемых очков), метрики продвижения мяча (Packing\impect) и более примитивные методы (например, разница по явным голевым моментам или активность в финальной трети поля). У каждой модели свои минусы, коротко о них.
Модель xG.
Критики к этой популярной модели становится все больше, как правило она сводится к 3 типам:
- ошибки операторов при оценке моментов - отсутствие учета давления на бьющего\положение защитников между мячом и воротами (хотя уже есть модели xG, которые это учитывают)- модель не учитывает все, что не заканчивается ударом, то есть значительную часть остроты в атаке – проникающие передачи, закончившиеся фолом\случайностью\травмой и подобное.
Метрики продвижения мяча -Packing\impect.
Packing – это сумма соперников, оказывающихся за линией мяча либо в результате передачи вперёд, либо после удачной обводки. Impect – это разновидность показателя Packing, учитывающая исключительно отрезанных защитников, эта статистика хорошо коррелирует с результатами матчей, до недавнего времени считалось, что в 66% случаев команда победит если она переиграла соперника по Impect. Это серьезная корреляция в мире макро-статистики.
Главный минус этой статистики – молодость, ей 2 года, она еще не проверена спецификой чемпионатов и по-настоящему большими выборками матчей. Коллеги из группы футбольных гиков «Пыльный чердак» с этого сезона обсчитывают вручную все матчи РФПЛ и на выборке 160 матчей процент корреляции стремится к 50, возможно это не предел.
Какая есть альтернатива?
Существует старая система с ключевыми терминами «Передачи в АВП» и «скорость атакующих действий - V а.д.», которая мощно коррелирует с результатами команд:
1) Если V(а.д.). команды «А» больше в конкретном матче V(а.д.) команды «Б», то в 9 случаев из 10 команда « А» не проиграет.
2) В том случае, когда V(а.д). команды «А» выше V(а.д.) команды «Б» на 3 балла, в 8 случаев из 10 обязательно выиграет команда «А»
3) Если у какой-то команды «С» средняя V(а.д). за все игры в круговом турнире выше чем у ее соперников, то в 9 случаев из 10 команда «С» будет победителем соревнования и только несчастный случай может опустить ее на 2-е место.
Эта скорость атакующих действий высчитывается по простой формуле и описывается в книге Павла Черепанова, который работал в научной группе у Бердыева в "Рубине" - книга "Теория и практика в подготовке команды мастеров". Нас интересует в первую очередь глава 3.Немного терминологии. Передачи в АВП - это передачи в активную выгодную позицию. Вот ее полное определение:
"Точная передача сделана в АВП, если одновременно выполняются следующие условия:1) игрок, которому направлена передача, движется на скорости в момент или до передачи мяча,2) в момент приема мяча или при ударе в ворота соперника,3) после приема мяча продолжает движение на скорости в сторону ворот соперника,4) при стандартах первая передача, даже если она в АВП, не учитывается".
Книга содержит множество примеров и расчетов, подтверждающих мощную корреляцию и ценность такой статистики в разные годы, в разных чемпионатах и форматах турниров. Далее приведу вырезки из книги, чтобы коротко передать суть, старался сохранить хронологию и контекст, в скобках мной приведены интересные отсылки:
"Одна из основных тем книги – определение передачи в активную выгоднуюпозицию (передача в АВП), которые рассматриваются в качестве критерияколичественной меры скорости атакующих действий. Известно, что в большинствевидов спорта именно скорость соревновательного упражнения являетсяопределяющим фактором в достижении высокого спортивного результата. На основании модельных показателей передач в АВП появляется возможность построения логической схемы подготовки футбольной команды, основаннойна количественных показателях, что позволяет оценивать соревновательную и учебно-тренировочную работу в удобной для анализа форме.
Таким образом, количественные показатели передач в АВП, выполняемые футболистами в игре на половине поля соперника, рассматриваются в виде своеобразной «футбольной печки», от которой можно «танцевать» в футболе. В книге будет показано, что развитие и совершенствование скорости атакующих действий является главной целью подготовки и по количественной величине этой скорости можно оценивать качество самой игры, если качество игры рассматривать как потребительский продукт. Этот вывод сделан на основе квалиметрии.
Квалиметрия - научная дисциплина, в рамках которой изучаются методология и проблематика комплексной, количественной оценки качества объектов любой природы.Например, программа «Рубина» на 2006-2008 годы, успешно реализована - в 2008 году «Рубин» стал чемпионом России. В 2009 команда повторила этот успех и в 2009- 2010 годах достойно выступала в Европейской лиге чемпионов. В этой связи достаточно вспомнить, что встречаясь четыре раза с «Барселоной», в составе которой играли в то время восемь чемпионов мира, «Рубин» выиграл одну игру, две встречи закончились в ничью и в одну проиграл, разность мячей 4-3 в пользу «Барсы»!
О футболе спорят, его анализируют, делают прогнозы. В тоже время большинство суждений о сборных, о футболе часто построены на эмоциях, в зависимости от результата какой-то игры, а сами суждения, высказывания и анализ построены на качественных оценках: «..это плохо, это хорошо» или «..если бы скорость была выше, то быстрее переходили от обороне к атаке» и т.д. Безусловно, болельщикам такие оценки интересны, но специалистам необходимо строить анализ игровых действий на количественных оценках получаемых в результате наблюдений. Скорость атакующих действий вычисляется по простой математической формуле (скриншот 1).
Например, если команда сделала на половине поля соперника 66 передач в АВП, из них 34 были точными, то скорость атакующих действий была равна 8,7 балла. В свое время слушателям Высшей школы тренеров читал лекции очень интересный человек - доктор педагогических наук, профессор Дмитрий Дмитриевич Донской. Он с большим успехом читал лекции по биомеханике в университетах во многих странах на английском, немецком, французском и итальянском языках! Коньковый ход на лыжах это его изобретение. Когда обсуждался вопрос оценки результатов наблюдений за передачами в АВП, он сказал, что в спорте значение точных действий во много раз, геометрически, важнее, чем их общее количество, остальное предложил додумать самостоятельно. Из приведенной выше формулы видно, что значение точных передач в АВП в геометрической прогрессии важнее, чем их двойное общее количество.
Практика лишь подтвердила емкую, простую и, казалось бы лежащую на поверхности, удивительно логичную подсказку Д.Д. Донского.Пример. Чемпион Мира 2002 команда Бразилии оказалась лучшей не только по результату, но и по показателям определяющим скорость Vа.д. даже среди «победителей»- у Бразилии средний показатель V а.д. равен 9,7, у остальных «победителей» средний показатель V а.д. равен 8,0. Средний процент точности у Бразилии 61%, у остальных «победителей» – 52 %. Следует отметить, что в матче с Турцией на стадии плей-офф Бразилия показала феноменальный результат: точность передач в АВП составила 75 %!!!, этот случай пока единственный в более чем 300 играх, в которых велась регистрация передач в АВП. Как не вспомнить слова известного немецкого тренера Феллера о том, что Бразилия победила на чемпионате Мира 2002 года за счёт высокого уровня мастерства.
В связи с этим есть все основание утверждать, что с помощью критерия - передачи в АВП, можно количественно оценить этот уровень.Становится понятна и ностальгия болельщиков московского «Спартака» по футболу прошлых лет-команда К.Бескова, а затем О.Романцева выполняла в игре 90-95 передач в АВП, при браке не более 35%!Данные по передачам в АВП позволяют оценить ещё один элемент тактики – разнообразие атакующих действий, если при регистрации передач в АВП учитывать игровые ситуации, в которых они применялись.
Наблюдения показали, что такие ситуации можно объединить в пять групп: короткие-средние ( менее 30 метров), длинные (более 30 м), стеночки, стеночки на третьего, положение «двойного выбора». Положение двойного выбора - когда соперник стоит перед дилеммой - либо атаковать игрока владеющего мячом, либо перекрывать игрока, «предлагающего себя» для получения передачи в АВП. Например, при выполнении комбинации «забегание» игрок соперника всегда находится в положении «двойного выбора», рис.7 на скриншоте 2. К этой группе относятся также такие тактические ходы, как комбинации «скрещивание», «пропускание мяча», «скрытый пас», «каблук», при условии, если при их выполнении используется передача в АВП.
Умение дать «острый» пас всегда ценилось в футболе, как признак высокого мастерства. Представляется, что передача в АВП и есть «острый» пас. (А вот и отсылка к недавнему интервью Бердыева, где он говорит, что не согласен с InStat в их интерпретации острых пасов, теперь многим станет понятно, что же он считает острым пасом).
За прошедшее время футбол изменился и изменился значительно, если даже иметь ввиду только показатели по передачам в АВП. Действительно, в 1982 году чемпион СССР команда «Динамо» г. Минск выполняла в отдельных играх до 100 передач в АВП, то сейчас лучшие команды ограничиваются 60-65 такими передачами, причем это характерно не только для российских команд - это мировая тенденция. При этом у клубов показатели по передачам в АВП, в среднем, выше чем у сборных команд. Представляется, снижение показателей передач в АВП произошло из-за того, что различные системы игры с персональной опекой уступили место, причем практически во всех странах, системам «в линию», в которых стало значительно труднее организовать скоростную атаку из-за «компактности» оборонительных порядков и коллективного характера отбора мяча.
Статистика, собранная в разное время показывает, что организация атакующих действий с использованием передач в АВП актуальна при любой системе игры, в разных странах, в отдельных играх, а особенно в продолжительных турнирах. (Стоит понимать, что эта модель была распространена в советской школе тренеров 80х годов, ее по своему интерпретировал не только Лобановский, но и более поздние Газаев с Семиным, забавно, что именно их и приглашали в киевское Динамо в конце нулевых)."
Если кто-то уснул, просыпаемся. Переходим к актуальным событиям. По текущему сезону нет открытых данных по подсчитанным скоростям атакующих действий команд, но такие подсчеты ведутся по ряду «своих» матчей в тренерских штабах Рубина и Локомотива. Знающие люди подсказали, что Локомотив лидер с отрывом по разности скоростей атакующих действий (своя скорость минус допущенная против себя в очных матчах), причем общее количество передач в АВП относительно небольшое, но точность таких передач крайне высокая, что и дает в итоге лидерство с отрывом по скорости атакующих действий. Наиболее популярные группы передач в АВП у команды Семина - положение «двойного выбора» и стеночка на третьего, а также длинные передачи в АВП (следствие контратакующей модели игры Локо).
Таким образом, это единственная модель, которая подкрепляет количественно лидерство Локомотива с отрывом. Подкрепляет убедительно и везение здесь не причем. Это заставляет по новому смотреть на оставшиеся 10 туров.Важно запомнить эту модель, автора книги, термины (хотя-бы 2) и почему это очень важно, мы неоднократно будем возвращаться к этому. Книга небольшая и легко читается, 250 страниц крупным шрифтом с рисунками и большая часть это методы практического использования.
На первый взгляд может показаться, что модель расчетов V(а.д) слишком проста и должна содержать множество коэффициентов, но это не так. Далее я подробно разберу почему поверхностность и простота модели это ее сила, с примерами. Будет меньше текста и больше сути, да. Больше СБГ аналитики в VK.
Спасибо, тем кто не поленился поставить + или подписался на блог.
Не совсем понял один момент: данные есть только по 300 матчам? И из этих 300 матчей выведена корреляция с результатом, которая приведена в начале текста? Если так, то почти все результаты ненадежны. С таким количеством матчей и прайминг-эффектом все, что угодно доказать легко.
Еще одно опасение – как производится сам подсчет? Человек субъективно определяет соответствует ли пас названным условиям? Тогда результаты могут сильно сбиваться outcome bias’ом.
Не поймите мои опасения неверно. Любой показатель, который вскрывает дополнительную сторону игры, заслуживает внимания и изучения. Этот интересный, но пока опасения перевешивают. За текст в любом случае спасибо.
Подсчитывает человек (одного на матч достаточно), конечно от субъективности никуда не деться, но в отличии от ожидаемых голов, тут ошибиться сложнее так как условия просты - двигался до приема мяча? двигался в сторону ворот после приема мяча? и т.д. ... значит передача в АВП. Простота определений ситуаций это на мой взгляд один из плюсов этой модели, частично минимизирует ошибки обсчета.
Спасибо за хорошие вопросы, Вадим!
Фигура профессора Дмитрия Дитриевича Донского, служившего на Донском фронте (ну как же иначе) и ни разу не репрессированным, имея дворянское происхождение, несомненно вымышленная.