27 мин.

Иан Грэм, «Как выиграть Премьер-лигу». Как работает футбол: 9. Отслеживай своего игрока

ЧАСТЬ ПЕРВАЯ: ДОРОГА НА «ЭНФИЛД»

ЧАСТЬ ВТОРАЯ: КАК РАБОТАЕТ ФУТБОЛ

ЧАСТЬ ТРЕТЬЯ: БОЛЬШЕ ЧЕМ ИГРА

Заключение

Благодарности

9. Отслеживай своего игрока

В футболе время и пространство — одно и то же.

Грэм Тейлор

Семьдесят семь метров

Директорская ложа на «Энфилде» — обычно более спокойное место для просмотра игры, чем главная трибуна. Я пережил только один случай в ложе, когда все пришли в неистовство: мерсисайдское дерби 2018 года. Когда в компенсированное время была ничья, болельщики «Эвертона» зажгли синие факелы, чтобы отпраздновать свою победу со счетом 0:0. Но на последних секундах ошибка вратаря «Эвертона» позволила Дивоку Ориги забить победный мяч. Не только бригада ребят с сэндвичами с креветками (в том числе и я) позволила эмоциям взять верх над собой: Юрген Клопп тоже был в эйфории и выбежал на поле, чтобы отпраздновать победу с нашим вратарем Алиссоном в центральном круге. Это была дорогая победа — позже Футбольная ассоциация оштрафовала его на £8 тыс. за неподобающее поведение.

После каждой игры мы подсчитываем физическую статистику каждого игрока — как далеко он пробежал, сколько ускорений сделал и так далее. Но после игры с «Эвертоном» в командном листе появилось еще одно имя: Юрген Клопп. Во время празднования он пробежал 77 метров, 8 из них — со спринтерской скоростью. Он развил максимальную скорость 26 км/ч, что превышает максимальную скорость Алиссона в этом матче. Наши полузащитники преодолели за игру более 11 километров каждый, а нападающие развили скорость свыше 32 км/ч. Но для 51-летнего человека физическая работоспособность Юргена была достойна восхищения.

Данные были собраны с помощью видеокамеры, установленной на козлах трибуны «Сэр Кенни Далглиш». Камеры расположены достаточно высоко, чтобы охватить все поле сразу. Записанное видео попадает в алгоритм, который преобразует его в «оптические данные слежения»: «оптические» — потому что источником является видео, а «данные слежения» — потому что они отслеживают местоположение игроков. Местоположение всех 22 игроков и мяча записывается каждые 40 миллисекунд. Название этой технологии — компьютерное зрение. Аналогичные алгоритмы распознают лица и иностранный текст для перевода на вашем смартфоне. Преобразование видео в данные — задача не из легких: алгоритм должен определить, где находятся белые линии поля, где находятся игроки, и определить, кто из них кто. Иногда для очистки данных требуется ручное вмешательство — например, если запасной игрок разминается вблизи боковой линии, он может быть случайно записан как дополнительный игрок. То же самое касается менеджера, который выбежал на поле до конца игры. Усилия, затраченные на создание технологии и алгоритмов, необходимых для данных отслеживания, оправдали себя: они привели к значительному улучшению того, как мы анализируем игру.

Кто-нибудь рассказал клубам?

В 2013 году мне позвонил Дэвид Вудфайн — Вуди, который в то время возглавлял отдел анализа эффективности в «Вест Хэме». Он спросил, слышал ли я о сделке по предоставлению данных об отслеживании данных в Премьер-лиге. Я не слышал. Он, как и аналитики многих других клубов, был разочарован данными, которые были доступны клубам. Каждый клуб должен был самостоятельно искать поставщика и получать данные только о своих играх. Данные по выездным матчам были доступны только в том случае, если на выездном стадионе были установлены камеры того же поставщика. Крупнейшим поставщиком была компания Prozone, которая существовала с 1990-х годов и дала многим из нынешних футбольных руководителей их первую работу. К 2013 году многие клубы были недовольны услугами Prozone — цены продолжали расти, была доступна только сводная статистика, а исходные позиционные данные не предоставлялись.

Обычно сотрудники клуба просто ворчали между собой по поводу плохого предоставления данных. Но Вуди встретился с главой информационной службы Премьер-лиги Полом Горналом и рассказал ему о недовольстве клубов. Пол удивил Вуди, сообщив ему, что Премьер-лига уже изучает идею сбора данных для всей лиги и собирается заключить договор с поставщиком, компанией ChyronHego. Это была отличная новость, но Вуди был немного озадачен — как получилось, что Премьер-лига не сообщила клубам о своих планах по сбору данных? Лига увидела коммерческие возможности данных отслеживания, но влияние, которое они могут оказать на клубы, было упущено из виду.

Вуди начал лоббистскую кампанию, чтобы сделать данные отслеживания доступными для клубов, и я стал его первым рекрутом. Получение бесплатных данных отслеживания существенно повлияло бы на бюджет каждого клуба, занимающегося анализом эффективности, поэтому недостатка в аналитиках, готовых присоединиться к кампании Вуди, не было. Со своей стороны, я настаивал на том, что доступ к исходным данным должен быть включен в соглашение с лигой. В течение многих лет компания Prozone была хранителем данных об отслеживании и не хотела делиться ими с кем бы то ни было. Революция данных в футболе могла бы произойти на много лет раньше, если бы не протекционизм Prozone. Билл Джеймс предупреждал нас с Эдди о блюстителях — в бейсболе в 1980-х годах существовала подобная монополия, и компания, обладавшая монополией, прилагала все усилия, чтобы сохранить свои данные в тайне. Билл сказал, что одна из самых важных вещей, которую он сделал — это разрушение монополии, которая была барьером на пути прогресса. Если бы Премьер-лига предоставила клубам исходные данные отслеживания, это разрушило бы монополию Prozone.

Вуди собрал единомышленников — аналитиков из «Ливерпуля», «Эвертона», «Астон Виллы», «Челси», «Манчестер Сити» и «Арсенала». Премьер-лига согласилась, чтобы клубы имели доступ к данным отслеживания, но в первом сезоне, 2014/15, каждый клуб мог получить доступ только к своим играм. Мне было интересно посмотреть на данные остальных лиг — без этого наши данные были не слишком полезны, разве что для анализа физических нагрузок наших игроков. С тактической точки зрения мы можем анализировать свои выступления, но наша игра зависит от игры соперника. И мы не можем много сказать о сопернике, не видя, как он выступает в других матчах.

Клубы, участвовавшие в крестовом походе Вуди, согласились с принципом разделения и снова пролоббировали его в лиге. Премьер-лига впервые созвала собрание аналитиков, отчасти для того, чтобы обсудить планы по использованию новых данных отслеживания. Он проходил в один из дней в отеле «Шерлок Холмс» на Бейкер-стрит. Зал заседаний находился в подвале, а кондиционер был либо неисправен, либо вообще отсутствовал. В душной атмосфере я поднял идею обмена данными. Было много сопротивления — в основном со стороны небольших клубов. Они объясняли это тем, что у них нет возможности использовать данные самостоятельно. Они заявили, что им не выгодно делиться информацией, в то время как более дальновидным клубам наоборот.

В конце концов лига согласилась с тем, что семь клубов, желающих обмениваться данными, могут обмениваться между собой всеми играми с участием одной из семи команд. Это стало ключом к обеспечению полноценного обмена данными. На следующей встрече мы отметили, что у семи делящихся клубов есть данные по 14 матчам каждой команды Премьер-лиги и по всем 38 матчам группы обмена. При этом неакционеры могли видеть только свои собственные игры. Те, кто не делился, уступили, и в 2016 году мы наконец договорились, что каждая команда сможет получить доступ к данным всех 380 матчей Премьер-лиги.

Сделки по обмену игроками

Официальные данные отслеживания Премьер-лиги стартовали не лучшим образом. Чтобы изучить полученные данные, мой коллега Тим Васкетт разработал программу для их визуализации. На экране компьютера мы могли видеть анимацию всех игроков, перемещающихся по полю с высоты птичьего полета, как в старых видеоиграх Football Manager. Иногда игроки оказывались в странных позициях: защитник оказывался там, где должен был быть нападающий, и наоборот. Проблема заключалась в том, что личности игроков менялись местами. Когда игроки пересекались друг с другом, алгоритм компьютерного зрения иногда путался в том, кто есть кто. Больше всего путаницы возникало при таких ситуациях, как угловые, где многие игроки находились в непосредственной близости друг от друга. Мы также получили данные по отслеживанию всех матчей УЕФА, но до 2021 года УЕФА не осуществляла никакого контроля качества, поэтому мы не могли им доверять. Игроки иногда исчезали на полсекунды, а затем волшебным образом появлялись вновь. В одной из игр Джеймс Милнер подал угловой и, если верить данным, застрял на угловом флажке на следующие семь минут.

Мы могли проверить качество данных отслеживания, поскольку у нас также были данные о событиях, происходящих с мячом. Тим синхронизировал события на мяче с данными слежения. Если данные на мяче говорят, что Фабиньо делает пас в центре полузащиты, а данные по отслеживанию говорят, что Фабиньо находится на позиции левого защитника, значит, кто-то допустил ошибку. Для Тима синхронизация была сложной задачей, поскольку время передачи данных о событиях было точным с точностью до пары секунд, а местоположение — с точностью до пары метров. Другая проблема заключалась в том, что сами данные отслеживания не содержали никаких «событий», только местоположение игроков и мяча. Нам нужно было придумать метод, позволяющий определить, произошло ли событие. Для этого Тим свел игру в футбол к набору скоростей и ускорений. Если мяч быстро ускорялся в сторону от игрока, то, скорее всего, была сделана передача. Если мяч быстро замедлился рядом с игроком, это, скорее всего, был прием паса. Если мяч внезапно менял направление, это был удар головой или пас в одно касание. Некоторые события было сложнее обнаружить: фолы и подкаты не всегда сопровождались заметными движениями мяча. Тем не менее, в конечном итоге Тим смог сопоставить подавляющее большинство событий на мяче с точным моментом их возникновения в данных отслеживания.

Боже, мог бы и сам додуматься

По-настоящему важный аспект данных отслеживания — тактический: мы можем видеть движения игроков без мяча. Наша модель Ценность владения работала хорошо, но мы знали, что вероятности гола, которые мы приписывали различным состояниям игры, были лишь приблизительными. Владение мячом в атакующей полузащите против обороны — это совсем другое, чем владение мячом в том же месте, когда нападающий прорывается в большой промежуток между двумя защитниками. Благодаря данным отслеживания мы можем повысить точность оценки вероятности забития гола. Но новые данные оказались как проклятием, так и благословением. Они были громоздкими, ими было сложно управлять и из них трудно извлекать полезные сведения. Нужна была более сложная модель, создание которой потребовало бы много работы.

Opta Forum стал первой регулярной конференцией по футбольной аналитике в Великобритании. Все началось в 2014 году в пыльном лекционном зале в подвале университета Биркбек в лондонском районе Блумсбери. Идея конференции заключалась в том, чтобы предоставить данные любому, у кого есть достаточно хорошая идея для их анализа. К 2017 году форум разросся в геометрической прогрессии. Биркбек был уже недостаточно велик, и мы переехали в шикарное помещение напротив вокзала Юстон. Я сел рядом с главным скаутом «Ливерпуля» Барри Хантером, чтобы послушать доклад под названием «Моделирование вероятности передачи в футболе на основе физики», который делал американец Уилл Спирман. Уилл начал объяснять свой подход к расчету шансов на успешный пас. Игрок должен уметь перехватить траекторию полета мяча, и ему нужно время, чтобы принять мяч — чем быстрее движется мяч, тем меньше шансов, что игрок сможет его усмирить. Для футбольной публики разговор был немного перегружен математикой. Через 10 минут Барри наклонился ко мне и прошептал: «Мне кажется, он теряет аудиторию». Я ответил: «Меня не волнует аудитория. Я думаю, это великолепно».

Презентация Уилла в 2017 году и его презентация в 2016 году стали первыми случаями, когда я увидел, что кто-то делает что-то разумное с данными отслеживания. Его подход — это футбол, основанный на первых принципах: он использовал идеи о контроле игроками пространства и времени, необходимом для того, чтобы сделать и получить передачу, что интуитивно объясняло, как работает футбол. Одна из его статей открывалась так: «Как мы можем оценить ценность игрока, стоящего без опеки у дальней штанги и ожидающего передачи, которая так и не приходит?» Это была именно та работа, в которой можно было использовать возможности отслеживания данных. В 2018 году я нанял Уилла, чтобы он создал для «Ливерпуля» новую версию Ценности владения на основе данных отслеживания.

Управление полем

Основной идеей, лежащей в основе работы Уилла, была концепция под названием «Управление полем». Это до смешного простая идея, которую можно кратко изложить так: «Если вы можете достичь определенного места на поле раньше других, значит, вы его контролируете». Это уже многое говорит о футболе. Подумайте о матче с двумя игроками, каждый из которых находится на своей половине на краю центрального круга. В этой ситуации каждый игрок контролирует свою половину, потому что он находится ближе к каждой точке на своей половине, чем его соперник. Но, как сказал Грэм Тейлор: «В футболе время и пространство — одно и то же». Мы должны заботиться о том, кто быстрее доберется до мяча, а не о том, кто ближе к мячу. В нашей односторонней игре, если один из игроков может ускориться быстрее своего оппонента, он сможет быстрее добраться до линии центра поля и таким образом контролировать немного половины поля соперника. Контроль поля естественным образом включает в себя физические возможности игроков: чем вы быстрее, тем большую часть поля вы контролируете.

Чтобы контролировать большее пространство на поле, даже не нужно быть быстрее, достаточно быть в движении. Если вы находитесь на том же расстоянии от мяча, что и ваш соперник, и обладаете теми же физическими возможностями, что и он, вы добежите до мяча первым, если вы уже бежите к мячу, а соперник неподвижен. Если вы прибежите первыми, то получите чуть больше контроля поля. И наоборот, если вы бежали не к мячу, а от него, и вам пришлось замедлиться, развернуться и начать бежать к нему, первым вы не успеете.

Основные принципы Контроля поля позволили нам математически понять игру так же, как ее интуитивно понимают профессиональные футболисты. Нападающий, пробивающийся из-за спин и между двумя неподвижными защитниками, временно контролирует часть пространства за линией обороны. Если пространство между двумя защитниками слишком велико, нападающий может контролировать часть пространства позади них, даже не делая забегания вперед. Точно так же, как игроки контролируют больше пространства перед собой во время забега, они контролируют меньше пространства позади себя. Лионель Месси — мастер украсть пространство за спинами защитников. Во время быстрой атаки защитники устремляются назад к своим воротам, чтобы закрыть опасное пространство вблизи ворот. Месси, без мяча, часто следует в нескольких метрах позади защитников, но останавливается раньше, чем защитники. Защитники только что освободили позицию, на которой сейчас стоит Месси, имея достаточно пространства для получения паса. Замедление может быть так же важно, как и ускорение.

Еще один важный компонент Контроля поля — неопределенность. Первый компонент неопределенности — это время: длинному забросу, пущенному по воздуху, требуется время, чтобы добраться до места назначения. К тому времени, когда мяч приземлится, многие игроки успеют с ним сблизиться. Часто после длинных передач ни одна из команд не может полностью контролировать ситуацию. Вместо этого они борются за контроль. Контроль поля стал неопределенным, и шансы каждой команды на контроль мяча зависят от того, сколько игроков успеют вовремя добраться до места назначения. Второй компонент неопределенности — контроль мяча. Одно дело, когда ты можешь первым добраться до заданного места, но совсем другое — контролировать пас, ведущий к этому месту. После передачи мяча шансы принимающего взять его под контроль зависят от того, как быстро движется мяч и как быстро должен двигаться принимающий, чтобы его контролировать. Игрокам нужно немного времени, чтобы взять мяч под контроль, поэтому при быстрых передачах или при стремлении игроков оказаться на другом конце паса есть сомнения в том, что они смогут его контролировать.

Есть и третий компонент неопределенности: незнание. Имея данные отслеживания, очень соблазнительно думать, что мы знаем все о состоянии игры. В конце концов, мы можем видеть местоположение каждого игрока каждые 40 миллисекунд. Но мы еще многого не знаем. Игрок может быть усталым, травмированным или просто не очень стараться — возможно, он не контролирует большую часть поля, как нам кажется. Игрок может находиться не лицом к мячу — ему может потребоваться секунда или две, чтобы понять, что пас сделан. Или же игрок может просто медленно реагировать на изменение игровой ситуации, или лежать на земле с травмой и не иметь возможности куда-то бежать. Также имеет место незнание тактики. Защитник, который в принципе может получить пас на правом фланге, может не осмелиться выйти за линию штрафной, если он играет у такого оборонительного тренера, как Тони Пьюлис. Это незнание отражается в том, что Контроль поля является скорее вероятностным, чем детерминированным. Если игрок в принципе может добраться до мяча на полсекунды быстрее, чем его соперник, Контроль поля не будет предсказывать, что он обязательно будет контролировать мяч. Вместо этого можно с вероятностью 70% предсказать, что он будет контролировать мяч. В остальных 30% случаев один из множества факторов, о которых мы не знаем, может привести к тому, что его будет контролировать соперник.

Все эти неопределенности необходимо было учесть при построении модели Контроля поля. Каждый элемент усложняет модель, и мы должны быть уверены, что дополнительная сложность того стоит — чем сложнее модель, тем лучше должны быть ее прогнозы. Прелесть Контроля поля в том, что каждый дополнительный элемент сложности, который мы добавляем, имеет интуитивное объяснение в футбольных терминах.

Включение максимальной скорости и ускорения отдельных игроков в нашу модель Контроля поля усложняет задачу, но интуитивно понятно, что если вы можете обогнать соперника, то будете контролировать большую часть поля, чем он. Увеличение времени полета мяча приводит к менее определенному Контролю поля, или, другими словами, к большему количеству ситуаций 50 на 50 при длинных передачах. Это как нельзя лучше описывает игру с длинным забросом мяча. С помощью длинного паса по воздуху вы можете быстрее перевести мяч на поле, но цена, которую вы обычно платите за это — меньший контроль. Однако далекие пасы по воздуху не всегда означают меньший контроль. В ситуации контратаки, когда наши игроки бегут вверх по полю, а соперник остается на нашей половине, мы можем получить лучшее из двух миров: мяч быстро перемещается на половину поля соперника и находится под нашим контролем.

К сложности «контроля мяча» добавляется понятие «касание». Игроку с хорошим касанием требуется меньше времени и пространства для контроля мяча, чем обычному игроку. По-другому можно сказать, что игроки с хорошим касанием имеют вокруг себя небольшое силовое поле с большим Контролем поля. Контроль мяча также подчеркивает разницу между атакой и защитой. Защитники часто не заботятся о том, чтобы взять мяч под контроль — любое касание, которое отбирает мяч у соперника, является хорошим касанием. В перегруженных зонах защитники имеют немного больше возможностей для Контроля поля, чем нападающие, потому что им не нужно столь же бережно относиться к мячу. Когда болельщики думают о лучших игроках, они, как правило, вспоминают игроков «касания» — Пеле, Кройффа, Марадону, Месси. Игроки касания также, как правило, очень дороги. Если у вас ограниченный бюджет, вы, скорее всего, не сможете их себе позволить. Ваша тактика при игре против них может быть сосредоточена на ограничении их влияния. И самым простым способом сделать это может быть создание большого количества ситуаций со спорным контролем — одна из причин, по которой команды с меньшим бюджетом иногда решают играть длинными забросами.

Вероятность взятия ворот

Как и в нашей оригинальной модели Ценности владения, то, где у вас находится мяч, имеет большое значение. В первоначальной модели расположение на поле и фаза владения мячом были единственными двумя составляющими, которые учитывались при расчете вероятности взятия ворот. Это сродни тому, чтобы рассматривать игру как настольный футбол. В настольном футболе позиции игроков сильно ограничены — они могут перемещаться только вдоль поля, а не вверх и вниз. В оригинальной модели Ценности владения похожая ситуация: вероятности гола усредняются по многим отдельным ситуациям, в результате чего мы видим только среднее влияние паса из позиции А в позицию Б.

Благодаря данным отслеживания мы можем добавить огромное количество контекста. Вероятность взятия ворот теперь может включать в себя давление на игрока с мячом со стороны защиты, поскольку мы знаем, как близко находятся защитники. Мы можем контролировать количество защитников и нападающих перед и за мячом. Это знание означает, что нам больше не нужны такие ярлыки, как «контратака» или «стандарт». Полезная информация, которая содержалась в этих ярлыках, теперь явно видна через позиции игроков. Владение мячом в контратаках ценно тем, что за мячом находится мало защитников. Если мы можем непосредственно видеть защитников, нам не нужен ярлык.

Возможность контратаки легко испортить плохим касанием или неточным пасом, который замедляет игру и дает защитникам время на то, чтобы вернуться. А если у вас есть данные отслеживания, вероятность забивания гола может динамически меняться в зависимости от этого. При подходе Контроля поля точный пас, который позволяет сохранить темп и уменьшить количество защитников между мячом и воротами, вознаграждается гораздо выше, чем немного неточный, который требует от принимающего замедлиться, чтобы принять мяч, и дает защите шанс перегруппироваться.

Перехват пасов

Важно контролировать поле, и важно контролировать его в тех областях, которые имеют значение. Но также важно, чтобы мяч попадал в ту часть поля, которая имеет значение. Забегание нападающего не имеет смысла, если мяч не может быть ему отдан. Это тесно связано с идеей контроля мяча. Рассмотрим пас, который атакующий полузащитник пытается проложить между двумя центральными защитниками на нападающего. Чем ближе мяч к центральным защитникам и чем медленнее он разыгрывается, тем больше вероятность того, что центральные защитники смогут его перехватить. Пас должен быть быстро получен нападающим. Но быстрый пас нападающему сложнее принять. Он может просто зацепиться за мяч носком и увидеть, как тот проносится мимо вратаря.

Мы можем учесть все эти сложности, проанализировав скорость и траекторию полета мяча и те же данные по поводу игрока. Данные сотен тысяч передач используются для расчета того, как скорость и точность передачи влияют на способность игроков принимать и перехватывать мяч. Если мяч проходит рядом с соперником, вероятность того, что его получит товарищ по команде, будет низкой, потому что у соперника высокие шансы мяч перехватить. Вероятность успеха этих пассов невелика.

Анализ пасов таким образом позволяет нам задать вопросы, связанные со способностью к отдаванию пасов. Например, каждый пас имеет определенную сложность — вероятность того, что он будет принят партнером по команде. Мы можем спросить, как изменится вероятность получения мяча, если он будет передан под немного другим углом или с немного другой скоростью. Это говорит нам о мастерстве, с которым игрок выполнил пас. Если мы проверим несколько различных пасов, которые мог бы сделать игрок, и обнаружим, что все они имеют меньшую вероятность быть принятыми, чем пас, который действительно был сделан, это говорит о том, что игрок выполнил пас хорошо. Если пас был неточно направлен в сторону защитника, многие из слегка скорректированных гипотетических пасов будут иметь больше шансов быть полученными — это и есть плохо выполненный пас.

Собираем все вместе

С помощью этих ингредиентов мы можем рассчитать превосходную Ценность владения. Чтобы действие было ценным, оно должно переместить мяч в то место на поле, где наша команда имеет высокий уровень Контроля поля. Но Контроля поля недостаточно: мяч нужно переместить туда, где вероятность взятия ворот выше — дальше по полю и с меньшим количеством защитников перед мячом. Этого все равно недостаточно: мяч должен с высокой вероятностью долететь до места назначения и с низкой вероятностью быть перехваченным защитником.

Момент из домашнего матча «Ливерпуля» с «Порту» в Лиге чемпионов в 2019 году иллюстрирует эти идеи. Наби Кейта получил мяч в полузащите и у него есть некоторое время для того, чтобы исполнить пас. Мо Салах прорвался справа и убрал левого защитника с его позиции. И Джордан Хендерсон занял место, освобожденное левым защитником. Поскольку Мо быстр, он частично контролировал пространство в центре за линией защиты, хотя два защитника были прямо над ним. На правом фланге не было ни одного игрока «Порту», поэтому Хендерсон полностью контролировал это пространство. Центральные защитники «Ливерпуля» полностью контролировали свою половину поля. Пас назад в оборону имел очень высокие шансы на успех. Чтобы его перехватил игрок «Порту», нужно было очень плохо пробить по мячу. Но вероятность взятия ворот была бы очень низкой, если бы мяч пошел назад — это был вариант с низким риском и низкой наградой.

Забежав вперед, Мо оказался в очень ценном месте. У «Ливерпуля» было бы 10% шансов забить, если бы Кейта сумел довести мяч до него. Но помимо двух защитников, следивших за забегом Салаха, попытка паса должна была пройти мимо еще двух игроков «Порту» — мы оценили вероятность успешного паса всего в 10%, что представляет собой вариант с высокой отдачей, но очень высоким риском.

Хендерсон находился на правом фланге, где было много свободного пространства — 5% шансов забить гол в случае удачной передачи. Передача была отнюдь не простой. Два защитника могли перехватить пас в случае неточной его доставки. Мы оценили вероятность того, что Хендерсон получит его, примерно в 60%. Это ситуация с умеренным риском и высокой прибылью, и согласно модели она является оптимальной. Кейта отказался от верного паса на Ван Дейка, который не создавал никакой ценности, и отказался от небольшого шанса удачно отдать пас на Салаха, который находился в очень ценном месте. Выбранный Кейта пас на Хендерсона создал 5% гола, за что Кейта был вознагражден. Тот же пас не был бы вознагражден так высоко, если бы пас на Салаха был бы исполнен, потому что местоположение Салаха было более ценным. Но он не был исполнен, и Кейта сделал правильный выбор.

Прекрасным примером превосходства данных отслеживания стала игра против «Тоттенхэма» в марте 2019 года. Контратака «Тоттенхэма» оставила Вирджила ван Дейка в изоляции на своей половине поля против игроков Шпор Муссы Сиссоко и Сон Хын Мина. Сиссоко побежал с мячом к воротам. Ван Дейк должен был препятствовать продвижению Сиссоко, но при этом не допустить легкого паса на Сона, гораздо более смертоносного нападающего. Оказавшись под давлением ван Дейка, Сиссоко решил пробить с 15 метров, но мяч прошел над перекладиной. Не касаясь мяча, ван Дейк совершил важнейшее и искусное защитное действие: наконец-то, зная позиции игроков без мяча, мы смогли в полной мере понять, какое влияние оказал Вирджил на розыгрыш. В старом мире данных о событиях мы бы увидели лишь удар Сиссоко мимо ворот, за который защитники разделили бы часть вины.

Данные отслеживания позволили нам с большим доверием относиться к статистическим оценкам защитников, особенно центральных. Оглядываясь назад, можно сказать, что Ван Дейк в «Саутгемптоне» был даже более выдающимся в нашей модели данных отслеживания, чем в нашей модели данных событий. В 2021 году «Ливерпуль» искал еще одного центрального защитника, и Эдди приглянулся Ибраима Конате из «Ред Булл Лейпциг». Конате выглядел намного, намного лучше в нашей модели данных отслеживания, чем в нашей модели данных событий. Причиной был камикадзе-подход «Ред Булл» к атаке. Когда команда «Ред Булл» выигрывает владение мячом, она устремляется вперед, чтобы использовать все возможности. Это успешный подход, но он часто оставляет защитников в беде. В случае потери владения мячом «Ред Булл» часто оказываются открытыми для контратак, а один или два защитника, не подключившиеся к атаке, вынуждены преодолевать огромное пространство, пытаясь пресечь контратаку.

Данные о событиях не позволяли увидеть, в какие серьезные неприятности попал Конате не по своей вине. Но модель отслеживания, знающая позицию каждого, гораздо меньше обвиняла Конате в неудачах в ситуациях 1 в 1 или 2 в 2, потому что против них очень сложно защищаться. И наоборот, его больше вознаграждали за те случаи, когда он успешно защищался в этих сложных ситуациях. Наш анализ данных отслеживания показал, что Конате был идеальным приобретением, и он преуспел, хотя ему приходилось защищать огромное количество пространства в «Ливерпуле».

Следующий рубеж

Примерно до 2018 года футбольные команды могли получить доступ к данным отслеживания только той лиги, в которой они выступали. Все изменилось с появлением «широковещательного слежения». Эта технология не требует множества камер на стадионе для создания данных слежения, а ей хватает лишь телевизионной трансляции игры. Это стало возможным благодаря огромному росту вычислительных мощностей и технологий искусственного интеллекта за последние несколько лет.

Отслеживание данных, собранных с ТВ, имеет свои проблемы. Во-первых, не все игроки одновременно находятся в поле зрения камеры. Вдобавок ко всему, приходится работать с повторами с обратного ракурса, рекламными паузами и крупными планами менеджеров, что может привести к серьезным проблемам с качеством данных. Тем не менее, возможность отслеживать данные по любому количеству лиг очень привлекательна для подбора игроков. «Ливерпуль», будучи одним из немногих клубов с собственным отделом исследований, первым начал использовать данные отслеживания трансляций. По мере того как все больше клубов начинали изучать данные отслеживания, они звонили нам, чтобы узнать наше мнение об этом. Я был удивлен, обнаружив, что большинство клубов заинтересованы в них ради физического аспекта — оценки того, как далеко и насколько быстро бегут игроки. В других клубах в новом источнике данных были заинтересованы не только скаутские, но и фитнес-отделы. Идея заключалась в том, что Премьер-лига — более физическая лига, чем другие в Европе. Я согласен с этой идеей, но физическая сила заключается в том, что тебя бьют и отталкивают от мяча больше, чем в других лигах, а то, как далеко ты можешь пробежать за игру, имеет с этим мало общего. В нашей модели отслеживания данных скорость и ускорение игрока важны, но только в той степени, в какой они влияют на его способность контролировать поле или получать пас.

Следующие два рубежа в области отслеживания данных — это «данные о положении» и искусственный интеллект. В настоящее время данные о положении предоставляются для матчей Лиги чемпионов. Вместо того чтобы каждые 40 миллисекунд определять одно местоположение игрока, данные о положении содержат 29 мест для каждого игрока: данные о расположении стоп, лодыжек, коленей, бедер, плеч, локтей, рук, глаз и ушей игрока. Это великолепный набор данных, но их анализ представляет собой сложную задачу. Лавину необработанных данных сложно обрабатывать и хранить, и в «Ливерпуле» я нанял разработчика программного обеспечения, Иана Дженкинса, чтобы он помог нам с этим справиться. Новые данные могут рассказать вам о том, чего не могут традиционные данные отслеживания — куда смотрит игрок, в какую сторону он смотрит, прыгает ли он или выполняет удар. Эти данные позволят нам сказать гораздо больше о принятии игроком решений и выполнении навыков, но для создания проницательных моделей потребуется на порядок больше работы. Одно из очевидных применений — уменьшение нашего невежества: если игроки лежат на земле с травмой или находятся в воздухе в прыжке, мы знаем, что они не смогут ускориться к мячу, и наш расчет Контроля поля будет более точным.

Другой рубеж — искусственный интеллект. Наш подход к анализу данных в «Ливерпуле» заключался в создании моделей, основанных на простых принципах, таких как Контроль поля. Преимущество этого подхода в том, что простые концепции моделирования можно объяснить людям, которые не являются специалистами в области науки о данных. И чтобы убедить спортивного директора или менеджера в ценности нашего анализа, его нужно объяснить в футбольных терминах. Еще один подход к анализу данных — искусственный интеллект. Это заключается в том, чтобы поместить все ваши данные в чрезвычайно сложную модель и позволить выбранному вами алгоритму искусственного интеллекта делать на ее основе прогнозы. ИИ обладает огромными возможностями, и модели ИИ обычно обладают большей предсказательной силой, чем более простые модели, созданные вручную, такие как те, которые мы обычно использовали в «Ливерпуле». Но за это приходится платить: вы не знаете, почему модель искусственного интеллекта делает те прогнозы, которые она делает. Другими словами, эти модели часто не интуитивны и не очень хорошо поддаются интерпретации даже аналитиками данных.

Однако в случае с данными отслеживания существуют различные приложения, в которых мы можем не заботиться об интерпретируемости, и модели искусственного интеллекта могут быть невероятно полезны в этих случаях. В «Ливерпуле» мы сотрудничали с компанией DeepMind, занимающейся разработкой искусственного интеллекта, чтобы понять, «что ИИ может сделать для футбола и что футбол может сделать для ИИ».

Это сотрудничество дало нам возможность «галлюцинировать» траектории движения игроков. При трансляции данных отслеживания мы не знаем, где находятся игроки, когда их нет в кадре, поэтому приходится прикидывать. Все, что нас волнует, это точность оценок — идеальное применение ИИ. Эта идея также открыла возможность предсказывать будущие траектории игроков. Мы можем нажать на паузу в игре, а затем попросить компьютер спрогнозировать следующие 10 секунд игры, указав нам, куда, скорее всего, побегут игроки. Это открывает захватывающие возможности. Алгоритм искусственного интеллекта может неоднократно предлагать множество вариантов развития событий — иногда защитник решает пойти вперед, а иногда — остаться сзади. Мы можем сравнить эти галлюцинации с тем, что произошло на самом деле, чтобы сказать что-то об эффективности хода, который действительно произошел, по сравнению с тысячами ходов, которые могли бы произойти, но не произошли. Мы также проанализировали угловые, создав модель искусственного интеллекта, которая изучает атакующие и оборонительные действия при угловых и предлагает корректировки позиций и забеганий игроков, чтобы увеличить шансы на взятие ворот. Модель впечатляет — эксперты не смогли отличить реальные угловые от ситуаций, придуманных искусственным интеллектом.

Появление приложений искусственного интеллекта и позиционных данных поможет нам лучше анализировать выступления игроков и, возможно, даже начать изучать различные тактические схемы ведения игры. Как и в случае с первой итерацией данных отслеживания, новые данные — это одновременно и благословение, и проклятие. Чтобы извлечь из них полезные сведения, придется потрудиться. Но награда за это высока, как, например, награда, которую мы получили за то, что стали первым клубом, сумевшим извлечь понимание из исходных данных отслеживания.

Приглашаю вас в свой телеграм-канал, где переводы книг о футболе, спорте и не только...