Райан Охэнлон. «Чистая прибыль. Революция аналитики в прекрасной игре». Глава 8: Среднее поле, часть 2
Современный менеджер
…
Штефан Райнартц играл на той же позиции, что и Серджи Бускетс. Они одного роста и примерно одного веса. Они родились в течение пяти месяцев друг от друга и выступали, соответственно, за две крупнейшие международные державы предыдущего десятилетия: Германию и Испанию. Но нет, это не то сравнение, которого хочет Райнартц.
Скорее, он считает себя Барни Стинсоном от футбола. Кем? В ситкоме канала CBS «Как я встретил вашу маму» Нил Патрик Харрис играет Стинсона, безрассудного любителя секса, который смешит своих друзей и справляется с неразрешенной детской травмой, придумывая все более причудливые схемы соблазнения ничего не подозревающих женщин. Когда Райнартц, сухой, нервно размеренный и рациональный отец двоих детей, сравнил себя с последним вымышленным персонажем, вместо которого я ожидал увидеть не иначе как Джокера, я решил, что не так понял, или что-то было упущено при переводе. Он говорил с сильным немецким акцентом, и благодаря разнице во времени между Лос-Анджелесом и Кельном я проснулся, подошел к своему столу, открыл компьютер и начал наш разговор. Я чувствовал себя вялым после плохого сна. У меня могли быть галлюцинации. Кто знает.
Но когда Райнартц играл за леверкузенский «Байер», один из пяти крупнейших клубов одной из пяти лучших футбольных лиг мира, его пригласили принять участие в презентации в Кельнском университете. Он был в составе группы из трех человек — журналиста и профессора университета. Профессор написал книгу, которая, по словам Райнартца, называлась «Правда о футболе». И что же это за правда о футболе? Эта статистика — полная чушь. Профессор долго рассказывал о том, что владение мячом, процент точности паса, количество ускорений и другие статистические данные, широко используемые в Германии, никак не связаны с победой в футбольных матчах. Это было правдой, и Райнартц знал это, но он также считал, что профессор зашел слишком далеко. Этот парень говорил, что футбол нельзя измерить, что игра слишком динамична и сложна, чтобы ее можно было оценить количественно.
«Я сказал ему: «Конечно, точность передачи данных не может служить показателем эффективности. Я могу завтра пойти на тренировку, отдать 100 пасов своему вратарю — 100% точности паса, 100% владения мячом, но гол будет на другом конце поля», — говорит Райнартц. «Я спросил его: «Почему бы вам не измерить, прорывает ли кто-то линию на поле? Потому что это не высшая математика. Это было очень просто».
Чтобы объяснить профессору, что он имеет в виду, Райнартц сравнил футбол с настольным футболом. Есть линия защитников, линия полузащитников и линия нападающих. Чтобы забить гол, вам, как правило, нужно провести мяч мимо всех трех линий игроков. На полном поле игроки, конечно, не ограничивались движениями из стороны в сторону: у них были руки, ноги не были сведены вместе, они могли идти в дриблинг и так далее. Но в основе своей Райнартц видел футбол не столько как борьбу за пространство, сколько как древнее военное сражение: вдоль поля располагались линии игроков, и чтобы забить гол, команде нужно было найти способ обойти каждую из этих линий, не теряя владения мячом.
Возможно, благодаря позиции, на которой он играл, Райнартц смог так четко осмыслить спорт в своей голове. Нападающие в основном рассматривают игру как головоломку последней трети: как я могу добиваться ударов или создавать удары, которые приведут к голу? А защитники склонны к противоположному мнению: как уничтожить шансы другой команды забить гол, как только они войдут в нашу оборонительную треть? Но для Райнартца игра заключалась в том, чтобы доставить мяч к этим эгоистичным нападающим и не допустить, чтобы мяч вообще оказался рядом с этими слишком усердными защитниками.
Райнартц высказал эту идею профессору, который сказал, что, по его мнению, никто никогда не пытался измерить такую вещь. Райнартц предложил профессору самому разобраться в этом вопросе, но тот так и не сделал этого. Вместо этого он придерживался этой линии: «В футболе никогда не будет статистики, которая бы соотносилась с конечным результатом, потому что футбол слишком сложен». И Райнартц подумал: «Вызов принят, немного в стиле Барни Стинсона». Телевизионный герой обычно использовал эту фразу, когда ему говорили, что он не сможет заставить конкретную женщину переспать с ним. Но цель Рейнарца была не столь шаблонной. На самом деле все было наоборот: Качок превратился в ботаника.
После этого Райнартц решил найти способ сначала измерить количество игроков, которых обходят во время игры, а затем выяснить, является ли это просто сложным способом подсчета, или же он несет какую-то информацию о том, как устроен футбол. Он позвонил своему другу и коллеге-полузащитнику Йенсу Хегелеру, и они вместе приступили к работе над проектом. «Мы измеряли его вручную, действие за действием, и заносили в Excel, — говорит он. — На одну игру у нас уходило около 20 часов». Первоначальный анализ показал, что количество обойденных противников и победа в игре имеют коэффициент корреляции между 0,3 и 0,4 — небольшая, но все же статистически значимая связь. Это не было главной движущей силой, позволяющей взять три очка в матче, но, как правило, помогало. Однако если смотреть только на количество обойденных защитников — последнюю линию соперника, — то корреляция возрастает до 0,6. Это означает, что команды, у которых защитная линия не прорывалась, а атаки прорывались за последнюю линию соперника, выигрывали свои матчи чаще, чем другие. Если вы сосредоточитесь только на матчах с победителем, то команда с большим количеством обойденных соперников побеждала в 62% случаев, а при использовании только защитников этот показатель возрастал до 79%. Райнартц и Хегелер создали статистику, которая описывала происходящее на футбольном поле и помогала объяснить итоговый счет, так что теперь им нужно было только название. Они остановились на слове «упаковка», потому что считали, что если игрок был обойден пасом, то он был «упакован» и больше не мог влиять на ход матча, пока мяч не переходил из рук в руки.
Одна из универсальных проблем, с которой столкнулись сторонники статистического анализа, — понять, как заставить людей слушать. Большинство из них — аутсайдеры, чьи уникальные точки зрения являются обоюдоострым мечом. Находясь за пределами пузыря, они более склонны думать о футболе по-другому. Но быть в стороне означает, что люди, которые играют в футбол, тренируют футбол и управляют футбольными командами, с меньшей вероятностью будут их слушать. Но для Райнартца это не было проблемой. Он разработал концепт в 2014 году, когда еще играл за леверкузенский «Байер». Ему не нужно было думать, как попасть в здание, он уже был там. Кроме того, ему довелось играть у одного из немногих тренеров, который интересовался зарождающимся миром статистики: Рогера Шмидта, того самого парня, который вникал в мозги Теда Кнутсона и читал работы Майкла Кейли. Тогда Райнартц предложил эту идею Шмидту и спортивному директору «Леверкузена» Йонасу Больдту. По словам Райнартца, они были заинтригованы, «потому что это первая статистика, которая имеет отношение к футболу». Владение мячом может быть метрикой для любой игры с мячом, а это было скорее в футбольном контексте». Вскоре «Леверкузен» стал первым клиентом Impect, небольшой компании, которую Рейнарц, Хегелер и их генеральный директор Лукас Кепплер создали для продажи информации.
Вызов принят, задача выполнена — за исключением одной маленькой проблемы. «Это было очень забавно, — сказал Райнартц. — Мой собственный клуб оценивал меня по моей собственной статистике, и я понимал, почему я не играю. К сожалению, тренер был прав». Проведя всего девять матчей за «Леверкузен» в сезоне 2014/15 и продав им новый метод анализа, Райнартц покинул клуб, провел еще один сезон Бундеслиги в составе франкфуртского «Айнтрахта», а затем завершил карьеру всего в 26 лет. Травмы помешали ему в начале карьеры. Кроме того, теперь у него была компания по обработке данных, которой нужно было управлять.
Семь лет спустя в штаб-квартире Impect в Кельне работает 12 человек, а еще более 100 занимаются сбором данных на Филиппинах. (Компания Impect разработала программное обеспечение для тэггирования, так что этот процесс больше не требует 20 часов работы над каждой игрой) Немецкая телерадиокомпания ARD использовала данные «упаковки» для анализа во время Чемпионата Европы летом 2016 года. Затем Impect заключила сделку с Fox на использование их данных для освещения чемпионата мира по футболу 2018 года, но США не смогли пройти квалификацию, и Fox сократила свои инвестиции в это мероприятие. После этого небольшого провала компания решила не уделять столько внимания работе со СМИ и вместо этого сосредоточилась на расширении своего влияния в клубах. Большинство ведущих клубов Бундеслиги подписались на доступ к данным «упаковки». Также как и «Пари Сен-Жермен» и ряд других клубов за пределами Германии.
Привлекательность «упаковки» во многом обусловлена ее простотой: переведите мяч за пределы действия игрока, и вам зачтется. Здесь нет алгоритма или чего-то, требующего определенного доверия со стороны футболиста, который не уверен, стоит ли тратить на это время. Она позволяет клубам оценить свои собственные результаты, результаты своих игроков и потенциальных новых игроков по этому одному конкретному аспекту игры, а затем решить, какое значение они хотят придать этому аспекту. Простота идеи также позволила Impect развить ее в нескольких направлениях. Если вы можете измерить ее для пасов, то и для дриблинга тоже. Вы также можете посмотреть на неточные передачи: сколько товарищей по команде игрок вывел из игры, перехватив мяч? И если вы можете измерить, сколько раз игрок выводит соперника из игры, то вы также можете измерить, сколько раз игрок обороны выводится из игры соперником. Это особенно полезно для оценки игры такого игрока, как Райнартц, — опорного полузащитника, который сидел на пространстве перед своей собственной защитной линией.
Как среди традиционных игроков и тренеров, так и среди аналитиков ведутся споры о том, что значит хорошо играть в защите в качестве полузащитника. В 2015 году клуб Премьер-лиги «Лестер Сити» приобрел малоизвестного полузащитника «Кана» из второго французского дивизиона. За год до этого «Лестер» только только вышел в Премьер-лигу, так что этот шаг либо остался незамеченным, либо был воспринят как «Какого черта «Лестер» тратит $10 млн. на Н'Голо Канте? И еще, кто такой Н'Голо Канте?» Год спустя «Лестер» выиграл, возможно, самый маловероятный титул в истории профессионального спорта благодаря сильной обороне и скоростной прямой атаке. В то время как большинство современных команд играют с тремя центральными полузащитниками, чтобы лучше контролировать владение мячом и перекрывать наиболее опасную зону поля, «Лестер» обходится всего двумя, что позволяет ему создавать преимущества в других частях поля. Главная причина, по которой это сработало, по мнению бывшего руководителя отдела подбора персонала «Лестера» Стива Уолша: «Мы играем втроем в полузащите. Дэнни Дринкуотер в центре, Канте по обоим сторонам». Канте был повсюду в составе «Лестера», и в процессе игры он набирал огромные показатели по подкатам и перехватам. Через год после перехода в «Лестер» он был продан в «Челси» примерно за $40 млн. «Челси» тоже использовал полузащиту из двух и трех человек — серб Неманья Матич в центре и Канте по обоим сторонам — и тоже выиграл титул чемпиона Премьер-лиги. В первый год без Канте «Лестер» опустился на 12-е место, а «Челси» с ним поднялся с 10-го на первое. Это не был идеальный эксперимент, но даже без учета всех остальных переменных, казалось, что наличие Н'Голо Канте, совершающего тонны подкатов и перехватов, повышает вероятность завоевания титула вашей командой.
В баскетболе «перехват» обладает удивительно мощным аналитическим воздействием. Согласно анализу, проведенному Бенджамином Моррисом для сайта FiveThirtyEight, предельная ценность перехвата составила 9,1 очка. «Например, игрок, набирающий в среднем 16 очков и совершающий два перехвата за игру, по прогнозам (при прочих равных условиях) окажет такое же влияние на успех своей команды, как и игрок, набирающий в среднем 25 очков, но совершающий только один перехват, — пишет Моррис. — Если бы эти игроки были в разных командах и получили травмы в одно и то же время, мы бы ожидали, что их команды будут иметь схожее снижение производительности (в среднем)». Почему? Это неясно, но Моррис предполагает сочетание нескольких факторов. Игрок, совершивший перехват, одновременно разрушает владение соперника и, возможно, создает высокую вероятность быстрой контратаки для своей команды. Перехваты также могут быть косвенным показателем более мягких навыков — организованности, позиционирования, коммуникации и т. д., — которые влияют на итоговый результат более сложными для понимания способами. Другими словами, игроки, совершающие перехваты, обычно преуспевают и в других областях. Кроме того, Моррис пишет: «Подумайте обо всем, что происходит в баскетбольном матче — независимо от того, кто играет, будет много очков, подборов и передач. Но некоторые вещи происходят только потому, что кто-то заставляет их происходить. Если вы замените игрока на кого-то менее опытного в этом деле, это не просто перейдет к кому-то другому. Этого не произойдет вообще. Перехваты — это в большей степени именно такие вещи».
Хотя футбол не поддается такому же анализу, подкат или перехват имеют ту же теоретическую форму, что и перехват в баскетболе. Чтобы совершить подкат или перехват, вам обычно нужно принять решение о том, чтобы совершить подкат или попытаться перехватить пас. Кроме того, удачный подкат или перехват разрушает владение соперника и создает его для себя. «Есть игроки, которым это не подходит, но простые числа отвоевания мяча, похоже, отражают и определенную ценность, и определенное мастерство, — говорит Майкл Кейли. — Из того, что я видел, и из исследований, которые проводили люди, следует, что между защитными навыками в центре поля и конкретными показателями отвоевания мяча на поле нет такого большого разрыва, как я ожидал. Похоже, эти две вещи сочетаются лучше, чем я думал». Для Кейли данные совпадают с тем, что он видит своими глазами: «Наблюдая за карьерой Н'Голо Канте, я чувствую, что он меняет игру благодаря своей оборонительной игре в центре поля».
Однако Хаби Алонсо с этим не согласен. Он играл на той же позиции в ту же эпоху, что и Серджи Бускетс, часто попадая в один и тот же состав сборной Испании. Алонсо перешел в «Ливерпуль» из баскского клуба «Реал Сосьедад», а затем завершил карьеру в испанском «Реале» и немецкой «Баварии». Алонсо — один из немногих игроков, играющих центральную роль как у Жозе Моуринью, так и у Пепа Гвардиолы. Он видел игру с обеих сторон и является одним из самых вдумчивых игроков своего поколения. На поле он был таким же неподвижным, как Бускетс, но выделялся своими точными дальними передачами. Он редко отвоевывал мяч, но для него это был знак, что он делает что-то правильно. «Я не думаю, что подкаты — это качество, — сказал он в интервью Guardian. — Это рекурсия, то, к чему приходится прибегать, а не особенность вашей игры... У меня в голове не укладывается, что развитие футбола будет воспитывать в игроках подкаты как качество, то, чему нужно учиться, чему нужно учить, что должно быть характерно для вашей игры. Как можно так смотреть на игру? Я просто не понимаю футбол в таких терминах. Подкаты — это [последнее] средство, и оно вам понадобится, но это не то качество, к которому нужно стремиться, не то определение». По мнению Алонсо, ваша позиция должна препятствовать тому, чтобы соперник вообще приблизился к вам.
Райнартц с этим согласен. «Если вы говорите об опорных полузащитниках, таких как вы, Хаби Алонсо или я, то название «опорный» — потому что вы пытаетесь удержать свою позицию, чтобы придать команде стабильность, — сказал Райнартц. — А стабильность — это не что иное, как отсутствие того, что тебя обошли: если вам удается двигаться правильным образом, не давайте соперникам пространства. Мы можем измерить это — как часто оборонительная структура обходится с вами в качестве опорного полузащитника, и как часто она обходится в пространстве, которое вы защищаете? Зона полузащиты перед четверкой защитников — это ваша зона ответственности, не позволяющая сопернику обойти вас там. С точки зрения футбола, это совершенно очевидно и легко понять. Но для фанатов это может оказаться слишком».
Однако Райнартц согласен и с оценкой Канте со стороны Кейли. Подкат, совершенный игроком защиты, также выводит соперника из игры. Другое дело, что «упаковка» отслеживает, и Impect выяснил, что команда, которая выводит из игры больше соперников с помощью перехватов, выигрывает в 70% случаев без учета ничьих. Возможно, это просто спор двух сторон, обе из которых правы.
Райнартц считает, что данные, выходящие за рамки просто «упаковки», могут изменить методы управления футбольными клубами. Он фанат xG: «Иногда средства массовой информации не понимают или не могут перевести их — хотя это так просто. Это просто голевые моменты. Это не просто 1,0, а нечто среднее». И больше всего он считает, что использование данных может сэкономить время клубов и предотвратить ошибки. «Если вы думаете о решениях в футболе, вы, как правило, думаете о выборе бриллианта. Вы просканировали 18-летнего парня в Южной Америке, мы используем полученные данные, подписываем его, а затем продаем за €50 млн. через два года. Но, как правило, 99% игроков приходится «прибивать». Вы должны отсеять их, и данные — лучший фильтр. На игроков можно навесить множество красных флагов, и эта фильтрация — решение «нет», но это все равно решение. Обычно, при скаутинге 10 000 игроков, ты убиваешь 9 999 игроков, а последнего подписываешь. Это нормальный процесс, и данные — лучший инструмент для принятия решений».
Однако Рейнарц также позиционирует себя как своего рода инсайдера среди аутсайдеров: ботаник, который также играет за сборную Германии. Он взял свою идею о том, как работает футбол, оценил ее количественно, а затем проверил, обнаружив корреляцию с победой. «Мы начали с футбольного вопроса, который можно задать спортивному директору. Итак, вы ищете опорного полузащитника, который должен обеспечивать стабильность и разрывать следующую линию? Мы создали данные на основе этих футбольных вопросов. Это умные данные в футбольном контексте. Другой вариант, который не очень хорош, — собрать кучу данных, все, что можно посчитать, а потом прийти к спортивному директору и сказать: «У нас есть все данные, которые вы можете себе представить, что вам нужно?» Это совершенно другой язык, который не отражает сути вашего вопроса. Мы перевели футбол в данные, а другие компании пытаются перевести данные в футбол».
В его словах есть и хорошее, и плохое. Большинство собираемых данных никак не связаны с победой и зачастую лишь смутно связаны с тем, чего пытается достичь каждый игрок на поле. Большинство команд стараются либо провести мяч мимо соперника, либо не дать ему сделать то же самое, и данные Райнартца подтверждают это. Однако существует проблема, связанная с корреляцией любых футбольных данных с победой. Как показала работа Стефана Шимански, лучшие футбольные команды — это команды, которые платят своим игрокам больше всего денег. Другими словами, лучшие команды — это те, в которых играют лучшие игроки. Этим командам не нужно играть наиболее эффективно или оптимально, чтобы победить, поэтому при работе с корреляциями неясно, измеряете ли вы то, как играют самые талантливые команды, или же вы измеряете то, как играют команды, которые при равном таланте с большей вероятностью приведут к победе.
* * * *
«Я узнаю это, когда увижу». Именно такими словами судья Верховного суда Поттер Стюарт описал непристойность во время рассмотрения дела «Якобеллис против Огайо» в 1964 году. По словам многих людей, с которыми я разговаривал, это также способ описать опасный пас.
Просмотр футбольного матча — это упражнение в управлении разочарованием. В каждом установленном владении есть момент, когда толпа ждет, что что-то произойдет: Они знают, что большинство движений ни к чему не приводят, но они также знают, что это движение может стать одним из тех, которые-таки приведут. Наступает период разрядки, когда защита имеет свою структуру и спокойно позволяет сопернику передавать мяч поперек или назад. Атака, тем временем, похоже, довольствуется простыми передачами, которые позволяет делать защита. Так могло бы продолжаться до бесконечности, но вдруг игрок с мячом решит, что пора изменить ход игры, и сделает пас вперед через группу игроков. Если он завершен в правильном месте, вам даже не нужно смотреть игру, чтобы узнать, что произошло. Вы можете закрыть глаза и просто услышать это: толпа вдыхает все разом, и их общий рокот постепенно повышается на несколько децибел в предвкушении того, что может произойти дальше.
Толпа права, она знает, что что-то было создано, даже если владение, как и в большинстве случаев, затухает до того, как кто-то бьет по воротам. Публика знает это, потому что смотрела матч и понимает контекст игры. Однако в данных этот контекст исчезает. Если владение в итоге не заканчивается ударом, то эти моменты, которые на короткое время заставили весь стадион застыть в напряжении, становятся достоянием истории.
Для Каруна Сингха это никогда не имело смысла. Он вырос в Дели, Индия. Крикет был его первой любовью, и его отношения с этим видом спорта покажутся знакомыми среднестатистическому американскому бейсбольному болельщику: он помнит, что был одержим поверхностными статистическими данными, которые появлялись на экране телевизора, и игральными картами, которые он собирал. Примерно в девятый или десятый день рождения он начал смотреть «Арсенал» Арсена Венгера и быстро втянулся. Это была эпоха, когда «Арсенал» перемещал мяч по земле с завораживающей синхронностью и скоростью. А еще у них был Тьерри Анри с его легким атлетизмом и виртуозными ногами, который реализовал все моменты. Так много красивых приемов сохранилось в исторических записях, потому что Анри был там, чтобы завершить их.
На протяжении всей учебы в школе и колледже Сингх размышлял о том, есть ли способ объединить данные, которые он любил в крикете, с новой игрой, которая захватила его воображение. В старших классах он изучал этот вопрос, но не смог найти никаких данных, которые бы оправдали его. Он переехал в США, чтобы изучать компьютерные науки в Корнелле, и тяготел к машинному обучению и, в частности, к компьютерному зрению. Он устроился на работу в небольшой стартап в области компьютерного зрения в районе Сан-Франциско, который в итоге был приобретен Фейсбуком, и провел там некоторое время, после чего ушел работать в команду компьютерных наук в Grammarly, компании, которая создавала программное обеспечение для исправления грамматики с помощью искусственного интеллекта. По вечерам и выходным Сингх начинал все глубже погружаться в мир футбольных данных.
Наткнувшись на бесплатный набор данных, предложенный компанией StatsBomb для чемпионата мира по футболу 2018 года, Сингх создал, как ему показалось, лучшую визуализацию проходящих сетей. Иногда их можно увидеть в телепередачах: 11 точек, расположенных на поле и соединенных линиями разной толщины. Стандартная карта пасов определяла местоположение каждого игрока на поле на основе среднего расположения его касаний, а затем толщина линий, соединяющих каждого игрока с каждым другим, определялась количеством пасов, сыгранных между каждой парой. Хотя эти изображения выглядят аккуратно и опрятно, в них отсутствует всевозможный контекст, включая эффективность пасов, которыми обмениваются игроки. Рассматривая паттерны передач как один гигантский агрегат, вы упускаете из виду, как команды могут передавать мяч в конкретном владении. Поэтому Сингх разработал новый тип карты пасов, который имел несколько фильтров: один показывал, какие игроки обменивались наиболее опасными пасами, другой — наименее опасными, третий — наиболее поперечными, а четвертый — наиболее длинными. Он изложил все это в впечатляюще подробной и риторически обоснованной записи в блоге, в которой проанализировал поражение Испании от России на чемпионате мира 2018 года: игра была печально известна тем, что Испания выполнила 1000 пасов и контролировала 78% владения мячом. Это был современный, граничащий с гротеском аргумент в пользу риповской теории футбола — и в нем также фигурировал Серджи Бускетс.
Новая идея принесла Сингху несколько подписчиков в Твиттер, несколько приятных заметок и один повторяющийся вопрос. Многие из тех, кто прочитал весь пост, интересовались, как именно он определяет, какие пасы на его пасс-картах наиболее опасны. «Я просто написал что-то, что показалось мне интуитивно понятным, и, думаю, это сработало достаточно хорошо, но я не совсем понимал, что само по себе может быть чем-то ценным. Я использовал это только для того, чтобы подчеркнуть опасные комбинации, и я просто закончил с этим и пошел дальше». Хотя карты пасов не изменили его жизнь, они подали ему следующую идею.
Затем он потратил около пяти месяцев на создание поста, в котором представил свою модель опасного паса. Он придумал запоминающееся название: ожидаемая угроза. Он создал кучу интерактивных визуальных эффектов и тщательно проработал язык, надеясь, что идея будет понятна человеку, почти не разбирающемуся в футбольной аналитике. Он разослал черновики куче людей, с которыми познакомился в Интернете, — и все это ради всего лишь второй записи в блоге, которую он когда-либо писал.
«Оглядываясь назад, можно сказать, что эти усилия стоили того, — сказал Сингх. — Я потратил много времени на то, чтобы сделать правильные визуальные эффекты для этого поста и объяснения, отправил людям множество черновиков. Это был целый процесс. Я опубликовал эту статью в феврале 2019 года, и она вызвала довольно бурную реакцию в сообществе аналитиков. Это стало поворотным моментом. Если бы это не привело к успеху, я бы, возможно, забил на это дело, поскольку две вещи, которые я пробовал и к которым приложил много усилий, не взлетели».
Вместо этого Ожидаемая угроза взлетела. Сингх получил приглашение выступить перед аналитической компанией Twenty3 в Лондоне. Лори Шоу, астрофизик по образованию, который сейчас работает в «Манчестер Сити» в качестве научного сотрудника по искусственному интеллекту, попросил Сингха выступить на небольшой конференции по аналитике, которую он организовал во время преподавания в Гарварде. В октябре 2019 года он представил свою идею на первой аналитической конференции StatsBomb. А потом, прямо перед пандемией, он представил отдельную исследовательскую идею на единственной футбольно-аналитической конференции крупнее, чем StatsBomb: Opta Pro Forum. После некоторого затишья в течение первого года блокировки Ожидаемая угроза ворвалась в массовое сознание, когда о ней написал Том Уорвилл из The Athletic. Менее чем за два года Сингх превратился из человека, который никогда не написал ни слова о футболе, в человека, которого ругали в Интернете знающие британские футбольные фанаты, не желавшие, чтобы цифры портили им субботний день.
Итак, что же такое Ожидаемая угроза?
«У меня есть набор из десяти объяснений, которые я использую для разных аудиторий, но, думаю, самое простое из них заключается в том, что, основываясь на том, где находится мяч, мы скажем вам, насколько опасна ситуация владения им, — сказал Сингх. — В любой позиции на поле мы хотим количественно оценить вероятность забить гол при таком владении мячом».
Ожидаемая Угроза достигла двух целей. Во-первых, она точно определила ценность каждой зоны на футбольном поле. Она делит поле на 150 квадратов: 15 в длину, 10 в ширину. Каждый квадрат оценивается с точки зрения того, как часто владение мячом из этого квадрата исторически приводило к голу в течение следующих пяти попыток команды. Ни одно место в оборонительной зоне команды не имеет значения более 1%, а самыми ценными зонами, что неудивительно, являются две зоны на линии ворот и в рамке ворот. Однако ни одно из этих значений не превышает 41,3%, иллюстрируя, насколько чертовски сложно забить гол.
Вторая вещь, которую сделала Ожидаемая угроза, — это награждение игроков и команд в зависимости от того, как они перемещают мяч по этой карте. Если вы передали мяч из 1-процентной зоны в 9-процентную, то вам присудили xT, равный 0,08, потому что вы увеличили вероятность того, что ваша команда забьет гол, на 8%. «Причина, по которой все это снова возникло, заключается в том, что я хотел определить, кто кому делает опасные передачи, — сказал Сингх. — Когда вы смотрите матч, вы определенно знаете об этом, исходя из контекста, но сами данные о событиях ничего не говорят вам об этом. Традиционно люди считают, что передачи — это показатель угрожающих пасов, но если немного подумать, то с передачами возникает очень много проблем. Так что цель была одна: можем ли мы рассматривать пас отдельно, основываясь только на его достоинствах? В футболе вы пытаетесь перемещать мяч с места на место, а потом в конце концов принимаете решение пробить. Но все, что предшествует этому, — просто движения мяча. Таким образом, любой пас, любой перенос или движение мяча можно определить по тому, где он начался и где закончился. Теперь, если у вас есть представление о том, насколько опасно каждое из этих мест, вы можете просто вычесть два значения и найти разницу».
Такая модель мира помогает выявить недооцененный вклад определенных игроков в атакующую треть, а также, как Сингх описал в своем первом посте, предоставляет командам своего рода автоматический скаутский инсайт. Рассмотрев все действия команды с помощью этой схемы, вы сможете определить, в каких областях они больше всего увеличивают свою Ожидаемую угрозу. Но, несмотря на то, что значение этого показателя может достигать пяти ходов в прошлое, есть одна вещь, которую Ожидаемая угроза не делает: не ценит таких игроков, как Серджи Бускетс.
На той же конференции StatsBomb, на которой выступал Сингх, Том Лоуренс сделал доклад, в котором рассказал о своих попытках создать модель, аналогичную xT. Лоуренс является директором по технологиям в StatsBomb, а до этого в течение года работал аналитиком данных в пражской «Славии», выигравшей четыре из шести предыдущих титулов в первом чешском дивизионе. Доклад называется «Некоторые вещи не удары: Сравнительные подходы к оценке футбола» — это блестящее исследование проблем, возникающих при моделировании динамичной игры с 22 игроками, и одновременно упражнение, позволяющее поставить под сомнение все, что, как нам кажется, мы знаем об этом виде спорта. В ней Лоуренс вводит термин «Долина Мех», чтобы описать, как модель, подобная его или Сингха, воспринимает среднее поле. В оборонительной трети команда, владеющая мячом, сильно рискует, потому что если она потеряет мяч, то с большей вероятностью пропустит гол. В атакующей трети за успешное действие можно получить кучу вознаграждения, но риск невелик. А в полузащите? Ну, это полная ерунда.
«В конечном счете, шанс забить или пропустить гол при среднем ходе игры довольно мал, и большинство индивидуальных действий, особенно в центре поля, не сильно увеличивают этот шанс, — говорит Лоуренс. — Но на концах поля: атакующий игрок может превратить, скажем, 10-процентный шанс в 40-процентный с помощью одного лишь мастерства (или удачи). Защитник может потерять мяч и превратить невинную ситуацию в опасную атаку соперника».
Модель, которую пытался построить Лоуренс, и модель, которую опубликовал Сингх, в просторечии называют моделями ожидаемой ценности владения (expected-possession-value, EPV). Другими словами, как каждое действие на поле влияет на вероятность команды как забить гол, так и пропустить его? Метод Сингха — самый простой и элегантный; он рассматривает только то, где мяч находится на поле, и как это меняет вероятность. Другие модели учитывают скорость владения мячом, предшествующие события во владении, а также тип действия: подкат, пас вразрез, кросс, проход с мячом и так далее. Теоретически одним из главных преимуществ этих моделей является их вычислительная мощность. Они могут суммировать все действия игрока по ходу матча, чтобы примерно определить, как он повлиял на шансы своей команды на победу. Модель EPV может устранить предвзятость тренеров при просмотре матча вживую или даже на пленке, а также запомнить больше событий, произошедших в игре, поскольку тренеру невозможно отследить и оценить каждое действие всех 22 игроков на поле в течение 90 минут.
И опять же, все это — всего лишь тонкая версия одной из идей, о которых Ричард Поллард писал более 20 лет назад, когда у него еще не было доступа к таким данным и вычислительным мощностям. На самом деле, когда StatsBomb выпустила свою официальную версию модели EPV в 2021 году, они даже ссылались на документ, который Поллард написал (и добавил к нему имя Рипа) в 1997 году. Однако одно из явных ограничений этого типа модели — это то же самое ограничение, от которого страдает весь современный анализ: она не учитывает, что происходит за пределами мяча, и не может вознаградить игроков за создание пространства для своих товарищей по команде или за отъем пространства у соперников. И вот StatsBomb, по сути, включает это предупреждение в название своей модели, которую они назвали «ценность на мяче» [on-ball value], или OBV. Их модель преодолела первое препятствие для любой хорошей футбольной модели: есть ли в ней Лионель Месси? По показателю OBV за 90 минут Месси имеет два лучших сезона в пяти ведущих европейских лигах с сезона 2016/17. Однако среди 20 лучших сезонов с 2016 по 2021 год нет ни одного полузащитника. То же самое касается и топ-15 игроков Премьер-лиги на кампанию 2020/21: все нападающие, а затем пара крайних защитников, что свидетельствует о растущей тактической тенденции среди топ-команд, которые все больше полагаются на своих фланговых защитников при выполнении передач в штрафную площадь.
«Это хороший признак того, что даже если усложнить задачу и скопировать все имеющиеся у них данные, возможно, суровая реальность заключается в том, что пасы в полузащите сами по себе не так уж ценны, — сказал Сингх. — Могут быть и другие причины, по которым они тактически ценны, но если рассматривать их только в отдельности, то они сами по себе не вносят столь значительного вклада по сравнению с пасом в штрафную или пасом в финальную треть».
Интересно, не является ли высшим достижением работы Сингха — и даже более продвинутых моделей «владение-ценность» — кодификация чего-то очевидного? Лучше, если мяч будет находиться вблизи ворот другой команды. Если смотреть на игру глазами EPV-модели, то игроки, которые создают ценность, — это те, кто перемещает мяч в штрафную и те, кто получает мяч в штрафной.
«Одна вещь, которую я считаю очевидной, когда вы работаете с данными о событиях на поле и смотрите на продвижение мяча, — это важность самой штрафной площадки, — сказал Майкл Кейли. — В определенном смысле это очень интуитивно: существуют особые правила в отношении штрафной площадки, и команды по-разному ее защищают. Так что меня это не удивляет, но меня удивляет, насколько сильно это выделяется, насколько сложно выудить из данных о движении мяча другие вещи, по сравнению с тем, как легко выудить: «Вау, вы переместили мяч в штрафную, вы совершили подвиг». В том, чтобы оказаться в штрафной площади, есть что-то важное, и я думаю, что это показывает, что вы в какой-то мере разрушили оборону команды».
Может показаться, что это возвращает нас к первоначальной идее Омара Чаудхури. Так и есть. И это не так. «С точки зрения игрока, мы должны понимать, что дриблинг нападающего, который обыгрывает своего непосредственного соперника, чтобы попасть в штрафную, может потребовать столько же таланта, сколько и дриблинг игрока, находящегося дальше по полю, и что ошибка защитника может быть относительно простительна дальше по полю, — говорит Том Лоуренс. — И поэтому нужно быть очень осторожным с распределением наград, потому что игроки могут проявить свое мастерство только в тех ролях и возможностях, которые им доступны. Конечно, верно, что в середине поля у вас, скорее всего, будет больше возможностей в абсолютном выражении, и, возможно, в совокупности они будут такими же, как и у тех, кто находится дальше по полю. Но, безусловно, здесь есть некоторые диспропорции, о которых вам стоит задуматься».
Может быть, когда-нибудь Сингх придумает, как правильно моделировать эти дисбалансы. В прошлом к нему обращались команды с предложениями о работе, но эти возможности его не привлекали. Логистика была бы занозой в заднице — он иммигрировал в США из Индии, а затем должен был бы снова иммигрировать в Европу, — как и ежедневные проблемы, которые приходится решать людям, работающим в клубах.
«Большая часть моей мотивации, когда я начинал заниматься аналитикой, была в некотором роде академической. С моей точки зрения, больше всего я хочу, чтобы поле развивалось в целом, — сказал он. — Я думаю, что один из самых эффективных способов сделать это — оставаться аутсайдером, не быть связанным с определенным клубом или организацией, что имеет несколько преимуществ. Во-первых, конечно, вы получаете возможность открывать исходный код своей работы, вы можете более широко ею делиться, вы можете рассказывать о ней на конференциях, она просто более доступна. А во-вторых, я думаю, что если вы находитесь в среде клуба или компании по обработке данных, то вас всегда будут мотивировать текущие проблемы, будь то проблемы бизнеса или следующая игра, по которой вам нужно подать отчет. Учитывая мой академический склад ума или мотивацию по отношению ко всей этой области, я чувствую себя вполне комфортно в качестве аутсайдера. Это дает мне широкое представление о том, что люди делают по всем направлениям». Он продолжил: «Я не исключаю, что когда-нибудь буду работать в каком-нибудь клубе или организации. В моем списке желаний — поработать в клубе и посмотреть, каково это, а пока я нахожу покой в своем нынешнем положении. Это позволяет мне гибко подходить к выбору идей, которые я хочу исследовать. Если я нахожу что-то особенно интересное, что не совсем мотивировано тем, о чем просит тренер, я могу сделать это без лишних вопросов. У этого есть свои недостатки — у меня не так много контекста на местах, я не работал напрямую с другими практиками, я не знаю, как лучше с ними разговаривать или работать, — но с точки зрения инноваций мне нравится моя нынешняя точка зрения».
Но если придет «Арсенал», кто знает?
* * * *
Помните эту цитату Йохана Кройффа? «Статистически доказано, что игроки владеют мячом в среднем 3 минуты... Итак, самое главное: что вы делаете в течение тех 87 минут, когда у вас нет мяча. Именно это определяет, хороший ты игрок или нет». Она стала вдохновением для одной из самых важных работ, когда-либо написанных о футболе.
Эта работа, написанная Люком Борнном и Хавьером Фернандесом из Барселоны, называлась «Широкие открытые пространства: Статистический метод измерения создания пространства в профессиональном футболе» и была представлена на конференции Слоуна Массачусетского технологического института по спортивной аналитике в 2018 году. Используя данные GPS-слежения с матча Ла Лиги между «Барселоной» и «Вильярреалом», авторы создали динамическую модель, которая по сути является комбинацией статистики Стефана Райнартца и Сингха. Она присваивает значение каждой области на поле в течение всей игры, основываясь на трех факторах: местоположение мяча, местоположение других игроков и близость к воротам. Таким образом, каждая область на поле имеет некое базовое значение, но это значение меняется в зависимости от того, где находится мяч и игроки на поле в данный момент.
Затем Борнн и Фернандес смогли вычислить, какие игроки смогли занять больше всего места и создать больше всего места для своих товарищей по команде в течение 90 минут матча. По занимаемому пространству Лионель Месси не имеет себе равных. Еще одна вещь, в которой Месси превосходит всех остальных: ходьба. «В последние годы много спорят о нескольких моментах во время матчей, когда Месси проходит через зоны поля, — пишут они. — Однако такое поведение при ходьбе — это не отстранение от матча, а сознательное действие, направленное на то, чтобы пройти через пустые пространства, имеющие ценность, и претендовать на контроль над ценным пространством, а в конечном итоге и над мячом».
По своей сути футбол — это битва за пространство: создать и затем использовать пространство возле ворот соперника и уничтожить или ограничить доступ к пространству возле своих ворот. Звезда мюнхенской «Баварии» и сборной Германии Томас Мюллер известен как raumdeuter, или «исследователь пространства». Нескладный, слабо координированный нападающий не обладает очевидными спортивными способностями или навыками. Он похож на неуклюжего фаната, который забрел на поле и начал играть, но у него есть удивительная способность появляться вблизи ворот, без опеки каким-либо защитником. Его голы и передачи говорят сами за себя, но они не объясняют, что именно делает его столь эффективным. Лучшее понимание того, какие пространства имеют значение и кто лучше всего умеет создавать и находить эти пространства, кажется чем-то вроде святого Грааля в этом путешествии к футбольному просвещению. Однако только самые богатые клубы имеют доступ к подробным данным, которые Борнн и Фернандес добыли для своей работы.
В статье говорится о том, что другие звездные игроки, такие как Луис Суарес, Неймар и Андрес Иньеста, также продемонстрировали высокий уровень создания и занятия пространства. Суарес и Месси, лучшие друзья вне поля, продемонстрировали особенно ценную связь и на поле. «Особая связь [между] Суаресом и Месси также показана в этой игре, где оба были способны генерировать большое количество пространства друг для друга», — пишут авторы. Однако был один игрок, который особенно сильно повлиял на пространство, созданное в матче. Он был одним из лидеров «Барселоны» по количеству выигранного пространства, лидировал по количеству созданного пространства и был единственным игроком в команде, который хотя бы раз получал пространство от каждого из своих партнеров по команде. Он, как пишут Борнн и Фернандес, «демонстрирует невероятное коллаборативное поведение, генерируя пространство практически в любой точке поля».
Космический гений, на которого они ссылаются? Серджи Бускетс. И все же есть несколько наболевших вопросов, которые тянут за ниточки к, казалось бы, аккуратному заключению: сколько других полузащитников выглядели бы ловкими операторами пространства, если бы им довелось играть за «Барселону» вместо Бускетса? Даже если Бускетс действительно обладает непревзойденной способностью занимать открытые пространства, стоит ли незначительная разница между ним и средним полузащитником столько же, сколько разница между игроком мирового класса и средним игроком лиги на любой другой позиции? Да и вообще, разве кого-то волновал бы Бускетс, если бы его не окружали величайший игрок в истории и целая армия нападающих и защитников мирового класса?
Возможно, полузащитники действительно не имеют значения. Не в прямом, а в сравнительном смысле — как бегущие в НФЛ. Разница в мастерстве бегущих в НФЛ несомненна, но исследования показали, что успех выносной игры в основном определяется линией нападения и схемой блокирования. За последние пять лет бесчисленное множество высококлассных и талантливых бегущих получали травмы, которые заканчивали их сезон, а на смену им приходили запасные игроки, и нападение команды не испытывало никакого спада. Может ли то же самое произойти и в футболе? Команда явно пострадала бы от того, что игрок с двумя бетонными блоками вместо ног коснулся бы мяча 90 раз за игру и постоянно бы терял его. Но эти игроки не выходят на высший уровень спорта, поэтому, возможно, разница между средним полузащитником лиги и лучшим в мире существует, как выразился Лоуренс, в пределах «погрешности», поскольку большинство их действий происходит в той части поля, которая почти не влияет на вероятность забить или пропустить гол. Он не верит в это, но правда в том, что мы до сих пор не знаем.
Помимо подкатов и перехватов, более широкие оборонительные характеристики полузащитников не учитываются в этих моделях, но измерение защиты — труднодостижимая задача во всех видах спорта. Что касается попыток сделать это в баскетболе, Борнн сказал Заку Краму из The Ringer: »[У нас] были одни из самых ярких аспирантов в области информатики и статистики [в Гарварде], и для нас это все равно было серьезной проблемой, так что я не думаю, что это что-то, с чем легко справиться». В НФЛ оборонительные показатели команды по большинству показателей из года в год имеют очень слабую корреляцию. Я слышал, что лучшим предсказателем эффективности защиты футбольной команды является качество нападения, против которого она играет. «Я думаю, что у меня есть небольшой аппетит, чтобы больше смотреть на оборонительную сторону игры, — сказал Карун Сингх, — это то, что является темой в аналитике, которую мы не смогли сделать настолько успешно».
Есть еще один момент, которого не хватает этим моделям. Рассматривая игру через эту призму, вы неявно предполагаете, что каждое действие на поле направлено на оптимизацию разницы мячей команды, но это просто не так — особенно в полузащите. Когда игрок получает мяч в полузащите, ему приходится принимать решение в доли секунды, и лучшие игроки проводят анализ затрат и выгод в своей голове, но не совсем так, как эти модели видят игру. Они не думают: «Какое действие я могу предпринять прямо сейчас, чтобы немедленно увеличить вероятность забитого гола?» В противном случае они бы при каждой возможности бомбардировали мяч вперед — худшая версия заброса мяча Рипа. Нет, они думают: «Какое действие я могу предпринять прямо сейчас, чтобы увеличить вероятность того, что мы в конечном итоге выиграем — или, в некоторых случаях, сведем к ничьей — эту игру?»
«Я думаю, что это заставляет задуматься о том, что именно определяет ценность игрока в конкретной ситуации, — сказал Сингх. — И там могут быть показатели, которые совершенно не связаны с тем, будут ли они дальше набирать очки». Возможно, в некоторых фазах игры вы хотите утомить соперника, который прессингует выше по полю, играя в несколько пасов, которые не несут особой смысловой нагрузки, но увеличивают этот показатель для вас, снижая энергию соперника. И, возможно, в этом кроется какая-то внутренняя истина: именно в полузащите достигается баланс, и именно поэтому мы уделяем так много внимания хорошим полузащитникам, которые хорошо контролируют игру и могут найти этот компромисс».
Возможно, истинная ценность лучших полузащитников, таких как Бускетс, заключается в том, что они обладают врожденной способностью понимать темп игры. Они знают, когда команда в целом готова двигаться вперед, а также знают, когда команде нужно отступить и восстановить силы. Эти решения могут не приводить непосредственно к голам и не отображаться в моделировании «ценности на мяче», но в долгосрочной перспективе — полный матч, полный сезон, полная карьера — они увеличивают вероятность победы команды так, как мы пока не можем определить количественно. Или, как сказал Висенте дель Боске, бывший менеджер сборной Испании: «Если вы посмотрите всю игру, то не увидите Бускетса, но посмотрите Бускетса, и вы увидите всю игру».
Приглашаю вас в свой телеграм-канал, где переводы книг о футболе, спорте и не только!