Все хотят взломать футбол: «Арсенал» тратится на алгоритм для скаутов, а Депай выбрал «Лион» математическим моделированием
Мы в будущем.
Скаут Свен Мислинтат в своем кабинете
Футбольные скауты – таинственные персонажи без имен и фамилий. О них редко говорят, но именно они первое звено глобальной футбольной цепочки: великие карьеры начинаются с того, что великих кто-то обнаружил на заброшенном деревенском поле.
Десять лет назад во вселенной скаутов случился перелом. До: низкооплачиваемые романтики, которые жили за рулем, наматывали сотни тысяч км в год и мокли у поля, потому что высматривали нового Месси. После: ботаники с ноутбуками, которые делали ту же работу (только эффективнее), но не вставая со стула. И про этих людей есть, что рассказать:
• Главный по новичкам «Ливерпуля» вообще не смотрит футбол. С помощью статистики он нашел Кейта и одобрил трансферы Салаха и Коутиньо.
• Скаут «Боруссии» изобрел классный алгоритм, но что-то пошло не так: программа назвала лучшим посредственного защитника.
• Статистику для «Арсенала» считают 500 человек в Лаосе и Камбодже. Эти данные стоят миллионы евро, все началось с провального трансфера Шамаха.
• «Арсенал» хотел привязать зарплаты к статистике
• Депаю подбирали «Лион» с помощью математики. Мы связались с авторами этого алгоритма.
А теперь подробнее.
Топ-клубам ежегодно предлагают по 2-3 тысячи футболистов, всех невозможно просмотреть
В конце нулевых футбол захватывала продвинутая (на тот момент) статистика: она обсчитывала обводки, точность передач, выигранные единоборства. А компании вроде WyScout и Instat пополняли профайлы десятков тысяч профессиональных игроков: можно было получить не только цифры, но и видеоподборки нужных действий (те же отборы, удары по воротам, единоборства). Футбольных агентов лишили главного приема – они больше не могли забрасывать клубы DVD, на которых их клиенты выглядят как суперзвезды (фантастический дриблинг, голы с центра поля и никаких ошибок). Всю информацию теперь легко было проверить.
Одновременно с этим появилась другая проблема – обработка этих данных и правильные выводы. Как понять, что плеймейкер из Японии, который отдает море ассистов, годится для Бундеслиги? Что норвежский вратарь с десятью сэйвами за игру сможет делать то же самое в АПЛ? Что суперэффективный дриблер из Уругвая не потеряется в Ла Лиге?
Свен Мислинтат
На первый взгляд, ответ: никак, профессиональные скауты должны каждого оценивать отдельно. Но проблема в том, что топ-клубам Европы ежегодно предлагают по 2-3 тысячи футболистов. И если вам нужно найти левого защитника, то надо просмотреть сотни профайлов и утонуть в цифрах. Скаут «Боруссии» Свен Мислинтат одним из первых понял, что так дальше нельзя, нужны первичные фильтры, которые сэкономят часы работы. Автор книги «Футбольные хакеры, наука и искусство революции данных» Кристоф Бьерманн называет Мислинтата звездой мира скаутов.
И не зря. Мислинтат помог Клоппу собрать чемпионскую «Боруссию», при нем клуб нашел в Японии Синдзи Кагаву и подписал его бесплатно, а через два года продал в «МЮ» за 16 млн евро. Суммарная стоимость состава «Боруссии» за 5 лет работы Мислинтата выросла на 182 млн евро (данные Transfermarkt, они очень условны, но в целом верно отражают рыночную мощь состава), при этом они вообще не потратились на трансферы – наоборот, были в плюсе (+38 млн евро). То есть футболисты прибавляли в цене, играя в футболке «Боруссии».
Скаут «Боруссии» придумал почти идеальную систему анализа, но облажался на презентации
В 2012-м Мислинтат придумал собственный алгоритм анализа данных. Его основа – разделение поля на 100 квадратов, у каждого свой коэффициент полезности. Победа в единоборстве во вратарской ценилась намного больше, чем в центре поля. Та же история для передач и ударов по воротам. Все это Мислинтат рассказал боссам «Боруссии» – они с интересом смотрели слайды и слушали. Все шло просто отлично, пока Мислинтат не показал символическую сборную сезона по версии алгоритма. В центре обороны светился игрок со дна Бундеслиги – Лассе Собех из «Гройтер Фюрта». В «Боруссии» прекрасно знали этого футболиста – он вырос в местной академии и ничем не запомнился. Спортивный директор Михаэль Цорк и СЕО Ханс-Йоахим Ватцке вышли из комнаты со смехом.
В следующие недели Мислинтат думал, что же пошло не так, почему алгоритм подсунул посредственного футболиста, и нашел ответ: «Гройтер Фюрт» в том сезоне очень глубоко оборонялся, не закрывал фланги и позволял много навешивать. Собех – высокий парень (1,96), неудивительно, что он снимал весь воздух. В итоге защитник совершал около 200 оборонительных действий, тогда как вся команда около 1000. То есть его вклад в оборону – 20%.Для сравнения – Джером Боатенг из «Баварии». Алгоритм просто не заметил его 50 оборонительных действий. Но если смотреть в масштабе команды, то вклад Боатенга в оборону «Баварии» был выше – 25% от всех действий в защите (200). Это открытие помогло Мислинтату усовершенствовать алгоритм, но в клубе отказались финансировать проект. Логика боссов ясна: если программа посоветует условного Лассе из чемпионата Чили (за которым никто не следит), то есть риск, что ошибку обнаружат после того, как на футболиста потратят деньги.
Лассе Собех (наверху) в борьбе за мяч
Мислинтат не получил денег на разработку, но остался в клубе. И параллельно вместе со знакомым статистиком и дизайнером вел работу над собственным стартапом Matchmetrics – в его основу легли те самые алгоритмы из презентации, только исправленные. Компанию запустили в 2016-м, у Matchmetrics была особая стратегия: в каждой стране работать только с одним клиентом. Возможно, это связано с тем, что Мислинтат тогда был в штате «Боруссии», и было бы странно, если бы скаут дортмундцев помогал прямым конкурентам. Сейчас таких жестких ограничений нет, но клубы за дополнительные деньги могут выкупить эксклюзив на такие данные. В 2017-м Мислинтата позвали в «Арсенал».
«Арсенал» затеял революцию данных после провального трансфера Шамаха. Клуб нанял 500 статистиков в Лаосе и Камбодже
В Лондоне очень внимательно относились к продвинутой статистике. Владелец Стэн Кронке когда-то инвестировал в НФЛ и не пугался, когда его просили подписать чек на несколько миллионов для совершенствования системы сбора данных. Вообще «Арсенал» – возможно, первый клуб, который всерьез попытался взломать футбол с помощью математики. Все началось с двух трансферов.
В сезоне-09/10 за «Бордо» искрил Маруан Шамах: забил пять в ЛЧ (включая квалификацию), в Лиге 1 – десять плюс четыре ассиста. 26-летний свободный агент с неплохой статистикой в топ-чемпионате – то, что нужно для «Арсенала». Летом Венгер перетащил марокканца в Лондон. Все началось здорово (11 голов в 22 матчах), но потом Шамах завял: катался по арендам и сейчас уже вообще не играет в футбол.
Через год в «Арсенал» из «Монако» за 5 млн приехал форвард Пак Чу Ен. Финал его истории еще хуже – кореец после «Арсенала» не смог заиграть даже в Саудовской Аравии. В обоих игроков «Арсенал» суммарно вложил около 34 млн фунтов, включая зарплату и комиссии агентам. Эти деньги точно никак не отбились.
К 2012-му с Шамахом и Пак Чу Еном все было ясно, но их вдруг обсуждали в офисе клуба. Перед Арсеном Венгером с презентацией выступал немец Хендрик Альмштадт – он уверял, что математика могла бы спасти «Арсенал» от ошибок. Венгер слышал примерно такие тезисы:
• В «Бордо» у Шамаха был низкий xG. Да, «Арсенал» впечатлило количество ударов по воротам, но почти всегда марокканец лупил из позиций, с которых забить почти невозможно.
• Взаимодействие Шамаха с партнерами во время позиционного нападения и контратак еще в «Бордо» было на минимальном уровне.
• Еще до трансфера было ясно, что это технически слабый игрок, непригодный для игры за топ-клуб АПЛ.
Альмштадт добавил, что это лишь поверхностный анализ, математика может больше. Венгер был впечатлен (потом несколько раз говорил об xG на пресс-конференциях) и немедленно сообщил руководству, что ему нужны эти данные. «Арсенал» на эксклюзивных условиях подписал компанию StatDNA (именно с их данными работал Альмштадт), услуги стоили около 2 млн евро в год, а вскоре и выкупил ее. В руководстве особо не спорили, потому что эти деньги могли спасти клуб от неоправданных трат в будущем.
StatDNA обсчитывала футбол гораздо глубже Opta и других компаний – пользовалась данными Digital Divide Data. На компанию работало около 500 человек в Лаосе и Камбодже. Мужчины и женщины часами сидели перед мониторами в азиатских офисах, смотрели матчи и составляли детальнейшие отчеты по секретным инструкциям.
Они высчитывали xG по более сложным алгоритмам: учитывали количество защитников между бьющим и воротами, давление, которое оказывалось на бьющего, с рабочей ли ноги наносился удар, в каком положении был вратарь.
На обработку одной игры уходило несколько часов, поэтому StatDNA вела только статистику по топ-лигам, но «Арсеналу» было достаточно.
Хендрик Альмштадт
В то же время клуб ставил новые задачи:
1. Для упрощения скаутинга клубу нужен был внятный показатель, определяющий вклад в развитие атак. Так изобрели Pass Value (ценность паса) – просчитывалась вероятность гола после каждой передачи и игроку присваивался Value Creation (индикатор креативности).
2. Альмштадту был очень нужен показатель для оценки защитников. Например, Пер Мертезакер считался топовым игроком центра обороны, но по статистике это понять невозможно: небольшое количество отборов и перехватов, невпечатляющий процент выигранных единоборств. Поэтому лаосская команда научилась высчитывать «оборонительные ошибки»: когда игрок защиты действует слишком медленно, теряет позицию или неправильно располагается по отношению к атакующим игрокам. Применяя этот фильтр, «Арсенал» мог находить футболистов, похожих на Мертезакера.
«Арсенал» хотел привязать зарплаты к статистике, а Торрейру нашел через алгоритм «вам также понравится»
Параллельно с аналитическим отделом в клубе продолжала работу классическая команда скаутов. Они с недоверием и насмешкой относились к Альмштадту и его метрикам. Но руководство было в восторге – «Арсенал» даже попросил немца придумать, как привязать зарплатную ведомость к футбольной статистике.
«Вот тебе 30 игроков, смотри на них как на инвестиционные портфели, что бы ты предложил сделать?» – говорил гендиректор клуба Иван Газидис, который помнил, что Альмштадт пришел в футбол из финансовой компании.
Иван Газидис
Но к 2015-му Альмштадт не поделил сферы влияния с другими менеджерами и ушел. На его место позвали того самого Мислинтата из «Боруссии», который пришел с новой задачей: с помощью цифр откапывать неизвестные таланты, а не просто готовых футболистов из топ-чемпионатов. Теперь сети «Арсенала» должны были нарыть не только топ-лиги, но и весь мир.
Мислинтат постоянно искал уязвимости и совершенствовал методы поиска и анализа. В «Арсенале» он внедрил в свой алгоритм «вам также понравится» (вы точно сталкивались с такой штукой – например, на ютубе или в интернет-магазинах). И благодаря этому натолкнулся на Лукаса Торрейру – программа предложила уругвайца, когда Мислинтат просматривал данные Нголо Канте. Мислинтат и раньше знал полузащитника «Сампдории», но признался, что мог не вспомнить об этом футболисте без подсказки. Сейчас Торрейра – важный футболист «Арсенала», кстати, лучший игрок дерби северного Лондона в 2018-м (4:2).
Правда, с годами Мислинтат слегка остыл к цифрам: «Алгоритм может сгенерировать список из 10-20 футболистов, но кто-то из них будет слишком стар, у кого-то долгосрочный контракт с нынешним клубом, кто-то просто недоступен. А остальных нужно анализировать системно, цифры вам не могут сказать всего, нельзя просто прочитать футболиста».
Мислинтат (кстати, уже ушел из «Арсенала») работал примерно так: отсматривал полностью два-три тура какой-нибудь отдельной лиги (например, Швеции), с помощью видео и цифр составлял профайлы на нескольких игроков, а потом вместе с помощниками ехал оценивать трансферные цели со стадиона. Но есть и более продвинутые методы.
Главный по поиску новичков в «Ливерпуле» не ездит на стадионы, он вообще не смотрит футбол
Иан Грэм закончил Кембридж, должен был стать физиком-теоретиком, но через пару лет понял, что займется чем-нибудь другим. Сейчас он директор по поиску новых игроков в «Ливерпуле». Выдающийся прошлый сезон – отчасти его заслуга. Хотя бы потому, что он повлиял на назначение Клоппа.
«Наш главный департамент вот там, в задней части здания, – говорил Клопп Брюсу Шенфилду из NY Times, показывая на офис аналитиков. – Благодаря им я здесь».
В команде Грэма работает еще три человека: астрофизик (Тим Уаскетт), бывший чемпион по шахматам в юниорах со степенью по математике (Дафидд Стил) и доктор наук, получивший степень по физике элементарных частиц в Гарварде (Уилл Спирман).
Первая встреча Грэма и Клоппа получилась смешной. Аналитик познакомился с тренером после назначения, положил на стол кучу распечатанных таблиц и графиков и предложил обсудить прошлогоднюю игру «Боруссии» и «Майнца». Грэм показал впечатляющие данные: дортмундцы 85 раз переходили в финальную треть («Майнц» только 55), врывались в штрафную 36 раз («Майнц» только 17), но не забили и уступили из-за двух случайных ошибок. Аналитик клонил к тому, что «Боруссия» сыграла блестяще и результат несправедлив.
– Мы их просто убили! – громко ответил Клопп. – Ты же видел игру?
– Нет.
Грэм действительно не смотрел матч, а просто проанализировал цифры. Более того – он изучил не только игру с «Майнцем», а весь сезон «Боруссии». По его данным, Клоппу феноменально не везло весь сезон, Дортмунд должен был финишировать не седьмым, а четвертым. И когда многие называли Клоппа перегоревшим персонажем после одного неудачного сезона, Грэм восторгался статистикой и говорил об этом руководству «Ливерпуля».
И да, нужно повторить еще раз: Грэм не смотрит футбол: «Мне не нравится смотреть видео. Оно только сбивает с толку».
И да: он действительно отвечает за подбор потенциальных новичков в «Ливерпуле».
Интересно, что Клопп в свою очередь не особо интересуется цифрами. Их тандем идеален.
Грэм рассказывал, что в своей работе не доверяет тому, что принято считать продвинутой статистикой, и придумывает свои формулы. Например, оценивает шансы забить гол перед каждым действием футболиста (пас, удар, единоборство) и по итогам выводит вклад каждого в результат. На создание этой модели ушли месяцы. Грэм участвовал во всех ключевых трансферах «Ливерпуля», вот три главных истории.
1. Наби Кейта. В австрийском «Ред Булле» гвинеец играл опорника. Аналитик обратил внимание на странность: в отличие от футболистов своей позиции Кейта часто перевоплощался в атакующего полузащитника. Процент точности паса у него был ниже, чем у топовых полузащитников, но Грэм просчитал: потенциально это были очень опасные передачи, Кейта постоянно думал, как доставить мяч в наиболее выгодную зону. В результате «Ливерпуль» начал охоту за игроком в 2016-м, но выкупил его только прошлым летом за 60 млн евро.
2. Мохамед Салах. Это сейчас он король Египта и мирового футбола, но еще пять лет назад разочаровал «Челси»: за два сезона провел только 13 матчей и забил два гола, потом уехал в «Рому». Когда Салах заискрил в Италии, было опасение: сможет ли он играть так же в АПЛ, опыт «Челси» подсказывал, что не сможет. Грэм изучил 500 минут игры Салаха за лондонцев и сделал вывод: в минуты игры за «Челси» он делал такой же вклад в игру, как и в «Роме». И рекомендовал подписать игрока.
3. Филиппе Коутиньо. Грэму заказали аналитику по вингеру «Интера» – он подключил свою модель и дал добро. В итоге тогда малоизвестного бразильца купили примерно за 13 млн евро. Коутиньо вывел «Ливерпуль» на новый уровень и уехал в «Барсу» за 145 млн. Без этих денег клуб вряд ли позволил бы себе вратаря Алиссона и защитника ван Дейка.
Грэм до сих пор ищет новичков для «Ливерпуля» из своего белого кабинета. Отчасти благодаря ему все больше клубов доверяют цифрам. Но статистика работает и в обратную сторону.
Депай искал новый клуб с помощью статистической компании
Математика вполне может работать и в другую сторону – по идеальным параметрам можно выбирать не только футболиста, но и клуб. Правда, игроки почти не пользуются этой опцией, известен только один случай – переход Мемфиса Депая в «Лион».
С 2015-го он играл за «Ман Юнайтед», но очень скоро загрустил. Таблоиды высмеивали красные шляпы, а ван Гал запирал игрока на фланге, при Моуринью Мемфис вообще сел на лавку. За «МЮ» он забил 7 мячей (2 в АПЛ) в 53 матчах и винил во всем тренеров. К 2017-му понял, что его импульсные решения явно ведут мимо цели (заиграть в «Реале», получить «Золотую бутсу»), поэтому к выбору нового клуба нужно подойти серьезнее. Вместе с агентом они придумали необычную схему: найти идеальное место через математическое моделирование. И обратились в компанию SciSports, которая до сих пор гордится этим сотрудничеством.
«К нам обратился его агент Кис Плоегсма-младший, – рассказывает Sports.ru основатель и гендиректор компании Гилс Брауер. – Он объяснил, что клиент планирует сделать новый шаг в карьере. Мы поехали в его дом в Манчестер на встречу. Мемфис рассказал, что хочет играть так же, как в сборной Голландии и в свой последний сезон в ПСВ».
Депай имел в виду более свободную роль – без привязки к флангам и максимумом креативных функций. Парни из SciSports записали пожелания и подключили к выбору свой алгоритм. Брауер рассказал, что они использовали четыре ключевых фильтра:
• стиль игры (в случае с Депаем ультраатакующий)
• соответствие финансовых возможностей клуба трансферной стоимости игрока и его запросам
• выбор определенных лиг
• игровое время, которое потенциально может получить футболист
В итоге Депаю принесли список: «Эвертон», «Фенербахче», несколько клубов из Италии и Испании и «Лион» (это данные голландских медиа, в SciSports не раскрывали детали списка). Данные показали, что французский тренер Брюно Женезьо теоретически может обеспечить нужную свободу, креативные показатели его футболистов выше среднего.
При этом важно уточнить, что SciSports анализировал именно цифры (причем не только футбольные):
– В случае с Мемфисом мы не знали, что «Лион» действительно интересовался футболистом, – продолжает Брауер. – Наши поиски были сосредоточены на перспективах игрока и его возможном вкладе в новую команду.
– Ок, предположим, я 31-летний центральный полузащитник, который не в форме. Я не могу бегать все 90 минут. С чего начнете, подбирая для меня клуб?
– В этом примере самый важный критерий – финансовая компенсация (соответствие запросов возможностям покупателей), так как вы не можете выкладываться на 100%. Система в первую очередь будет фильтровать клубы по этому критерию и искать команды с нехваткой исполнителей на вашей позиции.
В «Лионе» Депаю дышалось свободнее, хотя он все еще был привязан к левому флангу – во второй половине сезона-2016/17 забил пять мячей. Следующий сезон прошел идеально: 19 мячей в 36 матчах Лиги 1 и еще три гола в Лиге Европы. Через год Мемфис освоился и стал обижаться на тренера, когда его оставляли в запасе. Например, мог просидеть на мяче всю предматчевую разминку. Но в сборной, где ему доверяют без оговорок, проблем нет. При Кумане форвард сыграл во всех 12 матчах, забил 8 и отдал 5 ассистов и главное – выходил в центре атаки. Рональд тепло относится к Мемфису (возможно, потому что редко видит) и дает необходимую свободу на поле. Журналисты, близкие к сборной, говорят, что у игрока и тренера идеальные отношения.
По слухам весной Депай задумался об уходе из «Лиона», несмотря на то, что Женезьо тоже уходит летом. Пора снова включать математику.
***
Первый Championship Manager (сейчас Football Manager) появился в 1992-м. К нулевым игра дошла до России, она впечатляла мощью базы данных и возможностями по тем временам. Но все равно была нереалистичной – форварда можно было подобрать в два клика, отсортировав игроков по нужному показателю в табличке. Тогда это казалось нереалистичным – ведь в настоящем футболе таланты ищутся по-другому (те самые олдскульные скауты, которые катаются по Южной Америке и Африке), легионеров привозят целыми отрядами на просмотры (вспоминаем «Спартак» 90-х), а под ногами крутятся агенты со своими даром убеждать. Казалось, FM нужно делать шаг к реальному футболу, внедрять все эти штуки из реального мира. Но так вышло, что реальный сам сделал шаг к футбольным менеджерам.
Как xG захватывает мир футбольной статистики
Футбольный рынок дико сложный: топ-клубы путаются в правилах, а игроки не знают свою зарплату
Налоги – мощнейшая сила. Они съедают ползарплаты топ-футболистов и влияют на трансферы
Фото: globallookpress.com/imago/DeFodi, imago/GEPA pictures; Gettyimages.ru/Friedemann Vogel/Bongarts, Dennis Grombkowski; globallookpress.com/Panoramic, A Bibard/FEP/Panoramic/ZUMA Press; sloansportsconference.com; globallookpress.com/UPPA/ZUMA Press, Silvia Lore/ZUMAPRESS.com; Gettyimages.ru/Catherine Ivill, Alex Livesey; ol.fr/olweb.fr; liverpoolfc.ru; youtube.com/Squakenet
Клопп, Пеп, Моуриньо - все эти тренеры добились успеха и являются гигантами своего дела, не оперируя цифрами об xG (даже немного пренебрежительно к ним относятся), а благодаря мощному логическому аппарату, который помогает им понимать игру на более глубоком уровне. Цифры лишь подтверждают их видение футбола.
Так что молиться на статистику - дело такое себе, числа сами по себе не панацея и не решение проблем. Но и утверждать, что это гомеопатия, как было написано тут в недавней статье, я тоже не стал бы. Как вспомогательный инструмент может оказаться очень мощным оружием.
Большое спасибо за материал
Так то Глушакову 32 уже)
А получают они по 5 долларов и миску риса в день