8 мин.

Data Science становится ключевой компетенцией футбольных клубов. Почему?

Предыдущий пост, первый в этом блоге, был посвящен работе Бенфики с данными и пользой, которую клуб из этого извлекает. Развивая тему, хочется пойти дальше и поговорить о том, какую роль в принципе данные играют для современных клубов, как и где используются, и что может пойти не так. 

Клуб - больше чем футбольная команда

Крупный футбольный клуб – это достаточно сложная с точки зрения организации система, вполне сопоставимая с традиционным бизнесом. При этом, болельщики редко оценивают клубы как бизнес-структуры, требуя в первую очередь результатов на футбольном поле и красивой игры, то есть вещей, которые, хоть и влияют на генерацию прибыли, но косвенно, а в некоторых случаях стремление прыгнуть выше головы на футбольном поле приводит к плачевному итогу. Вполне типичный пример – Анжи, решивший вместо поступательного развития клуба в целом (тут можно вспомнить Сергея Галицкого) ограничиться оптовой закупкой звёздных игроков. Другие примеры, скажем, Рубин и Ростов Бердыева, наглядно демонстрируют, что даже высокие результаты без аномальных вложений не дают в долгосрочной перспективе абсолютно ничего, если бизнес-структура клуба находится на уровне каменного века. Как только футбольный успех (в таких случаях краткосрочный и завязанный на тренере и обстоятельствах) проходит, клуб, не способный превратить результаты в усиление бренда, расширение фан-базы и рост доходов, оперативно скатывается обратно.  

В последние годы бизнес по всему миру захватила парадигма «любая компания должна стать IT компанией». Технологии действительно активно смывают границы между отраслями, уничтожают барьеры для входа на рынки и дают огромное конкурентное преимущество. Практически в каждую индустрию сейчас приходят игроки с лучше организованными процессами и IT-ориентированной бизнес-моделью, забирая маржу у отсталых конкурентов. На фоне этого футбол местами выглядит как Затерянный Мир Конан Дойля – недоступное плато в лесах Южной Америки, на котором глобальные изменения замерли, и клуб, отставший по всем показателям, может добиться пусть краткосрочного, но яркого успеха - ситуация, с трудом вообразимая для обычных коммерческих компаний. Впрочем, в долгосрочной перспективе технологии и выстроенная организация даже в футболе дают ощутимые преимущества, что проявляется всё более явно. 

Как это работает?

Анализ данных - ключевой инструмент для развития клуба: полученная информация позволяет повысить качество принимаемых решений на всех уровнях. Ниже я нарисовал обобщенную структуру клуба, чтобы было легче понять, какие основные блоки в принципе существуют.  

 

Футбольный блок в больших клубах всегда будет так или иначе обособлен. Во многих случаях сейчас вся футбольная часть сходится на одном человеке, который перестаёт быть просто тренером: он отвечает за подготовку команды, контролирует трансферы и работу служб, непосредственно связанных с футболом. Так работает Клопп в Ливерпуле, схожие полномочия были у Венгера в Арсенале.  

Какие же данные нужны для эффективной работы этого блока? Именно благодаря чисто футбольным данным у нас с вами есть возможность регулярно читать на этом сайте аналитические статьи и аргументированно клеить ярлыки брёвен и физруков. Само собой, мы видим только малую часть этих цифр, в первую очередь, те, которые собираются не клубами, а статистическими компаниями, анализирующими матчи (Opta, Instat). На каждой игре у Опты работает три человека – по одному для отслеживания каждой из команд и один для контроля. С помощью специального софта, горячих клавиш и установленных шаблонов они фиксируют происходящее на поле в реальном времени, в результате выходит порядка двух тысяч единиц данных за матч. Всё это обрабатывается командой аналитиков и используется на ТВ, в прессе и самими клубами. 

К счастью, технологии позволяют всё больше автоматизировать процесс и увидеть более полную картину. Когда сбор данных с матчей только зарождался в 1950-х, основными инструментами были ручка и блокнот, а анализ одного матча занимал месяцы. Об особо интересных выводах, сделанных пионером футбольной статистики, Чарльзе Рипе, писал Вадим Лукомский, да и некоторые детали его работы уже описывались на Sports.ru год назад.  

После 90-х годов, когда начали активно применять видеоанализ, главная инновация наших связана с Интернетом Вещей (Internet of Things). Эта концепция в целом сравнима с Big Data и блокчейном по сочетанию широкой популярности и отсутствия у публики понимания принципов работы и областей применения технологии (отличная популярная статья про IoT по ссылке).  В спорте интернет вещей создал абсолютно новую индустрию за счёт появления носимых сенсоров. 

Стало возможным в реальном времени получать огромное количество информации о функциональном состоянии футболистов и их активности. Помимо уже привычных всем тренировочных жилетов, сенсоры ставятся в бутсы, мяч и на само поле. Рынок тут же заметили IT гиганты, такие как SAP и Cisco. SAP, помимо прочего, активно работал со сборной Германии перед победным ЧМ в Бразилии, с помощью команды тестируя последние разработки, и продолжает делиться технологиями с Хоффенхаймом.  

Передача данных в реальном времени позволяет журналистам уже в перерыве активно анализировать игру, а тренерам вносить корректировки по ходу дела. Хороший пример - работа тренерского штаба сборной России на Чемпионате Мира. Прорыв на самом деле удивительный, ведь каких-то десять лет назад всё это звучало как научная фантастика.  

Постепенно тренеры и руководители клубов понимают, что технологии и данные дают огромное преимущество. Когда отчеты от статистических компаний помогают выигрывать матчи, резонно возникает вопрос: "Постойте-ка, а почему бы нам не использовать то же самое на тренировках или где-то еще?".  Организационная схема клуба, приведенная в начале текста, отражает основные задачи, с решением которых помогают данные: тренировочный процесс, медицина, анализ соперников и скаутинг.  

Интересно, что, если в первых трёх случаях использование данных активно приветствуется, то поиск игроков на основе цифр вызывает много критики. Проблема отлично отражена в знаменитой книге "Moneyball" Майкла Льюиса, с той разницей, что книга написана о бейсболе, значительно более просчитываемой игре. В случае с футболом сложились два лагеря: один, вооружившись таблицами, сыпет числами отборов и перехватов, другой же цитирует Йохана Кройффа, заявлявшего, что с современными тестами и статистикой его бы никогда не взяли в Аякс.  

Правда, вероятно, как всегда где-то посередине: данные могут помочь найти качественного, недооцененного и подходящего под систему футболиста, но они не должны становиться мантрой. Существует слишком много факторов, которые невозможно оценить статистически, и иногда именно они отличают просто хорошего игрока от гениального. Иронично, но одни из самых известных скаутинговых неудач, вызванных данными, ударили по Арсену Венгеру, который считается одним из главных приверженцев научного подхода. В какой-то момент Арсенал начал пользоваться услугами аналитической компании StatDNA, выкупив её за 2.1 млн фунтов. По рекомендациям аналитиков, в частности, Арсенал приобрел Габриэла Паулисту, Шкодрана Мустафи и Мохаммеда Эль-Нени и отказался от Антуана Гризманна, показатели которого выглядели неубедительно.  

Какие риски возникают?

За последние годы в мире прогремело несколько крупных скандалов, связанных с утечкой данных. Само собой, подобный риск существует и в футболе. Любая информация, дающая преимущество, автоматически становится ценной для конкурентов, что формирует рынок. Раз данные о тренировках и состоянии футболистов полезны для тренерского штаба, другие клубы могут использовать их для разработки собственных планов. Кроме того, такая информация крайне ценна для стороны-покупателя при трансфере. Этим летом Ливерпуль, по информации английских изданий, был готов заплатить 53 млн фунтов за Набиля Фекира, но сделка сорвалась после появления сомнений в состоянии колена нападающего Лиона. Можно представить, какую сумму англичане могли бы отдать за доступ к детальным тренировочным и медицинским данным Фекира до начала переговоров.  

Ключевая проблема даже не в отсутствии инструментов по защите данных, а в недостатке осведомленности о проблеме и необходимых мерах предосторожности. . Шан Джон, специалист по защите данных, работавшая в команде Ф1 Уильямс, так характеризует угрозу: "Собирается огромное количество данных, и, как это часто бывает с Интернетом Вещей, технологии создаются экспертами в спортивной науке, которые часто просто не задумываются о возможных атаках". В Формуле 1, где каждая команда уже давно превратилась в IT лабораторию, проблеме утечек уделяется огромное внимание: "Весь бизнес в Ф1 это данные. Утечка данных или даже обычный вирус, скорее всего, означает поражение в гонке. Если вы посмотрите на Формулу 1, там повсюду дата-центры, обрабатывающие каждую наносекунду гонки, чтобы найти способы улучшить результат. Попадание этих данных в чужие руки - катастрофа, поэтому безопасность уделяется огромное внимание". 

Пока футбол не имеет той зависимости от данных, что и Формула 1, но эта зависимость растёт вместе со стоимостью потенциальных утечек. Важнейший шаг для любого клуба, инвестирующего в сбор и анализ данных,- защитить эти инвестиции. 

Что будет дальше? 

Совершенно очевидно, что объем собираемых данных и распространение продвинутых моделей будут только расти в ближайшие годы. Для клубов, вкладывающих десятки и сотни миллионов в покупки игроков, немыслимо отказываться от относительно дешевого, но крайне ценного способа улучшения своих результатов. Современные футболисты находятся под жесточайшим контролем фитнес-тренеров, диетологов и других специалистов, под лупой изучается буквально всё, что позволит выжать из игроков больше. Технические решения для сбора и анализа данных, как любая инновация, развиваются, падают в цене и становятся всё более стандартизированными. Главное - данные лишь расширяют возможности для клубов, в футбол по-прежнему играют живые люди.  

Вместо послесловия 

Возвращаясь к диаграмме со структурой клуба, можно заметить, что в этом тексте покрыта только непосредственно футбольная часть. Чтобы не затруднять чтение, я решил разбить тему на два блока - будет отдельный текст с разбором использования данных для бизнес-задач клуба, а также мысли по поводу архитектуры решений для интеграции всего этого. 

Буду рад учесть комментарии по формату/содержанию. 

Для личной связи всегда доступен Telegram @max_vsh