Будущее 2.0. Осознанный спорт
Фото: Reuters/Toru Hanai
Всем привет, это новая предновогодняя серия текстов про будущее спорта в разных его проявлениях. Для опытных читателей: темы будут не особенно пересекаться с моими текстами прошлого года, более того, на этот раз я постарался получше структурировать материалы и разумно ограничить их тематику. На количестве слов, впрочем, я не стал экономить (хотя и не пытался охватить все на свете) – поэтому, если тема вас заинтересует, лучше сделать себе кофе, а если не заинтересует – подождать следующего текста.
Все дальнейшее – не столько мои фантазии, сколько попытка собрать воедино то, что уже действительно делается в мире, пусть где-то быстрее, а где-то медленнее. Для начала мы поговорим о том, что в новом мире нужны новые средства для понимания спорта и достижения эффективности в нем. Старые рецепты могут работать – но нужно понимать, почему. Короче, я попробую рассказать, что “спортивная аналитика” – это не набор газетных клише, а наука, которая только начинает развиваться по-настоящему.
Новые научные подходы к статистике и аналитике
К футбольной статистике большинство людей относится довольно скептически. Даже главный эксперт “Трибуны” в области футбольной тактики Евгений Шевелев, занимающийся этой самой статистикой профессионально, как-то говорил, что все эти обводки, отборы и точные передачи вперед мало что значат без тактического анализа эксперта, который сможет их правильно интерпретировать в свете игры команды.
По сути, это означает, что цифры используются в первую очередь для иллюстрации мыслей эксперта. Их значимость недооценивается настолько, что в футбольных протоколах до сих пор не указывается ничего, кроме игровых минут, карточек и голов – даже голевые передачи разные статистические компании и СМИ считают по-разному. (И журналисты с комментаторами после этого еще недовольны футбольными болельщиками, а те – текстами; да всем куда проще было бы разговаривать о футболе, а не о “мразотности” отдельных игроков и сданных матчах, если бы у них для этого была какая-то фактическая основа).
Конечно, есть виды спорта, где “протокольная” статистика считается лучше и значит больше. Правда, как правило, для этого ее все равно приходится обрабатывать. Бейсбольная “саберметрика”, известная многим благодаря фильму “Moneyball”, отказывается от традиционных для бейсбола показателей, тщательно собирающихся больше сотни лет, вводя целую кучу производных величин, более точно объясняющих роль игрока в победе команды. Многие известные бейсбольные аналитики, когда-то писавшие на узкоспециализированных сайтах, сейчас работают в клубах МЛБ – не то чтобы триумфально, но не без пользы.
Аналогичные попытки не раз делались и в баскетболе – и даже с определенным успехом. Буквально на днях аналитик ESPN Джон Холлинджер был приглашен новым владельцем “Мемфиса” Робертом Пера (34-летним миллиардером, работавшим до создания собственного бизнеса в Apple) на должность вице-президента по баскетбольным операциям. Холлинджер известен как автор формулы, определяющей эффективность баскетболистов (PER). Нет, он назвал ее не в честь Роберта Пера. Формула Холлинджера основана на стандартных протокольных показателях и призвана в первую очередь показывать относительные достоинства игрока на фоне остальной лиги – в частности, она зависит от средних показателей по лиге.
Проблемы формулы Холлинджера широко известны (хотя его критики почему-то не являются вице-президентами клубов НБА): она не может толком учесть игру в обороне и переоценивает игроков, совершающих много бросков. Да, Майкл Джордан по ней лучший, а Майкл Бизли играет попросту плохо – как будто бы никто не понимал этого и без формул. Но главная проблема подобного типа расчетов в том, что игроки в них изолированы друг от друга. Статичная статистика может подходить для бейсбола (и то не для всех его составных частей), уже в баскетболе или в хоккее от нее меньше пользы (не говоря про футбол).
Логичный следующий этап связан с тем, чтобы рассматривать действия в комплексе – учитывать не столько отдельное действие, сколько последовательности действий. Данные остаются теми же, меняется их осознание.
Отличный пример – совсем свежий замечательный текст про «Кобе-передачи». Кобе-передачи – это промахи Кобе Брайанта, которые лучше промахов других баскетболистов, потому что их очень часто подбирают его же партнеры, продолжая атаку. В футболе можно изучать, какие навесы приводят к ударам, а какие – к потерям; какие потери оборачиваются голами, а какие нет; какие перехваты создают атаку, а какие являются вещью в себе. Надеюсь, это давно уже считается где-то на серьезном уровне, пусть пока и не обсуждается блоггерами (а хотелось бы).
Но есть подозрения, что и этого окажется недостаточно. Футбол, к примеру – игра непрерывная, “геометрическая” и многое в ней зависит от положения не только игроков команды, но и соперников. Для этого нужны совсем другие модели, работа с которыми может оказаться куда сложнее, чем мы привыкли.
Можно пытаться исследовать цепочки владения мячом, находя у команды наиболее эффективные модели атаки. Для этого могут пригодиться, например, нейронные сети и генетические алгоритмы. Нейронная сеть – это, если без математики, система, по которой по каким-то правилам идет импульс. В зависимости от того, куда он пришел и какой результат был получен, система меняется (такую систему можно обучать на реальных данных). Генетические алгоритмы позволяют рассматривать множества таких систем, по принципам, схожим с эволюцией, отсекая на каждом этапе менее эффективные.
Вот очень забавное (и по-своему жуткое) видео, показывающее, как безмозглые точки-роботы, в начале сбивающиеся в угол, как пчелиный рой, после 500 поколений селекции (оценивается распределение по полю, расстояние до мяча, количество ударов и голов) начинают понимать правила футбола и даже забивают гол. Не то чтобы такая команда играла лучше, чем “Сток” в дождливый день, но ведь это простая модель, обучающаяся в играх друг с другом, а не на реальных данных.
Конечно, любой такой “промышленной” системе понадобится очень много данных. Впрочем, технологии их сбора давно уже освоены, например, ProZone и их конкурентами - вот небольшой текст на русском, где несколько наивно хвастаются их достижениями. Для таких больших массивов данных применимы разнообразные способы data mining – выявления неочевидных закономерностей. Просматривать часами видеокассеты, как это делает Курбан Бердыев, тоже можно – но не факт, что это с развитием технологии окажется эффективнее.
Применения могут быть разными, а результаты – самыми неожиданными. Скажем, топологический анализ данных в 2012 году использовали для выявления настоящих амплуа в баскетболе, не укладывающихся в рамки позиций. В футболе, в принципе, известно, что нападающие определенных типов могут быть ближе к центральным защитникам, а другие – к опорникам, но выявление кластеров может привести и к более парадоксальным выводам.
Возвращаясь к происходящему на поле, существуют различные способы выявления паттернов (закономерностей) движения – как индивидуальных, так и командных. В интересной научной работе Перла и Даушера, университет Майнца, анализируют позиции игроков в сквоше и движения гребцов, в последнем случае обнаруживая у одного из них ненужное дополнительное движение, не различимое при видеоанализе. Паттерны определенно можно выявлять в хоккее (пока этим занимаются только фанаты), в волейболе – да, по сути, вообще где угодно.
Работа ученых из Нови Сада, Сербия, основывалась на реальных данных нескольких сезонов сербской баскетбольной лиги. В итоге ученые узнали, какие элементы игры важнее всего для победы: получилось, что броски из-под кольца и подборы в защите (впрочем, они предупредили, что в других лигах может быть иначе).
Китайские ученые в 2010 году, по их словам, смогли построить работающую модель футбольного матча, помогающую тренеру принимать решения (кстати, можно ли пользоваться ноутбуком на тренерской скамейке?) Тем же занимаются ученые в университете Кельна в составе большой группы с участием все того же Юргена Перла.
Работ таких, на самом деле, пока не так много – но не так много и ученых, интересующихся и анализом данных, и спортом. К тому же мы говорим о тенденциях, которые займут свое место в будущем. Впрочем, не нужно думать, что системы data mining решат все задачи за человека. Роль аналитика в построении модели очень велика: в конце концов, важнее всего выбрать действительно релевантные данные.
Очень сложно нормально оценить, скажем, эффективность в обороне. Перехват и отбор – это то, что произошло. Если соперник даже не пытается начать атаку через твою зону – это хорошо или плохо? Какие для этого нужны показатели? Число атак через твою зону при возможности выбора? “Напряжение” на твоем фланге?
Надо понимать, что попытки анализа недостаточно значимых данных приводят к тем же результатам, что и у работы Нунеша и Соузы из университета Порту: “не удалось получить каких-либо неожиданных или важных выводов”. Но эта наука пока только в начале пути. Пока что ее развивают, как ни странно, в первую очередь букмекеры и капперы (игроки на ставках), давно уже использующие нейронные сети для предсказания матчей. В описании одного из многочисленных программных продуктов для ставок указывается, что нейронная сеть предсказывает исходы матчей на 10% лучше лучших экспертов-журналистов. Возможно, именно из этой среды могут появиться квалифицированные специалисты, работающие для клубов; два других источника – кафедры “спортивной науки”, существующие в некоторых зарубежных вузах, и, разумеется, крупные поставщики спортивной статистики.
Есть и еще одна проблема: мы привыкли к понятным выводам. Аналитика в ее нынешнем спортивно-журналистском понимании – это нечто, что объясняет и упрощает проблему. Сложные модели лишены этого достоинства. Google не расскажет вам, почему показал ту или иную ссылку на том или ином месте. Поисковик знает, что для вас так в среднем лучше (точнее, в среднем лучше для людей, похожих на вас), но у него нет для вас простой причинно-следственной связи.
Но эта необъяснимость решений системы может быть в своем роде достоинством. Когда ты знаешь, что премиальные зависят от числа успешных ТТД, то делаешь несколько ненужных пасов партнеру. Когда ты хочешь сделать трипл-дабл, то иногда бросаешь так, чтобы подобрать свой же мяч. Когда система – черный ящик, рассказывающий, что ты не должен делать таких-то пасов и вообще хуже играешь в последнее время, остается лишь не делать неправильных пасов и лучше играть. Нельзя обмануть систему, которая сложнее, чем ты можешь вообразить.
Итого: вслед за налаженным сбором большого количества спортивных данных (статистики) появляются новые способы и идеи анализа этих данных. Новые сложные математические модели могут учитывать движение и взаимодействие спортсменов. Такие модели требуют подготовленных аналитиков, а выводы не обязательно будут ясными и логичными.
Аналитика неочевидного
В последние десятилетия многие направления человеческой деятельности, где, как казалось, работает только опыт и талант, начинают всерьез анализироваться и деконструироваться. Свои технологии появляются у сценаристов (создание рождественской голливудской комедии – куда больше наука, чем творчество), мы куда лучше понимаем природу мотивации и знаем, чем интересная компьютерная игра отличается от неинтересной. Изучается все, словно сейчас снова Ренессанс – вплоть до самых, казалось бы, ненаучных вещей.
Самый наглядный пример, возможно – так называемая молекулярная кухня, изучающая процессы, происходящие с едой при приготовлении, и использующая необычные средства для достижения тех же результатов. Скажем, для приготовления нежного мяса с поджаристой корочкой можно рассчитывать на опыт предков, хитрые приметы и точный глазомер, а можно просто приготовить его в вакуумном пакете при фиксированной низкой температуре на водяной бане, а затем обработать газовой горелкой. Будет гарантированно вкусно, и ничего не подгорит – недаром подобные технологии уже давно используются в ресторанах.
Понимание процессов часто не требует сложной химии или математики – просто нужен внимательный подход, основывающийся на логике, а не на опыте. Сейчас институты так называемой sport science в первую очередь занимаются биокинетикой, изучением здорового образа жизни и технологией тренировок (в Кейптауне, Южной Корее, Вене и многих других местах). Но областей, где можно что-то исследовать и улучшать, а не делать “на глаз”, куда больше, чем кажется.
Например, возможно, достаточно надежную модель игры в австралийском футболе построить сейчас нельзя – это удивительно сложная игра, для начала (схема расстановки на картинке ниже уже слегка завораживает, а ведь у них еще и ворота с четыремя штангами). Но австралиец МакКаллох сумел построить достаточно простую нейронную модель для драфта АФЛ, определяющую, сможет ли игрок успешно заиграть в лиге. Модель, правда, оказалась менее эффективной, чем настоящие скауты (37,5% успешных выборов против 44,1%), зато игроки, выбранные и моделью, и скаутом, успешно играли в лиге в 52,3% случаев – а значит, ее вполне можно было использовать в качестве “второго мнения” в сомнительных случаях.
В уже упоминавшейся работе Перла и Даушера выявление паттернов предлагается применять, например, для оценки восстановления после травм. Постоянные читатели моего блога с интересными ссылками могут помнить текст ESPN об аналитике “Доджерс” Стэне Конте, изучающего статистику травм игроков, чтобы помочь своей команде минимизировать расходы на содержание и лечение травмированных. В целом, исследования медицинской статистики в США ведутся давно и успешно – страховая медицина этого требует; но в спорте высоких достижений не совсем типичные травмы и пациенты. Весьма перспективным представляется исследование, как именно травмы влияют на спортивные показатели – что меняется в игре, какова вероятность, что игрок вернется на тот же уровень.
Сергей Галицкий недавно заявил, что недоволен своей селекционной службой, несмотря на то, что она умудрилась где-то раскопать Мовсисяна и Жоаозинью. Владельца “Краснодара” можно понять – в конце концов, каждый промах селекции он оплачивает собственными деньгами – но недовольство тоже ведь можно формализовать. Успешность скаутинга поддается анализу. Необходима трансферная аналитика не на уровне того, сколько передач делает игрок в среднем за матч, а на более высоком: как похожие игроки (возможно, стоит учитывать демографические и психологические характеристики, а не только игровые) адаптируются в новых командах и турнирах. Существуют ли модели, предсказывающие, сколько будет забивать лучший бомбардир первого дивизиона в высшей лиге? Они могут оказаться заметно проще, чем модели игры команд.
Можно пойти и дальше. Успех селекции может выражаться не только в голах и очках. Сразу приходят на ум проданные футболки, но лучше сразу перейти на следующий уровень – разумеется, интересно было бы рассматривать эффективность селекции (и игры) в экономических терминах. Посещаемость, безусловно, будет здесь ключевым фактором. Патрик Рише на Forbes.com бегло анализирует, скажем, изменение посещаемости клубов MLB, местами ссылаясь на более подробные материалы – но такого рода исследования точно можно вести на более серьезном уровне. “Манчестер Сити” в своем ежегодном отчете отмечает, что команда стала 3-й в мире по числу игр за нее в FIFA 2012 (не путать с числом тех, кто отметился как болельщик) – и, разумеется, это тоже достижение в том числе и селекции.
Ну и так далее: можно исследовать эффективность судей, можно изучать влияние погоды на игру и посещаемость, можно пытаться изучать всерьез связь между женитьбой игрока и падением уровня его игры. Все, что позволит играть лучше команде и зарабатывать больше денег клубу. У меня нет цели описать все возможные области для аналитики, наверняка многое уже исследуется где-то за закрытыми дверями клубов (в частности, верю в американские университеты), но я надеюсь, что этот текст кого-то подтолкнет к новым, неожиданным (и публичным) исследованиям.
Итого: будут изучаться и анализироваться самые разные аспекты спорта, а не только происходящее на поле, будет исследоваться эффективность всех, кто причастен к успеху футбольного клуба.
Отношение к спорту как к продукту
Вы когда-нибудь задумывались, почему правила каждого вида спорта именно такие, как есть, и почему они меняются со временем? Не нужно сейчас о традициях. По-настоящему их чтят разве что в бейсболе, где форма до сих пор обязана напоминать ту, что была в XIX веке. Другие виды спорта периодически модифицируются (к примеру, вот история правил НБА) – конечно, не до неузнаваемости, но все же заметно.
Ответ достаточно простой: правила меняются так, чтобы игра оставалась достаточно интересной для игроков и зрителей. Иногда еще это диктуется соображениями безопасности, хотя и тут можно считать, что травмы и тем более смерть спортсменов отрицательно сказываются на интересе аудитории. Интересы аудитории могут представлять телекомпании (они не смогут показывать людям матчи, если там будет мало возможностей для рекламы – отсюда рекламные перерывы в американских лигах), хотя у них есть и собственные соображения вроде гибкости сетки вещания (пусть последнее доживает последние годы).
Иногда правила меняют даже из-за одного конкретного игрока: если верить автобиографии Уилта Чемберлена, именно из-за него запретили смахивать мяч рукой с кольца, расширили “краску” и, самое главное, запретили отрываться от земли и пересекать плоскость линии штрафного броска, когда он однажды на тренировке для забавы стал забивать штрафные сверху, прыгая почти без разбега (с его 51,1% процента попаданий обычных штрафных приходилось фантазировать). Майклу Джордану для того же результата приходилось основательно разбегаться.
Но чаще всего их меняют, чтобы пресечь какое-то конкретное поведение (скажем, затяжку времени) и сделать игру разнообразнее, когда в ней доминирует какая-то конкретная стратегия (вроде эпохи «мертвых мячей» в бейсболе, когда все старались изгадить мяч как можно сильнее перед броском). Именно поэтому много раз менялись правила подсчета очков в регби (как в матче, так и в турнире), поэтому появились трехочковые, офсайды и пробросы. Тренеры и игроки постоянно придумывают новые способы эксплуатировать текущие правила – иногда их новшества принимаются (как было с подъемом игроков в воздух во время вброса в регби), чаще – пресекаются, если они уродуют игру. Игра уставших игроков и в неравных составах, скажем, представляется неинтересной – поэтому появились замены и временные наказания. Ошибки судей во многих видах спорта тоже посчитали неинтересными и уродующими игру – поэтому ввели дополнительных судей или видеоповторы.
Но все это по-прежнему напоминает лечение симптомов. Что-то меняется лишь тогда, когда возникает проблема. Скажем, регби-7 – тренировочное упражнение, зачем-то ставшее олимпийским видом спорта, удалось “хакнуть” (см. видео ниже с участием спринтера, не прошедшего в легкоатлетическую сборную), что, возможно, приведет к изменениям в правилах (и поспешному формированию сборной Ямайки). До поры до времени способ «тушить, где горит» работал – но мы же сейчас говорим о тенденциях и о будущем.
Так вот, спорт – это тоже продукт. Сложно устроенный, но ровно такой же, как фильмы или компьютерные игры. Продукт необходимо исследовать, понимать и улучшать. Если наш основной критерий – внимание зрителей, то нужно понимать, что именно нравится зрителям. Какие моменты матча им важнее (все эти condensed summary, которые сейчас предлагаются американскими лигами – по сути, выжимка лучшего, что есть в игре; и не понятно, действительно ли необходимо все остальное в таком объеме). Когда им интереснее ходить на игры или смотреть спорт. Сколько они выдерживают в зале или на улице, сколько голов в среднем им нужно для счастья, какая турнирная система их больше устраивает (вот тут в “Торонто Стар” рассказывают, что посещаемость увеличилась на 15% при примерно той же средней игре с введением в MLB дополнительных места в плей-офф – команда позже выбыла из гонки).
Не нужно немедленно возражать мне, вспоминая послематчевые буллиты в MLS и думая, что я хочу поставить на поле третьи ворота или давать дополнительные очки за голы задницей. Буллиты – это был по-своему правильный эксперимент, от которого легко отказались, когда он себя не оправдал. Главное, что мы сейчас говорим не о фантазиях ради фантазии, а о глубоком изучении и понимании процесса.
Скажем, идея отказаться в хоккее от полноценной четвертой пятерки, предложенная кем-то из канадских аналитиков – разве над ней не стоит подумать? Если люди хотят больше видеть лучших игроков, нужно подумать, как им это обеспечить. В НФЛ играют 16 матчей за 4 месяца, в НБА – 82 игры за 5,5 месяцев, в МЛБ – 162 игры примерно за такое же время. Размер составов адаптирован под эти правила – но действительно ли именно такая регулярность наиболее прибыльна и интересна, учитывая, что чем больше матчей, тем меньше (и, возможно, хуже) играют лучшие игроки?
И да, как по-вашему, стоило бы изучить, как люди ходят на футбол в России в конце ноября и охотно ли они смотрят по телевизору на поля, окруженные сугробами, прежде чем принимать какие-то решения по календарю? Игроки – профессионалы, они сыграют и в -15, безусловно. Но ради чего?
Что касается того, что смена и усложнения правил создает проблемы на низших уровнях игры (это частый аргумент, скажем, против видеоповторов) – так никто не сказал, что правила должны быть одинаковыми везде. Подавляющее большинство людей, которые “играют в футбол”, играют по правилам, имеющим мало отношения к профессиональному спорту – на маленьких площадках, без офсайдов, с разным количеством игроков; а для профессиональных спортсменов небольшие изменения вполне приемлемы. Подробный анализ отличий между хоккеем на площадках КХЛ и НХЛ заканчивается важным выводом: игрокам и тренерам в целом все равно, по каким правилам играть. Радикальные отличия в правилах студенческого баскетбола NCAA и NBA не мешают игрокам успешно переходить из одного баскетбола в другой.
Более того, вполне может быть, что эти различия полезны – студенты не готовы играть с той же интенсивностью, увеличение темпа замедлит их рост как игроков. Этот подход почти наверняка приведет к парадоксальному выводу: в разных европейских странах, возможно, должны быть небольшие отличия в правилах футбола, чтобы местным зрителям было интереснее (что касается еврокубков – ну так из-за лимитов там и так часто играют немного другие команды).
Разумеется, подход к спорту как к продукту, требующему постоянных исследований и периодических улучшений, необходим лишь в конкурентной среде. В первую очередь в этом заинтересованы коммерческие американские лиги, особенно наименее успешные (когда-то конкурировавшая с NBA ABA рекламировала себя как лигу, где есть трехочковые и слэмданки). Неповоротливые гиганты профессионального футбола, часто управляемые бывшими футболистами или непонятного происхождения чиновниками, обладают огромной инерцией. С другой стороны, сама монополия федераций на футбол – чудовищный архаизм, который рано или поздно останется в истории. Но об этом, пожалуй, уже в какой-нибудь другой части.
Итого: к спорту возможно отношение, как к продукту бизнеса. Его правила и устройство турниров могут изучаться и меняться с целью сделать продукт более привлекательным для зрителей. Это может привести к тому, что версии одного вида спорта в разных лигах будут отличаться.
Как болельщики, для которых спорт - это жизнь, мы хотим справедливости, как в идеальном суде.
Но как потребители контента мы гораздо выгоднее, если нас иногда злят, заставляя обсуждать в интернете симуляции, нечестные голы и т. д., потому что мы такие момент запоминаем, и смотрим футбола только больше. А без драмы, ошибок и скандалов многие ограничились прочтением отчёта о матче и просмотром забитых голов на ютьюбе.
Единственно, что пока хочется заметить, что технологично-цифровой подход, на мой взгляд, забирает еще капельку души из этой игры. По этой же причине и ошибочен очень часто, так как не учитывает особенностей человеческой натуры, разность индивидумов и т.п.
Мне, как интересующемуся технологиями, и болеющему футболом эта тема близка. Но интересной информации мало даже в интернете.
Спасибо.)