15 мин.

Как отследить каждый бросок мяча в НБА?

В детстве Кирк Голдсберри был ярым баскетбольным фанатом. Но тогда, в 1980-х, он жил неподалеку от Университета штата Пенсильвания, а это означало, что его дом находился довольно далеко от Филадельфии, где можно было бы посмотреть игры «76ers» по телевизору. Итак, размышляя, за какую же команду ему болеть, он остановился на Доминике Уилкинсе и его «Atlanta Hawks». Они находились от него в 750 милях, но благодаря чудо-каналу TBS Голдсберри мог следить за их играми, как если бы он сам был родом из Джорджии.

Голдсберри получил степень бакалавра в области геонаук в Университете штата Пенсильвания, а затем – степень магистра и доктора географических наук в Калифорнийском университете в Санта-Барбаре, где он написал диссертацию на тему составления интерактивных дорожных интернет-карт. Он пытался найти способ визуально отобразить данные о движении в пространстве и времени – сделать цифры видимыми. Карты и пространство сформировали представление Голдсберри о мире. Точнее – карты, пространство и баскетбол.

На протяжении всего периода обучения Голдсберри не просто смотрел баскетбол, он также принимал участие в любительских играх, чтобы держать себя в форме. И когда он играл, он начинал задумываться о баскетболе и о том, чем он отличается от других видов спорта. Аналитика – анализ игры и ее результатов с помощью статистики – начинала дополнять более традиционные методы оценки игр и проведения тренировок, такие как просмотр видеозаписей или развитие физических данных.

Начало этой революции было положено в бейсболе, как утверждает Майкл Льюис в своей книге «Moneyball». С точки зрения статистики, бейсбол, по большому счету, игра довольно простая. Она основана на равномерной последовательности личных противостояний бьющего и питчера, и в каждом розыгрыше есть заданные начальная и конечная позиции (статистик назвал бы каждый из таких розыгрышей «состоянием»). Учитывая этот факт, а также обилие данных о каждом розыгрыше, доступных исследователям, можно произвести расчеты для каждой из данных ситуаций в игре и оценить вероятность следующего события. Если у команды есть раннер на первой базе с одним аутом, то вероятность заработать очко в данном иннинге составляет 28% и так далее. 

Взято из книги Марка МакКласки «Быстрее, выше, сильнее: как наука о спорте формирует новое поколение суперспортсменов, и чему мы можем от них научиться»

Но Голдсберри понял, что принципы «Moneyball» не действуют на баскетбольной площадке. В отличие от статических действий со сменяющими друг друга состояниями в бейсболе, баскетбол – игра непрерывная. Игроки переходят от нападения к защите, из позиции под кольцом к двойной опеке. В бейсболе, если игрок занимает позицию левого крайнего, вы примерно представляете, за какую область он будет отвечать в защите. В баскетболе же, если игрок занимает позицию форварда, в любой момент он может оказаться где угодно на площадке. В этой игре нет никаких состояний, поэтому нельзя статистически определить вероятность того или иного результата. Аналитики считали, что оценить каждое отдельное событие, как им это удалось в бейсболе, попросту невозможно.

Иными словами, баскетбол был похож на одну из карт, составленных Голсберри – сложный, запутанный поток информации, не имеющий ни начала, ни конца. Но это не означало, что он не поддается анализу. Наоборот, Голсберри догадался, что ему нужен лишь подходящий тип данных. «Из своего опыта игры в баскетбол я знаю, что у меня есть сильные и слабые стороны, меняющиеся в зависимости от моего расположения на площадке, и, мне кажется, другие игроки думают так же», – рассказывает он. Вместо того чтобы сосредоточить внимание на числах, определяющих состояния в бейсболе, Голдсберри стал обращать внимание на расположения и перемещения объектов, в частности – игроков и мяча. Задача была отобразить это в виде карты.

С этой точки зрения и благодаря большому количеству данных он смог сделать нечто большее, чем просто определить, как люди представляли себе эту игру. Он сумел обнаружить скрытые законы баскетбола, освещая темные углы, о существовании которых никто даже не догадывался. Чтобы познать суть бейсбола, вам, наверняка, понадобится статистик, разбирающийся в соотношениях и вероятностях. Но чтобы понять баскетбол, нужно также иметь хорошее пространственное мышление. Вам нужен картограф. Точнее, вам нужен Кирк Голдсберри. 

В 2011 году, когда у Голдсберри появилось немного свободного от преподавания в Мичигане и Гарварде времени, он начал создавать свою картографическую систему. Но возникла проблема получения релевантной информации. Отследить постоянное перемещение 10 игроков не так-то просто. Он стал просматривать фан-сайты и спортивные передачи, и, в конце концов, обнаружил статистику о каждом броске, сделанном в НБА. Данных было немного: лишь кто выполнил бросок, откуда и попал ли он в цель. Но это было уже что-то.

Данные были не такими уж и конфиденциальными, но и не общедоступными: Голдсберри откопал их в Сети. Если быть точным, то на сайте ESPN.com он обнаружил карты бросков со статистикой каждой игры (box score). Затем он нашел исходные файлы и извлек всю информацию. «Они выкладывали эти наборы данных, но не использовали тех возможностей, которые в них видел я», – говорит Голдсберри.

В итоге, он собрал базу данных, состоящую из пространственных координат каждого броска, сделанного в период с 2006 по 2011 год: это более 700 000 бросков. И тут Голдсберри-картограф и Голдсберри-баскетбольный фанат стали работать сообща. «Я хотел найти способ заставить эти данные сказать нам что-то новое, например, где Коби хорош, а где – не очень», – сказал он. Голдсберри хотел сделать что-то большее, чем просто провести анализ. Он хотел показать это людям, «поделиться с игроками, фанатами и СМИ».

Броски из разных уголков планеты

Отмечая местоположение и частоту каждого броска в НБА, Кирк Голдсберри может создать карту преимуществ и слабостей любого баскетболиста при игре в нападении. Ниже представлены карты бросков для двух потенциальных членов Зала славы – Рэя Аллена и Дирка Новицки.

Броски со средней дистанции не являются сильной стороной большинства игроков, за исключением Дирка Новицки, который предпочитает бросать с правой стороны лицевой линии.

Даже у лучшего снайпера за всю историю есть относительно слабые места, например, броски с левого края.

Он разделил площадку площадью 1 284 квадратных фута, с которой выполнялись броски – точнее, область лишь неподалеку от трехочковой линии и ближе – на ячейки, как в компьютерной стратегии. Затем он воспользовался полученными данными и создал карты, показывающие, откуда данный игрок выполнял броски, как часто и насколько точными они были.

Голдсберри назвал свою систему CourtVision, и она демонстрировала различия игроков, которые никто раньше не замечал. У Рэя Аллена, одного из лучших снайперов ассоциации, есть несколько очень «горячих» зон за трехочковой отметкой, и чрезвычайно мало попыток сделать бросок в прыжке со средней дистанции. Коби Брайант, действующая звезда команды «Los Angeles Lakers», сделал очень много бросков со всех точек площадки, но есть места, с он бросает явно менее результативно (к таким относится, например, лицевая линия, с которой ему бросать сложнее). Голдсберри сформировал ни что иное, как визуальную характеристику игры баскетболиста в атаке, простую и удобную для понимания. Она выходила далеко за рамки того, о чем аналитик или тренер могли лишь догадываться, находясь за пределами площадки. Чем дольше изучались карты CourtVision, тем больше ценных выводов из них было сделано.

Голдсберри представил свою работу в 2012 году на конференции Sloan Sports Analytics Conference, ежегодном собрании статистиков и тренеров MIT [англ. Massachusetts Institute of Technology – Массачусетский технологический институт], и просто шокировал весь баскетбольный мир. Впервые фанаты могли увидеть, какие виды бросков исполняли их любимые игроки, а также относительную ценность этих бросков. В системе CourtVision не учитывалось, например, кем был защитник или что еще происходило на площадке, но, тем не менее, она предоставила руководству команд потенциально эффективный метод оценки игроков, позволяющий следить за их продуктивностью и соответствием их стиля игры философии команды. После выступления Марк Кьюбан, владелец команды «Dallas Mavericks», и Р. К. Буфорд, генеральный менеджер «San Antonio Spurs», подошли к Голсберри и попросили рассказать больше. Он говорил: «Это был один из тех моментов, когда думаешь: «Вот это да! Если я все сделаю правильно, то смогу превратить это в нечто большее, чем простое увлечение, которым я занимался по ночам и по выходным». 

Работа Голдсберри привлекла внимание Брайана Коппа, на тот момент исполнительного вице-президента компании Stats, расположенной недалеко от Чикаго. Stats была основана в 1980-х группой исследователей бейсбола, собиравших максимально полные статистические данные об игре. Сегодня это – компания-гигант, предоставляющая  статистические сведения о профессиональных спортивных событиях в США командам, лигам и СМИ. В 2012 году в Stats изучали и баскетбол, работая над новым методом сбора данных под названием SportVU. Вскоре после той презентации на конференции 2012 года Копп связался с Голдсберри и спросил, не захочет ли тот взглянуть на кое-что.

SportVU строится на базе оптической технологии с компьютерным управлением, разработанной израильскими учеными для отслеживания ракет. В 2005 году израильтяне нашли ей применение в спорте, установив три камеры над футбольным полем, чтобы наблюдать за игрой и передавать данные на центральный компьютер. Благодаря эффекту параллакса и другим хитростям при компьютерной обработке изображений, система могла отслеживать все объекты на поле, от игроков и мяча до бригады арбитров, и определять их местоположение в трехмерном пространстве 25 раз в секунду. В 2008 году Stats приобрели SportVU с целью разработать устройство из шести камер для баскетбола. 

Приспособление было не из дешевых: каждая команда НБА, желавшая получить эту информацию, должна была заплатить около 100 000 долларов за установку камер и компьютеров на своей арене. К концу сезона 2012-2013 ее купили только 15 команд, и данные оказались неполными: записано было лишь около половины всех игр. Но у этих данных, казалось, был огромный потенциал. В сентябре 2013 года НБА подписала соглашение на установку системы на каждой арене лиги.

«Брайан позвонил мне и спросил: «Не хочешь поработать с этими данными?» – рассказывает Голдсберри. – «Мне выпал счастливый случай получить доступ к данным, которые видели лишь немногие за пределами НБА». Это был джекпот, золотая жила; это были данные, гораздо более подробные, чем те, что он добыл с ESPN.com, и дающие полное описание каждого момента владения мячом, а также того, куда и как двигались игроки, чтобы выполнить бросок. Как только он их заполучил, он смог ответить на любые вопросы. Хотите узнать, какую дистанцию игрок пробегает за матч? Раз плюнуть. Интересует, кто является лучшим пасующим в вашей команде? Легко. Как отличается эффективность ваших пик-н-роллов [англ. pick and roll – комбинация, разыгрываемая двумя игроками, при которой один игрок нападающей команды ставит заслон (pick) для игрока с мячом, а затем, после того как оба их защитника перемещаются в сторону последнего, начинает движение к кольцу (roll) и получает пас на открытый бросок] от средних по лиге, когда игрок начинает движение менее, чем за 15 секунд до сирены? SportVU могла ответить и на этот вопрос. 

Но одним из главных открытий, которым Голдсберри так страстно желал поделиться, стала возможность понять один из самых неприятных аспектов в спорте – оборону. Десятилетиями команды опирались на простые цифры – количество перехватов и блок-шотов – чтобы определить ценность игрока в защите. Система SportVU позволила увидеть более общую картину. Голдсберри мог определить уже объективно лучший способ игры в обороне против пик-н-роллов команды соперника или то, какие игроки были особенно хороши на перехвате и при срыве атаки.

Год спустя после своей первой презентации Голдсберри вернулся в MIT уже с данными SportVU и новым взглядом на защиту в баскетболе. На этот раз комната была переполнена, и уже не только его коллегами-учеными, но и менеджерами со всей НБА.

Защита кольца

Наиболее важной областью на площадке с точки зрения обороны является область около корзины, однако некоторые игроки действуют в ней эффективнее других. Используя пространственные данные, указывающие местоположение защитника, Голдсберри может определить, кто снижает процент попадания противника, а у кого не получается остановить оппонента.

Игроки НБА в среднем забрасывают 49,7% бросков, когда в этой области их встречает защитник.

Сначала Голдсберри отметил, что область прямо вокруг корзины нужно оберегать как зеницу ока. В этой зоне атакующие игроки забрасывают больше всего мячей. Поэтому Голдсберри рассматривал, насколько удачно защитники могли помешать противникам набрать очки в радиусе пяти футов от корзины. Средний защитник НБА позволил оппоненту забросить с такого близкого расстояния в 49,7% случаев.

Он выделил два типа защиты. В первом случае защитники блокировали или мешали броску противника, то есть снижали «эффективность броска». По этому показателю лидировали центровой команды «Indiana Pacers» Рой Хибберт и центровой «Milwaukee Bucks» Ларри Сандерс, которые позволяют противнику забрасывать лишь 38% мячей. В то же время Луис Скола, на тот момент выступающий за «Houston Rockets», а ныне – за «Phoenix Suns», и Дэвид Ли из «Golden State Warriors» действовали в обороне ужасно, позволяя забивать в 61% и 62% случаев соответственно. Этот факт был любопытным, но не шокирующим. В каком-то смысле он был обратной стороной данных по нападению, которые он представил годом ранее.

Второй же подход к защите был более тонким и более удивительным. Как оказалось, некоторые игроки снижали частоту бросков своих оппонентов, не только их эффективность. Такое могли показать лишь данные Голдсберри: сравнивая средний процент попаданий с тем же показателем при защите области конкретным защитником, он мог определить, когда число попаданий снижалось. Лидером по этому показателю был Дуайт Ховард, из-за которого команды бросали в сторону кольца реже на 9%. Голдсберри назвал это эффектом Дуайта (кстати, именно так он и назвал свое выступление). По словам Голдсберри, когда Ховард защищал кольцо, его соперники меньше бросали с близкого расстояния и довольствовались гораздо большим количеством бросков со средней дистанции – наименее эффективного типа бросков в НБА.

Одним из менеджеров НБА, присутствовавших на выступлении Голдсберри, был Дэрил Морей. Морей является генеральным менеджером «Houston Rockets» – команды, которую он превратил в одну из самых прогрессивно мыслящих в лиге, вкладывая уйму времени и энергии в аналитику и спортивную науку. Кроме того, Морей является выпускником школы MIT Sloan и одним из организаторов мероприятия; он все еще является одним из председателей конференции. Может, это совпадение, а может и нет. Но важно отметить, что четыре месяца спустя после выступления Кирка Голдсберри Морей заключил с Дуайтом Ховардом долгосрочный контракт.

Каждое обсуждение использования статистического анализа в спорте отсылается, как если бы на него действовала сила тяжести, к книге Moneyball. Частично из-за того, что книга просто потрясающая, а ее герой, генеральный менеджер команды «Oakland Athletics» Билли Бин – превосходный персонаж; а также из-за того, что мастерство Майкла Льюиса как рассказчика позволило читателям легче понять статистику. Moneyball – это история, объяснившая принципы спортивной аналитики широкой публике.

И тем не менее, статистические методы, лежащие в основе эффекта «Moneyball», не были для Бина чем-то новым. От ранних исследователей вроде Ф. К. Лэйна в 1910-х и Аллана Рота в 1940-х до Эрншо Кука и его фундаментального труда под названием «Процентный бейсбол» [англ. Percentage Baseball], написанного в 1964 году, у игры сохранилась недавняя, но твердая традиция к анализу информации. А начиная с середины 1970-х бывший охранник консервной фабрики Билл Джеймс систематизировал знания об игре в своей самоизданной книге «Bill James Baseball Abstract».

Поэтому гений Бина заключался не столько в статистике, сколько в его действиях. Впервые за всю историю он сумел создать организацию, извлекающую выгоду из давно и хорошо известной статистической информации. Это значит, что преимущество над конкурентами возникло не из-за новых теоретических принципов в игре; оно появилось благодаря их использованию. 

Сегодня, когда благодаря новым технологиям накапливаются терабайты данных об игроках и тактиках, следующее колоссальное преимущество над конкурентами перейдет к вычислительным устройствам и аналитикам, способным понять смысл всех сигналов. Взгляните на статистическое цунами, порожденное системой SportVU в НБА. «Без преувеличения можно сказать, что 85% команд не знают, как пользоваться этими данными, – утверждает Голдсберри. – Эта идея приведет к радикальным изменениям в НБА, но не уверен, что это случится, пока команды в скором времени не поймут важность таких областей, как машинное обучение и визуализация».

Кто же эти 15% менеджеров команд, которые точно знают, как использовать эти данные? Это следующие Билли Бины. В этом году на конференции в MIT Sloan Голдсберри выступил с презентацией о том, как три раза подряд стать чемпионом. Все потому, что Голдсберри просто-напросто разделил баскетбольные матчи на моменты и мгновения, а затем провел такой же анализ, что и предыдущие поколения спортивных аналитиков провели по отношению к состояниям в бейсболе. Благодаря этому, Голдсберри и его команда теперь могли определить ценность, то есть количество набранных очков, любого движения на площадке: от паса под кольцо до прохода с ведением.

Такой тип анализа открывает новые возможности для оценки всего, что делает игрок. «Вы сможете увидеть, какие игроки приносят команде пользу, а какие – вред», – говорит Голдсберри. – «Это похоже на новую микроэкономику в баскетболе».

Для Голдсберри теперь это уже не просто хобби. Он использовал свои достижения при написании статей по аналитике для спортивного веб-сайта Grantland, и, хотя он в этом и не признаётся, ходят слухи, что несколько команд НБА с ним консультировались. А работает он все еще в Гарварде, где он организовал кружок для студентов, которые называют себя «Баскетбол XY» [англ. XY Hoops], в честь математического обозначения системы координат. «Идея не моя, она появилась у моих студентов, – признается Голдсберри. – Будто бы я – это Foo Fighters, а они – новая поп-группа. Я уже почти в прошлом».

Главной работой Голдсберри и его команды стала «Стохастическая модель прогнозирования результатов владения мячом в баскетболе при разных уровнях разрешения» [англ. «A Multiresolution Stochastic Process Model for Predicting Basketball Possession Outcomes»]. Но широкой публике статья больше известна под названием «Databall».

[Источник]