Какая бывает баскетбольная статистика и что с ней делать
В 2015-м году актер Джесси Айзенберг (который сыграл задрота в «Зомбиленде», задрота-ботаника Марка Цукерберга в «Социальной сети» и превратил в задрота Лекса Лютора в «Бэтмене против Супермена») написал замечательную статью для журнала New Yorker под названием «Честная рецензия на фильм».
В статье Айзенберг выступил в качестве «Критика» и написал воображаемую рецензию на несуществующий фильм. В чем «честность» его рецензии? Расписывая собственный мыслительный процесс, «Критик» указывает на то, что сам фильм его заботил мало.
Сначала «Критик» ерзает на стуле, когда узнает, что фильм основан на сюжете, который возник у него в голове еще несколько лет назад во время обучения в киношколе. Потом оказывается, что сценарий был написан парнем, который учился с «Критиком» в колледже, но оказался в итоге более успешным. Сам фильм быстро надоедает «Критику», поскольку показ был организован на другом конце города, куда было ужасно неудобно добираться. После просмотра фильма «Критик» решает подкатить к какой-то студентке, та его отшивает и настроение у «Критика» становится еще хуже. На фуршете по случаю премьеры «Критик» встречает коллегу из журнала Times. Парню из Times фильм понравился, поэтому «Критик» решает специально написать разгромную рецензию на фильм чисто из принципиальности – «Критик» проходил собеседование в Times, но его не взяли на работу.
В конце концов, «Критик» передумывает и называет увиденный фильм лучшей картиной года чисто из желания попасть со своей цитатой на постер. «Критик» также мечтает, что девушка из его родного Нью-Джерси увидит его имя на постере, позвонит ему, и они вновь будут парой.
Короче говоря, статья про то, как люди, формирующие чужое мнение, сами оказываются подвержены куче когнитивных искажений и в ходе своей профессиональной деятельности оказываются чудовищно необъективны.
А ведь в НБА скауты пишут тысячи отчетов по десяткам тысяч игроков со всего мира. Вы только почитайте про эту работу – вдали от дома, постоянно в дороге, в пыльных и душных залах, постоянно недосып, ужасный быт и скверная пища, необходимость переваривать тонны чужих статей ради информации о том или ином игроке (неминуемое влияние стадного инстинкта) без уверенности, что этот игрок вообще когда-либо хотя бы на расстояние пушечного выстрела подберется к НБА.
А теперь представьте себя на месте генерального менеджера команды НБА. И ладно еще если вам нужно принять решение относительно, например, двустороннего контракта с игроком глубокого резерва. А если речь идет о том, чтобы потратить выбор на драфте, свой самый ценный актив, на парня из второго греческого дивизиона? И вот вы начинаете шерстить отчеты скаутов, которые те написали в полвторого ночи после трех литров паршивого кофе. В идеальном варианте вы бы хотели, чтобы на руках у вас был максимум информации для принятия решения – видеозаписи, мнения скаутов, результаты интервью, отзывы партнеров/тренеров об игроке и, конечно же, статистика. Без нее сегодня никуда.
В современном спорте менеджеры очень чутко следят за тем, чтобы принимаемые решения были максимально объективными. Инструментов для достижения объективности можно придумать много. Сэм Хинки, бывший ген. менеджер «Сиксерс» и автор «Процесса», рассказывает, что, уцепившись за одну строчку в скаутском отчете или одну фразу брошенные в неформальном беседе (вроде «У этого парня лучший дриблинг, который я когда-либо видел»), мог заставить весь свой скаутский отдел писать отчеты конкретно по дриблингу одного этого игрока. Фархан Заиди, построивший династию в бейсбольных «Доджерс», утверждает, что практикует анонимные опросы и частенько беседует со скаутами об одном и том же аспекте игры конкретного бейсболиста чуть ли не в разных комнатах, чтобы сформировать у себя более-менее взвешенное мнение. Дэрил Мори, ген. менеджер «Рокетс», считает одним из самых действенных способов оценки собственных действий смену ролей по типу: «Мы не хотим отдавать Кайла Лоури в «Торонто» за пик первого раунда. А если бы мы были на месте «Рэпторз», то считали бы этот пик за Лоури переплатой».
Но отличительной особенностью современного баскетбола, да и спорта вообще, являются цифры. То бишь статистика. Более объективного инструмента для оценки игроков при принятии решений человечество еще не придумало.
То, что мы сегодня понимаем под статистикой, формировалось долго и мучительно. Очки были всегда. Позднее появились подборы и передачи, но поскольку они появились уже в 50-х, то можно считать, чтобы тоже были почти всегда. Данные по минутам за игру, например, стали доступны в сезоне-1951/52.
В каком-то смысле прорывным стал сезон-1973/74 – тогда официально стали считать блок-шоты, перехваты, а также начали делить подборы на те, которые были сделаны в защите или в нападении. Еще четыре года спустя (1977/78) числовым измерениям стали поддаваться и потери, а с 1982-го – даже количество игр в стартовом составе от общего их числа.
На протяжении десятилетий статистика эволюционировала как живой организм. Когда стало ясно, что сами по себе цифры той же результативности мало чего значат, их стали делить на 100 владений или пересчитывать на 36 минут. Когда стало понятно, что трехочковый бросок ценнее двухочкового на 50% - придумали eFG%, который учитывает этот момент. Стали высчитываться, например, доля подборов (передач, перехватов) одного игрока от общекомандных.
Дальше больше. Появлялись все новые извращения вроде попыток измерить вклад одного игрока в итоговые победы команды (Win Shares) за счет игры в нападении (OWS) или защите (DWS). В рамках одной цифры теперь фигурировало несколько слоев статистического безумия. К примеру, Offensive Box Plus/Minus высчитывает уровень игры в нападении по отношению к уровню в среднем по лиге, при этом формируется из данных, пересчитанных на 100 владений, а Value over Replacement Player (VORP) еще сравнивает данные, полученные в рамках вычисления Box Plus/Minus с математически вычисленными показателя среднего игрока по лиге.
От круговерти всех этих уравнений и формул может пойти голова кругом, но НБА не остановилась и на этом.
В 2010-м начался процесс внедрения систем, позволяющих отслеживать любые перемещения баскетболистов по паркету. НБА заключила договор с фирмой SportVu, которая изначально занималась соккером и собирала данные, на основе которых создавались тепловые карты и диаграммы перемещения мяча между игроками. SportVu разработала систему, которая бы следила и преображала в данные перемещения всех 10 игроков по площадке. В сезоне-2010/11 камеры SportVu на своих аренах установили «Даллас», «Хьюстон», «Оклахома» и «Сан-Антонио», через год к ним присоединились «Бостон» и «Голден-Стэйт», а уже перед сезоном-2013/14 НБА обязала установить эту систему на всех аренах лиги.
(Кстати, в сезоне-2017/18 НБА сменила партнера и вместо SportVu заключила соглашение с Second Spectrum. Насколько я понимаю, суть технологии осталась прежней).
Короче говоря, на мир баскетбольной статистики была сброшена ядерная бомба, ударная волна после взрыва которой ощущается до сих пор. НБА получила совершенно новый инструмент для оценки игроков, которым отныне негде было спрятаться, чтобы скрыть свои недостатки.
Благодаря системам «видеонаблюдения» всем желающим как внутри лиги, так и за ее пределами стали доступны данные о том, сколько игрок пробегает за матч и с какой скоростью, с какой точки площадки бросает чаще/реже или точнее/хуже, сколько он в среднем держит мяч в руках, сколько ударов в пол делает в среднем за каждый отдельный период владения мячом в нападении и на каком расстоянии находится от мяча при подборе в нападении/защите.
Вот так примерно все это выглядит:
Если свести все существующие статистические параметры в одну простые схему, то получится следующая картина:
1. Статистика
2. Метрики
2.1. Формульные
2.2. Наблюдаемые
3. Секретные данные
Статистика – это то самое элементарное, в чем измеряется баскетбол: очки, подборы, передачи.
Плюсы: легко подсчитать и объяснить.
Минусы: дает очень ограниченное представление об игре.
Базовая статистика, как неудивительно, дает базовое представление об игре как отдельного игрока, так и может стать поводом для размышления об акцентах игры в целом.
Даже самые простые показатели могут нести в себе значительную ценность. Например, известно, что из числа основных статистических показателей с количеством побед на счету команды сегодня (информация по сезону 2016/17) лучше всего коррелируют:
процент попадания с игр
процент реализации трехочковых
общее количество реализованных трехочковых
соотношение результативных передач к потерям
Не высшая математика, конечно, но эти четыре пункта дают отличное представление о том, что обязана делать хорошая команда для победы. Меньше всего в сезоне-2017/18 трехочковых бросали «Миннесота», «Нью-Йорк» и «Сакраменто». Хуже всего издали попадали «Орландо», «Лейкерс» и «Финикс».
Плохие команды играют плохо – в этом нет ничего удивительного. Но важно подмечать моменты, когда вроде бы приличная команда проваливается в каком-то базовом показателе, потому что этот элемент может стать одним из факторов, объясняющим итоговый результат ниже ожидаемого. «Денвер», к примеру, в прошлом году позволял соперникам атаковать с самым высоким процентом из-за трехочковой дуги. «Миннесота», как уже отмечалось выше, попала в список команд, реже других бросающих издали.
На основании простых цифр можно подтвердить и более глобальные выводы об игре. Например, команды НБА в сезоне-2017/18 брали в среднем всего 9,7 подборов в нападении – это самый низкий показатель в истории с момента, как подборы в нападении вообще начали считать. Количество штрафных бросков тоже достигло исторического минимума. С другой стороны, за последние три сезона в лиге впервые сложилась история, когда команды бросают больше трехочковых, нежели штрафных. И если в сезоне-2015/16 разрыв был небольшим (24.1 3PA против 23.4 FTA), то сейчас его уже можно назвать значительным (29.0 3PA против 21.7 FTA).
Вот вам три фактора из которых и складывается картина современного баскетбола. Он быстрый, трехочковый, максимально невязкий для игроков (меньше борьбы под щитами из-за акцента на растягивание и поиск пространств) и зрителей (меньше остановок на штрафные). Другими словами – веселый и приятный глазу. Так что нет ничего удивительного в том, что популярность НБА растет в соответствии с тем, насколько более привлекательной становится сама игра.
Формульные статистические показатели – это то, что называется «продвинутой статистикой». Сюда можно включить все разновидности статистик, внутри которых используются более сложные математические вычисления вроде пересчета на владения или отношение одного показателя к другому.
Плюсы: дают более продвинутое понимание баскетбола.
Минусы: сложнее понять и использовать, при обсуждении игры болельщиками упоминается реже.
Считается, что отцом продвинутой статистики в баскетболе является Дин Оливер, написавший в 2004-м году книгу «Basketball on Paper». Оливер – это баскетбольный Билл Джеймс, открывший дверь в жизнь бейсбольной сайберметрике.
Именно Оливер является создателем системы «четырех факторов для баскетбольного успеха». В этот квартет он включил:
эффективный процент попадания (eFG%) учитывающий разницу в ценности между двухочковыми и трехочковыми броскам
процент потерь (TOV%) – количество потерь в расчете на 100 владений
процент подборов (RB%) – количество подборов в защите и нападении от общего числа доступных подборов
рейтинг штрафных (FTr) – соотношение штрафных к общему количеству бросков, выполняемых обеими командами
Оливер распределил важность каждого фактора следующим образом: 40% успеха зависит от точности бросков, 25% - от процента потерь, 20% - это процента подборов и 15% - от штрафных.
Как вы можете заметить, структура сильно похожа на те четыре фактора, необходимые для победы, которые я приводил в разделе про обычную статистику. Тем не менее, в 2004-м такое новаторство сносило людям головы.
В рамках формульной статистики каждый может упражняться хоть до посинения. Например, известный показатель PER Джона Холлинджера построен на сложной формуле, в основе которой все равно лежат элементарные показали – очки, броски, передачи, вот это вот все. Продвинутость PER заключается в том, что (а) он высчитывается с оглядкой на темп игры и сравнивает показатели игрока со средним уровнем по лиге (б) представляет собой одну из наиболее распиаренных версий так называемых «all in one» статистик, которые пытаются выразить игру любого игрока в одной единой цифре.
Разумеется, PER – спорная штука. Одним из самых показательных примеров является то, что средний PER за карьеру у Брюса Боуэна – 8,2. PER у хороших игроков находится в районе 18-20, а 8,2 у Боуэна указывает на то, что он вроде как должен был не трехкратным чемпионом лиги становиться, а в лигу ВТБ сразу ехать.
Или вот еще один любопытный пример использования продвинутой статистики – наследие Кармело Энтони.
С одной стороны – 10 матчей звезд, 6 попаданий в сборные All-NBA и статус капризного, но видного игрока своей эпохи, одного из ведущих снайперов лиги на протяжении полутора десятков лет. Вроде как должен в списке игроков всех времен бороться с Алексом Инглишем.
А если посмотреть на продвинутую статистику Мело:
не входит даже в топ-250 в истории по рейтингу нападения за карьеру
не входит в топ-250 по TS%, показателю реализации бросков, который учитывает в одной формуле двухочковые, трехочковые и штрафные броски
занимает 98-е место в истории по Offensive Box Plus/Minus и 115-е – по VORP
по Win Shares на 48 минут делит с Кори Маггетти 215-е место
«Наблюдаемыми» метриками я назвал все те данные, которые отслеживаются именно благодаря системам вроде SportVu, а также предоставляются платными сервисами вроде Synergy.
Плюсы: профессиональное понимание игры, наглядность, максимальная доступная обывателю глубина и доступность.
Минусы: огромные объемы информация, невозможно усвоить, если не связан с баскетболом профессионально в качестве скаута, менеджера или профессионального журналиста.
Это уже уровень детализации игры, который сделали для 1% задротов и тех, кто с баскетболом так или иначе связан материально. Возможность посмотреть, как Майкл Кидд-Гилкрист из «Шарлотт» бросает со средней после получения мяча из-под заслона или добывает подборы в нападении – это в большинстве случаев удел тех, кому за это платят деньги.
С другой стороны, именно возможность отслеживать броски игроков в итоге превратилась в юзер-френдли таблички реализации бросков из разных зон. Пионером таких диаграмм стал Кирк Голдсберри, который, к слову, теперь работает в аналитическом отделе «Сан-Антонио». Вы наверняка помните его по вот таким вот картинкам:
Именно благодаря «наблюдаемым» метрикам мы можем ставить под сомнение пользу и эффективность игры Расселла Уэстбрука, ведь теперь мы знаем, что он занимает одно из последних мест в лиге по расстоянию до игрока в момент броска в защите, а также чрезмерно много возится с мячом (лидер лиги по времени контроля мяча, количеству ударов в пол в среднем) и набивает себе пустые подборы (очень высокий показатель подборов без сопротивления) за счет Стивена Адамса (один из лучших игроков в лиге по отсеканиям соперника от мяча на подборе), много бросает с ведения (10,3 за игру, 1-й в лиге) и делает это крайне неточно (39.4% eFG%, 4-й худший в лиге).
Но на самом деле с анализом данных, полученных в результате наблюдений за действиями игроков на площадке, все совсем не просто. Наверняка все эти системы значительно упрощают процесс подготовки к матчам самим командам, но для сторонних наблюдателей большая часть доступной информации несет мало полезной нагрузки. В конце концов, любые метрики являются лишь отражением того, что произошло. К счастью или к сожалению, человечество еще не придумало такие системы, которые бы оценивали правильность принятых решений на площадке, своевременность перестроений в защите или эффективность различных нюансов вроде заслонов.
Даже при наличии всего имеющегося в наличии массива информации мы оказываемся не в силах проникнуть в мозг тренеров, составляющих план на игру и в головы баскетболистов, корректно или некорректно этот план реализующих. Мы видим, что произошло, но пока не знаем, что должно было произойти – куда игрок должен был отдать передачу или в какую сторону сделать лишний шаг, чтобы повысить свои шансы на успех по итогам эпизода.
Баскетбол пока не просчитывается до такой степени. Это нелинейная игра. НБА это, конечно, не останавливается от попыток его просчитать.
Секретные данные команд НБА
Естественно, здесь приходится вступать на территорию догадок и предположений.
На какие аспекты игры могут повлиять какие-то внутренние, создаваемые на базе аналитических отделов клубов модели и метрики? Да на все. У каждой из команд НБА есть свои:
методики оценки текущего состояния игроков и прогнозирования их будущих выступлений
алгоритмы ведения переговоров и расчета потенциальной и оптимальности стоимости каждого игрока
данные, позволяющие анализировать качество принимаемых решений игроками на площадке
таблицы, оценивающие ценность драфт-пиков
результаты интервью с тысячами потенциальных новичков
данные по травмам и здоровью игроков
При этом неизвестно, насколько вообще во внутренних обсуждениях скаутов и менеджеров клубов котируются известные обывателям привычные статистические выкладки. Дэрил Мори (на фото), например, во время сессии вопросов и ответов на Реддите признался, что в принятии решений внутри команд НБА даже самые мудреные «любительские» модели и метрики почти не используются. Он также назвал игру в защите «суперконтекстуальной штукой» и отметил, что ни у одного любителя не хватит данных, чтобы в полной мере проанализировать качество защитных навыков отдельного игрока через какие-то рейтинги или статистику.
В итоге получается, что все наши разговоры и обсуждения игроков, скорее всего, ни в какое сравнение не идут с тем, как игроков оценивают внутри самой НБА. Так что когда нам кажется, что мы понимаем мотивы выбора на драфте, обмена или подписания, то это наверняка обманчивое впечатление.
Что же в таком случае остается делать простому болельщику, который хочет чуть лучше вникать в тонкости НБА?
В английском языке есть понятие eye test – это личное впечатление от действий игрока, его поведения на площадке и за ее пределами. Получается, что самой доступной метрикой для болельщика в баскетболе по-прежнему остается дедовский метод оценки через субъективный взгляд.
Только просмотр игр, только хардкор.
Фото: Gettyimages.ru/Ezra Shaw, Jonathan Danielm Vaughn Ridley, Christian Petersen, Kevin C. Cox, Rob Carr, Harry How, Scott Halleran
А вообще отличная статья, спасибо)
I saw him - this guy really can (or can't) hoop.
Что касается низкого PER Боуэна то тут все просто. В атаке он набирал мало тут понятно, а что касается защиты то она у него просто не попадала в статистику. Он мало подбирал в защите и мало блокировал просто потому что играл на периметре и подборов ему конечно никто не уступал. Перехватов тоже было не много, но они мало что говорят о защите. Игрок может "гемблить" в защите ради набивания перехватов и часто проигрывать позицию из-за этого. Боуэн этого явно не делал. Ну а раз нет ни защитных подборов, ни блокшотов, ни перехватов, то защитные метрики хорошими просто быть не могут. В лучшем случае, если такой игрок действительно круто защищался и DRtg команды благодаря этому стал крутым, то такой игрок в некоторых метриках за счет командных результатов будет иметь неплохие значения по защите, но лишь на среднекомандном уровне, а крутые значения в такой команде будут у тех, кто подбирал, блокировал, перехватывал, даже если помощи защите от этого на самом деле было не так много.
1. Ей можно вертеть как угодно, подгоняя иной раз желамое под действительное.
2. Баскетбол это командная игра и синергию взаимодействия иногда невозможно уловить в статистике, только на глаз.
3. Везение. Даже самый слабый игрок, постоянно косячащий на обеих половинах площадки, может в итоге забить какой-нибудь корявенький бросочек в седьмой игре финала, который окажется победным (или сделать блок/перехват)- и как к такому отнестись с точки зрения статистики?
В общем всё относительно в этой жизни.