15 мин.

Арифметика защиты. Новые параметры для оценки игроков НБА

Матч НБА. Команды представлены, зрители уселись на свои места, не забыв о попкорне и паре пинт пива, судьи что-то обсуждают между собой, игроки противоборствующих команд приветствуют старых приятелей, подбрасывают тальк, подтягиваются на кольцах... Все как всегда. В это же время совершенно буднично к игре готовятся специалисты, о работе которых мы узнаем лишь когда захотим взглянуть на статистические сводки. Очки, подборы, результативные передачи, перехваты... Все эти показатели возможно зафиксировать в режиме реального времени. По поводу некоторых игровых действий, однако, по завершении матча собирают специальные комиссии и пересматривают пару секунд игры, чтобы понять, скажем, сделал ли Уэстбрук свой очередной трипл-дабл, или его десятый подбор стоит записать кому-то другому или отнести к командным?

По поводу набранных очков, точности реализации различных видов бросков и количества результативных передач вопросов обычно не возникает – все эти показатели фиксировать довольно просто. На сегодняшний день существует множество продвинутых статистических показателей, которые позволяют оценить эффективность отдельных игроков в нападении. Так, не составит труда узнать, кто же набрал больше всех очков в регулярном чемпионате 85/86 (Алекс Инглиш, 2414) или забил наибольшее число трехочковых в 92/93 (Вернон Максвелл, 473). Однако, попробуйте выяснить, через кого в сезоне 2013/2014 было набрано наибольшее количество очков, или же кто предотвратил реализацию наибольшего числа бросков! На этот счет статистические сводки вам, к сожалению, ничем помочь не смогут.

Итак, мы находимся в следующей ситуации: способность игрока к игре в нападении может быть оценена десятками прямо измеряемых показателей, но, как только мы пытаемся обосновать оборонительную эффективность игрока, нам приходится ссылаться на два сильно зашумленных показателя – блок-шоты и перехваты. В качестве альтернативы можно вспомнить о показателе +/- или какой-либо продвинутой его версии, однако он не дает никаких намеков на то, в каких же элементах данный игрок силен или слаб в защите. Данная статья предпринимает попытку восполнить пробел в оценке оборонительной эффективности за счет введения ряда новых показателей, являющихся результатом трэкинга игроков, статистического моделирования и качественно новой визуализации полученных данных. Описанная методика в комбинации с более традиционной статистикой игры в нападении обеспечивает всесторонее описание вклада, который вносит данный игрок в конечный командный результат.

ОСТОРОЖНО: МНОГОБУКАФ. Краткое саммари для тех кто НИАСИЛИЛ – в конце поста.

 

Введение

Две главные цели при игре в баскетбол – набирать очки в нападении и предотвращать их набор в защите. К сожалению, на сегодняшний день абсолютное большинство игровой статистики позволяет оценить эффективность игры лишь в нападении, в то время как игра на своей половине площадки по-прежнему остается практически упущенной из виду. В результате, наша способность целостно оценивать игру атлета довольно сильно ограничена. Данное исследование предпринимает попытку решить эту проблему при помощи статистических методов. Почти все современные статистические данные опираются на удобные «счетные» типы событий, но, как показал опыт предшествующих исследований, любая обоснованная методика оценки оборонительных действий существенно несовместима с таким подходом. Конечно, перехваты, блок-шоты и подборы действительно предоставляют нам некие наводки, характеризующие оборонительные навыки исполнителя, но они являют собой лишь дискретные сигналы среди непрерывно продолжающихся оборонительных действий. Именно поэтому все характеристики, которые полагаются исключительно на отдельные события, дают очень грубую оценку оборонительных действий. И тут в игру вступают новейшие технологии, позволяющие непрерывно следить за перемещениями игроков по площадке в течение всего матча. Данное исследование предлагает новые типы показателей, которые позволят обогатить оценку оборонительных действий. Начнем же с введения некоторой модели, которая позволит нам понять, сколько каждый игрок оборонялся против каждого игрока соперника в течение всех игр сезона 2013/2014

Например, рассмотрим таблицу «оборонительной статистики» матча Хьюстон Рокетс – Сан-Антонио Сперс (25.12.2013). По ней довольно легко понять, кто защищался против кого в течение большей части матча:

График 1. Матрица «оборонительной статистики» матча Хьюстон Рокетс – Сан-Антонио Сперс (25.12.2013). Ячейки матрицы окрашены согласно временной доли, которую данный игрок уделил защите против каждого соответствующего игрока атаки. Пропущенные очки начисляются согласно этим временным долям (см. Методику). Очки, набранные в результате путбэков или быстрых отрывов, отнесены к графе «unaccounted» – неприсвоенные никому из игроков. Правая часть графика показывает, кто ответственнен за какого игрока обороны в данный момент владения.

Определение опекаемого игрока включает в себя оценку того, кто является ответственным за данного игрока в каждый момент времени владения соперника, включая момент набора очков. Другими словами, мы знаем, кто кого опекает в течение всего владения соперника, закончившегося реализованным броском с игры за весь регулярный чемпионат NBA 2013/2014. Что важно: данное знание не ограничено моментом исполнения результативного броска – оно покрывает все владение целиком. Подобная информация представляет высокую ценность, так как защитник, который находится ближе всех к исполнителю броска далеко не всегда является единственным ответственным за данного игрока! С помощью комбинации статистических методов (искушенным в математической статистике читателям для более подробного ознакомления предлагаю проследовать по этой ссылке) группа исследователей вычленила 5 новых показателей для оценки оборонительных действий:

  1. Volume Score (далее в тексте – VS): число бросков, встреченных данным защитником

  2. Disruption Score (далее в тексте – DS): уровень, до которого защитник способен уменьшить эффективность попадания опекаемого игрока

  3. Defensive Shot Charts: похожи на обычные бросковые диаграммы, только для защитных действий. Графическая иллюстрация индивидуальных действий игрока в обороне; отображаются как VS, так и DS.

  4. Shots Against: взвешенное среднее числа бросков против данного защитника за 100 владений.

  5. Conterpoints: взвешенное среднее числа очков, набранных против данного защитника за 100 владений. 

Далее попробуем обсудить методику измерения данных показателей. 

Методика 

Как определить, кто против кого защищается? Ведь далеко не всегда игрок, отвечающий за персональную опеку данного соперника, является к ниму самым ближним. Логично предположить, что среднее положение игрока защиты во время оборонительного владения зависит от положения кольца, мяча и предписанного ему оппонента. Формульно это выражается как

                                               μ(t,k) = γo*O(t,k) + γb*B(t) + γh*H

На рисунке приведены расположения (пары координат на плоскости) кольца (H), нападающего O с номером k, (k=1,2,3,4,5), актуальное расположение защитника D с номером j (j=1,2,3,4,5; не путать со средним его положением, определяемым по формуле) в момент времени t.  В формуле для среднего положения защитника присутствуют неизвестные «весовые» коэффициенты γo, γb и γh (γo+γb+γh=1), которые авторы исследования находили, подбирая такие значения, которые «наилучшим» способом опишут некую базу реальных владений, причем в любой момент времени данного владения. Авторы утверждают, что следующая формула неплохо описывает среднее положение защитника в произвольный момент времени: 

                                                    0.62*O(t,k) + 0.11*B(t) + 0.27*H. 

Итак, среднее положение защитника практически лежит на прямой, соединяющей нападающего игрока с кольцом и делит отрезок «нападающий – кольцо» в отношении 1 к 2, лишь немного отклоняясь в сторону мяча. Данная модель показывает, что защитники плотнее держат своих оппонентов, когда те находятся близко к кольцу. Более того, данная модель отражает тот факт, что защитник плотнее играет с оппонентом, владеющим мячом – мяч и нападающий находятся практически в одной точке, так что отрезок «нападающий – кольцо» в данном случае уже делится в отношении 1 к 3!

Таким образом, окончательно, нам нужно придумать, как по положению всех защитников D(t,j) и среднему положению оппонента данного атакующего игрока – μ(t,k) – выделить защитников, играющих против нападающего O(t,k) в данный момент времени t. Замечу, что соответствие между защитниками и нападающими не является взаимно однозначным: против одного нападающего могут играть несколько защитников (отсюда дроби на Графике 1), однако один защитник всегда обороняется против одного игрока нападения (что, по словам авторов, приводит к трудностям при скоплении игроков под кольцом – раздача защитных предписаний в таком случае становится процедурой неоднозначной). Для этого введена некая модель, которая каждому защитнику D(t,j) в любой момент времени будет ставить в соответствие число, оценивающее его ответственность за нападающего O(t,k). С течением времени данные числа меняются, для каждого нападающего будет свой рейтинг «степени ответственности», на основании которого, пусть и не всегда однозначно, можно присвоить в каждый момент времени каждому игроку нападения от 0 до 5 его защитников (нападающий игрок может располагаться вдалеке и его могут бросить на произвол судьбы, что отразится на «рейтинге защиты»; напротив, против одного игрока теоретически могут защищаться всей пятеркой).

Defensive Shot Charts, Volume Score и Disruption Score: Используя приведенную выше модель определения оппонента, мы можем существенно продвинуться в оценке оборонительной эффективности атлета, в частности, определить, насколько защитник влияет на шот-селекшн и эффективность броска. В частности, мы используем модель определения оппонента для нахождения показателей VS и DS для данного защитника. VS определяет, насколько часто оппонент выполняет броски (по сравению со средней частотой выполнения бросков), играя против конкретного защитника. Напротив, DS характеризует, насколько данный защитник снижает эффективность бросков соперника (по сравнению с его средними успехами с данной дистанции). Методика исследователей позволяет определять оба параметра с высоким разрешением по всей площадке. В данном исследовании игнорируются очки в быстром отрыве и владения, окончившиеся фолом.

График 2a. Графическая иллюстрация показателей Volume (размер шестиугольника) и Disruption (цвет) Score. Кавай Ленард подавляет количество бросков из-за дуги и существенно снижает их эффективность.

График 2b. Оборонительные бросковые диаграммы. Крис Пол – один из лучших по Volume Score в лиге – его оппоненты, играя в нападении против него, бросают существенно реже по всей половне площадки. CP3 также лучший по показателю пропущенных очков (fewest point against), см. Таблицу 2.

Итак, окончательные результаты подсчетов представлены на «Оборонительной бросковой диаграмме» (График 2).

Counterpoints. Хотя VS и DS (и, как следствие, оборонительная бросковая диаграмма) позволяют глубже разобраться в сильных и слабых сторонах игрока защиты, у данных показателей также есть свой недостаток – они статичны. Они не берут в расчет то, как развивается владение с течением времени, не учитывают тот факт, что игрок не защищается против одного и того же игрока все владение. Возможны различные ситуации, когда игрок, противостоящий нападающему в начале владения, несет полную ответственность за его результативное действие даже после смены оппонента, либо же теоретически может не нести никакой ответственности. 

Для того, чтобы корректно учесть данный момент, авторы предлагают следующее – благодаря модели, сопоставляющей каждому защитнику оппонента, мы можем накопить статистику вида: (нападающий (условно, фамилия и имя), время начала защиты против данного нападающего, время окончания защиты против него, был ли совершен против данного защитника бросок), причем время измеряется в секундах до броска атакующей команды. Таким образом, если данный защитник в конце концов противостоит бросающему игроку, то для него третий пункт данной записи будет нулевым, а четвертый пункт – утвердительным. Отберем все такие записи. С их помощью мы можем построить График 3:

График 3: Кривые, описывающие вероятность того, что через данного защитника будет произведен бросок, в зависимости от времени до броска, в которое данный защитник получил своего оппонента (оппонент не обязан быть с мячом все это время!). Видно, что атакующие игроки тяготеют завершать изоляцию броском против Джеймса Хардена (27%), нежели против Кавая Ленарда или ЛеБрона Джеймса (~18-19 %). Непосредственно перед броском (при получении оппонента за 1-2 секунды до броска) защитники наименее вероятно встречают бросок – игроки нападения предпочитают совершать броски в тот момент, когда их плотно не опекают (формально – когда согласно модели их никто не защищает) за секунду до совершения броска.

Если построить похожую кривую для «среднего» игрока лиги, то можно будет искать VS в зависимости от момента получения своего оппонента:

                                 VS(t) = Совершенные попытки(t) /Ожидаемые попытки(t).

Так, представим себе абсолютно среднюю атакующую команду, каждый игрок которой используется равнозначно. Если обороняющаяся команда никогда не обменивается в защите, то все игроки всегда противостоят 20% бросков каждый, так что средний VS будет равен 20/20 =1. Теперь учтем, что игроки получают различное количество бросков в нападении (скажем, Кармело Энтони), и количество попыток, встреченных защитником, также не обязано быть равным среднему их числу (например, как в случае уже упомянутого на Графике 3 Джеймса Хардена). Таким образом, VS меньше единицы указывает на подавление количества бросков по сравнению с ожидаемым средним; больше единицы – указывает на больший объем бросков по сравнению с ожидаемым (смотреть Таблицу 1). Абсолютно аналогично, можно получить зависящий от времени DS(t).

Таким образом, мы получили показатели VS(t) и DS(t), по ним можно, например, строить зависящие от времени оборонительные бросковые диаграммы. Однако, сравнивать подобные диаграммы между различными игроками довольно сложно. Попробуем найти более простой параметр, который укажет нам оборонительную эффективность игрока с учетом ее неравномерной распределенности во времени. Подобным показателем могут стать, например, пропущенные очки, за которые данный игрок ответственен. Этот показатель предлагается определять следующими способами:

  1. Методом изначальных противостояний: пропущенные очки/попытки броска начисляются тому игроку, который защищался против скорера в первые 10-4 секунд(ы) до броска

  2. Методом противостояний непосредственно во время исполнения броска: очки/попытки начисляются исключительно тому игроку, через которого был реализован бросок; то, что изображается на оборонительных бросковых диаграммах.

  3. Методом распределения: пропущенные очки/попытки начисляются пропорционально доле времени, которую данный защитник провел, защищаясь против скорера. 

Результаты

Вероятность того, что защитник будет противостоять броску во время данного владения, достаточно сильно варьируется от игрока к игроку. Так, чисто интуитивно ожидается, что центровые будут встречать существенное число бросков в связи с их игрой на подстраховке и частой помощи своим одноклубникам при атаке соперника из «краски». Так, Рой Хибберт, один из лучших обороняющихся под кольцом игроков, опекает практически 42% выполненных бросков (см. Таблицу 1).

 

Таблица 1: Top&Bottom 5 по проценту встреченных бросков среди «больших» (передаю пламенный привет игре на подстраховке Блэйка Гриффина). Рой Хибберт встречает 41.9% бросков из рассмотренных владений. Однако, число пропущенных очков, рассчитанное согласно Методу распределения, не так велико (как и у его бэкапа Маинми), что свидетельствует об определенной защитной стратегии Индианы.

Далее, произведем количественное сравнение трех методик присвоения пропущенных очков. Результаты приведены в Таблице 2

  1. Метод изначальных противостояний: дает адекватную оценку защитных действий в ранней стадии владения

  2. Метод противостояний непосредственно во время исполнения броска: еще один подход, а котором пропущенные очки/попытки начисляются всем игрокам, которые опекали реализовавшего бросок в моменты времени от 0.5 до 0 секунд до выпуска мяча из рук. Данный подход имеет свой существенный недостаток – цементирующие краску «большие», которые часто выходят на подстраховку, получают зашкаливающие показатели пропущенных очков.

  3. Метод распределения: Оба приведенных выше подхода имеют свои плюсы, обнажающие многие характеристики оборонительной игры атлетов. Однако, оба метода имеют свои существенные недостатки – первый не принимает во внимание возможную ответственность игрока, через которого были непосредственно набраны очки, второй же непропорциональным образом занижает показатели «больших», которые опекают большое число бросков. На Графике 1 приведена «матрица оборонительной статистики», составленная по третьему пути, несколько компенсирующему недостатки первых двух.  

Таблица 2: Сравнение трех методик (1 – Original, 2- Shot, 3 – Fractional) и порядкого номера игроков одной оборонительной группы (бэккорт-защитников) в базе по соответствующим показателям. Методики дают весьма близкие результаты, при этом все же подчеркивая различные особенности оборонительной игры атлетов.

Таблица 3: Пропущенные очки (расчитанные согласно Методу распределения) для бэккорт-защитников (верхняя часть) и защитников, встречающих большую часть своих бросков «с крыльев» (нижняя часть). Согласно предложенным показателям, Крис Пол пропускает наименьшее число очков за 100 владений и имеет один из самых низких VS. Джеймс Харден, напротив, находится в боттом-5 по пропущенным за 100 владений очкам, во многом за счет того, что он встречает большой объем бросков (один из самых высоких в своей оборонительной группе показателей VS=1.14).

Заключение

Несмотря на революционную возможность полного трэкинга игроков во время матчей, до настоящего времени не существовало попыток оценить с ее помощью индивидуальные оборонительные действия исполнителей. В данном исследовании предложено решение этой проблемы – введены оборонительные бросковые диаграммы, показатели бросков через данного защитника (Shots Against) и очков, пропущенных данным защитником (Points Against). Эти показатели позволяют оценить оборонительную эффективность игрока в течение всего защитного владения, предоставляя информацию о том, как часто и насколько результативно оппоненты совершают броски через данного защитника и где данный игрок обороны наиболее эффективен.

Конечно, приведенное исследование является модельно зависимым, и в данном исследовании не учтены многие тонкости оборонительных действий ради простоты понимания модели и легкости вычислений. Более того, без понимания оборонительной стратегии команды не всегда возможно адекватно оценить индивидуальные умения игрока (тот же «мистер замок» – 2013/2014 Жоаким Ноа пропустил в том сезоне довольно много очков за 100 владений, что, в отвлечении от роли в команде, француза, безусловно, дискредитирует).

Заключение для тех, кто НИАСИЛИЛ

КРИС ПОЛ – ТРУ ДЕФЕНСИВ ПЛЕЙР ОФ ЗЕ ЙИАР 2013/2014!!!!11

Материал подготовлен с использованием статей с ресурсов номер раз и номер два.

Фото: REUTERS/Robert Hanashiro/USA TODAY Sports; Fotobank/Getty Images/Stephen Dunn