11 мин.

Джеймс Харден самый универсальный защитник НБА. Что это значит?

Универсальность стала одним из ключевых навыков для игры в защите на уровне НБА. Это не будет откровением для тех, кто хоть сколько-то следит за лигой. В современной НБА все меняются на всех. И будь ты хоть сто раз Руди Гобером, если при размене на поинт-гарда тот сажает тебя на пятую точку, это плохо. В первую очередь для твоих карьерных перспектив.

Сражения на площадке, когда атакующая команда пытается получить мисматч, а защищающаяся помешать поэтому, составляют заметную часть красоты современного баскетбола. Но насколько этим тенденциям соответствуют сами игроки?

Глупо предполагать, что я первым задумался над оценкой универсальности игроков. Есть прекрасная Tableu от Кришны Насру, где он рассчитывает для игроков их рейтинг универсальности, силу их соперников (я тоже планирую это сделать, но немного иначе), средний рост и вес оппонентов (насчёт роста также есть задумка). Я настоятельно рекомендую пройти по ссылке, тем более, что там Вы можете сами "поиграть" данными, изменяя значения фильтров. Описание показателей можно поискать у Кришны в твиттере.

Ну а теперь вернёмся к тому, что и как считал я. Для начала скажу о том, какие используются данные. VERPL строится по показателям boxscore matchups-статистики. В ней указаны игроки атаки и защиты, сколько владений друг против друга они в игре сыграли и стандартные статистические показатели (очки, подборы, передачи, количество и точность бросков). Она неидеальна, но другой, увы, в открытом доступе нет. Здесь не учитывается то, что за одно владение игрока может опекать несколько человек, а берётся только вот, кто делал это дольше всех.

Для анализа была собрана matchups-статистика 1224 игр регулярного сезона НБА сезона 2018/19 (у шести игр таких данных нет).

пример вкладки matchups

Сначала начнём с общих цифр. Ниже на графике Вы можете видеть какой процент защитных владений игроки каждой позиции обороняются против каждой из пяти позиций. Позиции взяты из таблицы "2018-19 PIPM & Multi-Year PIPM" Джейкоба Голдштейна.

 

Четыре позиции из пяти чаще всего защищаются против коллег по амплуа, но если у центров эта специализация имеет ярко выраженный характер (86% процентов времени центры обороняются против таких же центров и PF), то третьи номера играют против коллег по позиции всего лишь в четверти владений, "уступая" проценту опеке шутинг-гардов. Лёгкие форварды ближе всех приближаются к "золотому стандарту" 20-20-20-20-20. Это неудивительно: основные перемещения идут в районе трёхочковой дуги. Как Вы увидите дальше в графиках кластерного анализа, такая "универсальность" позиции выходит им "боком".

Про "золотой стандарт" я сказал неслучайно, он лежит в основе показателя VERPL.

VERPL (VERsatility PLayer) - показатель универсальности игроков.

Для расчёта VERPL используется евклидово расстояние.

Для начала напомню, что такое евклидово расстояние. Это расстояние между двумя точками в пространстве. Я уже использовал его в статье "Пять игроков НБА, сильно изменивших свой бросок в этом сезоне".

"Эталоном" универсальности берётся показатель, когда игрок обороняется против всех пяти позиций одинаковое количество владений. Такой "универсальный солдат" и есть упомянутые выше 20-20-20-20-20. Этот показатель является просто ориентиром, который трудно достичь, да и не факт, что нужно. 

А теперь непосредственно к расчёту. Сначала мы вычисляем квадрат евклидово расстояния до эталона для среднего игрока каждой позиции. Я не извлекаю корень, потому что в дальнейшем мы будем работать с пятью составляющими этого расстояния в отдельности, а корень из суммы не равен сумме корней. Он будет извлекаться в самом конце, перед получением финальных результатов. Например, для центровых квадрат евклидово расстояния равен:

Получаем вот такую таблицу:

Как мы видим, расстояния для позиций сильно разнятся. Логично, что чем ближе к универсальности показатели среднего игрока позиции, тем меньше расстояние до пресловутых 20-20-20-20-20. 

Далее мы считаем количество защитных владений, которые каждый игрок отыграл против определённой позиции. Не все имеют хотя бы одно владение против каждой позиции. К таким игрокам мы "добавляем" недостающую позицию с нулём. Таблица выглядит так:

Потом для каждого игрока мы считаем общее число защитных владений (TOTAL_POSS) и их процент против каждой позиции (FREQ_PLAYER = POSS/TOTAL_POSS). Таблица увеличивается на две колонки:

Дальше добавляем в эту таблицу процент для среднего игрока этой позиции, полученный при построении самого первого графика (FREQ):

Теперь считаем два квадрата евклидовых расстояния, EUCLIDEAN_PLAYER и EUCLIDEAN_POSITION. 

 

Таблица приобретает такой вид:

Дальше мы считаем разность этих показателей, DELTA_DISTANCE. Отрицательная дельта - это универсальности в минус, положительная - это в плюс.

Затем мы складываем для каждого игрока все 5 значений DELTA_DISTANCE и получаем таблицу из 530 строк, по количеству игроков, выходивших на площадку в прошлом сезоне.

Далее мы наконец получаем евклидово расстояние для DELTA_DISTANCE и EUCLIDEAN, извлекая квадратный корень. Стоит заметить, что корня чётной степени отрицательных чисел в области вещественных чисел не существует, поэтому мы сначала берём модуль DELTA_DISTANCE, извлекаем из него корень, а затем, если изначально это расстояние было отрицательным, домножаем на -1.

Ну и наконец рассчитываем этот самый VERPL. Конечная формула такая:

Таблица с 15 лучшими игроками в плане защитной универсальности относительно своей позиции по показателю VERPL в сезоне 2018/19 (минимум 500 защитных владений).

Прежде чем делать анализ дальше, необходимо сделать два важных примечания:

1. VERPL - это показатель не абсолютной, а ОТНОСИТЕЛЬНОЙ универсальности игрока в сравнении с другими игроками своей позиции.

Говорить о том , что игрок с более низким VERPL является лучшим универсалом неправильно. Для примера возьмём двух игроков: центрового Зака Коллинса и лёгкого форварда Роберта Ковингтона. Давайте посмотрим сколько процентов защитных владений каждый из них тратит на опеку определённой позиции:

Если не брать в расчёт позиции, то распределение процентов примерно одинаковое, у Роберта даже более "гладкое". Однако, если мы посмотрим на показатель VERPL этих игроков, то Зак с показателем 0,26 будет занимать 11-ое место, а Ковингтон с 2.4 398-ое. Связано это с цифрами из первого графика. Среднестатистический центровой наименее универсальный игрок на площадке, в то время как лёгкий форвард, наоборот, самый универсальный. Поэтому получается, что имея приблизительно похожие цифры, Коллинс является более универсальным защитником, чем среднестатистический центр, а Ковингтон менее универсальным, чем среднестатистическая тройка. Глядя на то, что у одного игрока VERPL ниже, чем у другого, говорить, что "Игрок А универсальнее Игрока Б" некорректно. Корректно: "Игрок А для своей позиции универсальнее, чем Игрок Б для своей".

2. VERPL ничего не говорит о КАЧЕСТВЕ универсальности.

Обратите внимание на восьмое место рейтинга. Ничего кроме улыбки оно не вызывает. Кармело, которого только ленивый не пинал за его нежелание меняться и идти в ногу со временем, является вторым по VERPL тяжёлым форвардом, пропустив вперёд другого игрока Хьюстона, Гари Кларка. Что это значит? Это значит, что Мело действительно старался играть в тот баскетбол, который проповедуют Моури, Д'Антони и Бзделик. Он отыграл в защите не менее 14% против каждой из пяти позиций, опекая других PF 31.48% процента владений, что на 8% меньше среднестатистической четвёрки. Как у него это получалось? Ну, судя по количеству сыгранных владений, не очень. Игрок может защищаться против всех пяти позиций и делать это одинаково плохо. Первую часть (про защиту пяти позиций) VERPL учитывает, вторую нет.

В планах у меня сделать общий показатель универсальности, который будет иметь 3 составляющих:

  • Универсальность относительного игроков своей позиции (VERPL)

  • Общую универсальность

  • Качество опеки игроков разных позиций

Полный список из 413 игроков, которые сыграли не менее 500 защитных владений и их показатели VERPL, можете посмотреть в гугл-документе (для внесения изменений нужно создать копию).

Математический смысл показателя VERPL, гистограмма распределения и кластерный анализ.

Первая часть получается вводной, о конкретных показателях VERPL я напишу во второй части, где добавиться VERT (VERsatility Team) и карты-графики для команд.

VERPL имеет следующий математический смысл. Его величина показывает, какая часть евклидово расстояния для среднего игрока позиции "покрывается" каждым конкретным игроком.

Пример: VERPL Джеймса Хардена равен 0.05. Это значит, что евклидово расстояние Хардена находится от стандарта 20-20-20-20-20 на дистанции 0.05 евклидово расстояния для поинт-гардов.

Ниже представлена гистограмма распределения VERPL в сезоне 2018/19. График имеет две вершины: поменьше в районе 0.5 и побольше в 1.5. Практически нет игроков, которые бы играли строго по процентам своей позиции (VERPL приблизительно равен 1). Игроков, которые менее универсальны для своей позиции заметно больше. Значение показателя VERPL = 1 (т.е. универсальность среднего игрока позиции) находится на 71-процентили в сезоне 2018/19.

 

 

Также я сделал кластерный анализ игроков, используя их VERPL и количество сыгранных владений. Получилось разделение на 6 кластеров, которые я назвал в соответствии со значением показателей.

Распределение игроков по кластерам в соответствии с позицией:

Бросается в глаза, что в кластерах с хорошим VERPL присутствие форвардов заметно меньше, чем гардов и центров. И наоборот, кластер с плохим показателем VERPL почти полностью состоит из SF и PF. Как говорилось выше, происходит это потому, что евклидово расстояние для среднего форварда в разы меньше, чем для гарда или центра. Получается, что лёгкий форвард, чтобы иметь цифры Хардена или Симмонса, должен быть реально универсальным солдатом, имея что-то вроде 21.2-19.5-18-20.7-21.6

Дальнейшие планы:

Представленный в этой статье показатель, безусловно, сыроват. Я планирую рассчитать общую универсальность, без учёта позиций, а также качество защиты. После чего я постараюсь соединить эти компоненты в одну статистику. 

Возможно, показатель следует не только дополнять новыми данными, но и изменять уже существующие. Стоит ли делить на позиции или их нужно чем-то заменить (Advanced позициями, ростом игроков, что-то ещё)? Стоит ли привязываться к стандарту 20-20-20-20-20 или эмпирически попытаться найти более подходящее распределение владений? Возможно стоит ввести коэффициенты, чтобы невозможность защищаться против "соседней" позиции оценивалась строже (это уже больше к части про качество). Если у Вас есть какие-то идеи о том, как показатель можно улучшить/изменить, я с удовольствием обсужу это в комментариях.

Телеграм-канал о мире цифр НБА:

https://t.me/nbaatlantic

Надеюсь, данный анализ был Вам интересен. Спасибо за внимание и feedback в виде комментариев и оценок.