Харден ставил Беверли в угол, а Гобер выгонял Фэйворса из-под кольца. Как партнеры влияют на броски друг друга
От редакции: вы читаете пользовательский блог «По ту сторону Атлантики», где пишут об американском баскетболе через призму статистики. Не забывайте, что плюс – важная часть уравнения.
Пока регулярный сезон НБА набирает обороты, а чемпионат по оверреактингу закончился, можно немного отвлечься от происходящего на площадках в данный момент и зайти в мир цифр и исторической статистики. Для этого Вы и читаете этот блог. Вряд ли для кого-то станет новостью, что в баскетбол играют 5 на 5, а побеждают американцы. В такой маленькой замкнутой системе, как команда на площадке, каждый элемент(игрок) влияет на все остальные(партнеров) и наоборот.
Вот еще одна прописная истина: в баскетболе бросают по кольцу и это самый важный элемент игры, потому что только это приносит очки. Карта бросков игрока, как его ДНК – уникальна. Некоторые из них похожи как близнецы, другие не имеют ничего общего. На выбор позиции для броска влияет множество факторов, от позиции игрока на площадке до банальной случайности. Чтобы дальше не превращать статью в туториал «Баскетбол для самых маленьких» пора переходить к ее теме. Мне стало интересно проанализировать как на shot-selection (я буду использовать такое написание. Выбор бросков как-то не звучит) игрока влияет нахождение/отсутствие на площадке кого-то из партнеров. Итогом исследования стала метрика PIMS (Partner’s IMpact on Shots selection). Нюансы будут рассказаны ниже, а пока скажу, что для анализа брались данные с https://www.nba.com/stats/ за последние 5 сезонов (2016/17 – 2020/21). Если описание данных и создания метрики неинтересно, можно пролистать до первых графиков. Я постараюсь кратко рассказать о каких данных идет речь. Итак, данные у нас состоят из 3 ингредиентов:
Play-by-play. Это записи о каждом событии в игре. Пример
Данные о бросках. Помимо данных о том, кто и когда сделал бросок, нам нужны его координаты. В явном виде этих данных нет, но их можно получить по NBA API.
Список всех игроков, игравших в НБА. Необязательный пункт, просто единый список удобнее, чем выуживать имя и фамилию игрока из данных первого или второго пункта.
Здесь я не буду тратить время на рассказ как эти данные получить, об этом есть очень классный сборник туториалов в гитхабе Райана Дэвиса.
Итак, задача уже была озвучена, теперь о ее решении. Во время любого броска на площадке помимо бросающего есть еще 4 партнера. Данных о том, кто в данный момент находится на площадке НБА не дает, но их в 99% случаев можно получить из play-by-play, а оставшийся процент из боксскора. Как это сделать интересная задача, но описание ее решения не для этой статьи (скажу только, что я не ожидал, что можно провести на площадке всю четверть без замен, не сделав ничего, чтобы попало в протокол. Но Гаррет Темпл в Сакраменто однажды такое провернул). В итоге у нас для каждой пары игрок-партнер есть следующие данные:
Данные о бросках игрока. Нас интересуют Х, Y координаты.
Данные о нахождении/отсутствии партнера на площадке.
Дальше мы разбиваем броски на две выборки: с партнером на площадке и без, большую из них обрезаем до размера меньшей (т.е. если у игрока 350 бросков без партнера и 250 с партнером, то дальше участвуют 250 бросков из каждой) и считаем дистанцию между этими группами. Считается она так:
Х и Y координаты бросков в обеих группах сортируются в порядке возрастания
Первая Х-координата из выборки без партнера вычитается из первой Х-координаты выборки с партнером, вторая из второй и т.д. Берем модуль получившейся разности, т.к. нам нужны положительные значения.
Затем мы каждый модуль разности делим на корень из средней координаты броска игрока. Это регуляризатор, позволяющий сравнивать всех игроков, вне зависимости от того, бросает он только трехочковые или из-под кольца.
Получившиеся разности суммируются и делятся на количество бросков в каждой группе.
Формула дистанции
Мы имеем показатель различия shot-selectionа в зависимости от нахождения/отсутствия партнера на площадке. Но проблема метрики на данном этапе, что ее числовое значение ни о чем нам не говорит. Допустим, для пары игрок А и игрок Б эта метрика равна 3. А что такое это 3? Это много, мало, в чем измеряется? Да, в сравнении с другими результатами ее величину можно оценить, но без контекста она непонятна.
Как я уже говорил выше, карта бросков уникальна и если мы возьмем броски игрока и разобьем их на две части, не беря во внимания партнеров на площадке, мы все равно не получим ноль. В таком случае можно посчитать какова величина этой «случайной дистанции». Я несколько раз запускал расчеты и все они сходились в значение 0,64. Теперь мы можем взять дистанцию для пары игрок-партнер, поделить на 0,64 и получить во сколько раз показатель дистанции больше/меньше, чем для выборки без учета партнеров на площадке. Это и будет PIMS.
Формула PIMS (Partner’s IMpact on Shots selection)
Теперь к конкретным результатам. На первом месте среди всех пар игрок-партнер идут Фэйворс и Гобер из сезона 2018/19:
Фэйворс-Гобер, сезон-2018/19, PIMS: 5.26
Как читать графики: график слева – это карта плотности бросков. Чем ярче красный цвет, тем больше бросков из этой зоны сделал игрок, когда партнер был на площадке, чем ярче синий, тем больше бросков, когда партнера не было. Верхний график справа: обычный точечный график бросков, с указанием очков за бросок (Points per shot). Нижний правый график: точечный график бросков, с которого удалены «близкие броски»(броски из разных групп, но с примерно одинаковыми координатами). Это позволяет четче видеть кластеры.
Так получилось из-за того, что друг без друга эти игроки играли в своей любимой зоне «поближе к кольцу», но когда они появлялись на паркете вместе, краска не могла выдержать двоих и один из них (Гобер) продолжал играть вблизи кольца, а другой (Фэйворс) вынужден был уходить в поле и играть по схеме «принеси-подай-иди в угол, не мешай». У Руди, кстати, shot-selection от наличия на площадке Фэйворса не зависел никак. На пятом (на втором если отбросить «пассажиров») месте Фэйворс-Гобер из сезона-2017/18. Как видно по PPS, Деррик при игре вдвоем сильно проседал по эффективности броска, так что нет ничего удивительного в том, что в итоге его пути с Ютой разошлись.
На втором месте... Фэйворс-Краудер из сезона-2018/19:
Фэйворс-Краудер, сезон-2018/19, PIMS: 4.49
На третьем, четвертом и шестом месте также пара Фэйворс – игрок верха ротации Юты из сезона-2018/19. Почему так? Потому что на площадке находятся пятеро, а сравниваются только двое. Так что Краудеру оказалось достаточно просто постоять (точнее посидеть, т.к. он чаще играл с Фэйворсом без Гобера) на площадке, чтобы получить высокий PIMS, хотя понятно, что Джей, Кайл Корвер, Донован Митчелл и Рикки Рубио на shot-selection Фэйворса влияли примерно никак, это полностью «заслуга» Гобера.
То же самое с Патриком Беверли. В сезоне-2016/17 три верхние строчки занимает Патрик с тремя партнерами: Джеймсом Харденом, Райаном Андерсоном и Сэмом Деккером. Сама мысль, что Сэм Деккер в НБА влияет на чей-то бросок, даже на свой, противоестественна. У меня есть идеи, как можно попытаться убрать эти «дубликаты», но пока метрика требует оценки человека и его здравого смысла.
Беверли-Харден, сезон-2016/17, PIMS: 3.2
Возвращаясь к ситуации «два больших», на четвертом месте пара Тернер-Сабонис.
Тернер-Сабонис, сезон-2019/20, PIMS: 3.09
Позапрошлый сезон – это один эпизод из трехсерийного фильма о том, как парни влияли друг на друга.
График изменения PIMS в паре Тернер-Сабонис
На графике видно развитие событий: примерно одинаковый PIMS в первом сезоне, резкий рост PIMS Тернера во втором, продолжение этого роста в третьем (в финальную таблицу этот результат не попал, т.к. я туда включал только группы с 200+ бросками) и одновременное падение влияния Тернера на бросок Сабо. Когда Майлз на площадке один, он бросает по кольцу из центральной зоны, ограниченной боковыми линиями краски. Когда же они играют вместе, Тернер уходит из центральной зоны на края, в то время как Сабонис бросает оттуда же, откуда и без партнера на площадке.
Ну и куда же в тексте про влияние без Рассела Уэстбрука? В топ-15 три человека (Шредер, Грант и Оладипо) имеют в партнерах именно Уэстбрука.
Шредер-Уэстбрук, сезон-2018/19, PIMS: 2.91
Грант-Уэстбрук, сезон 2017/18, PIMS: 2.59
Оладипо-Уэстбрук, сезон-2016/17, PIMS: 2.56
Денниса Расс выгонял на трехочковую линию, а когда того не было на площадке, Шредер сам исполнял Уэстбрука, примерно той же эффективностью (посмотрите на PPS). Оладипо с Расселом тоже больше атаковал из-за дуги, а без него переходил на средние. Грант, как и Фэйворс, освобождал краску, уходя на дугу в углы, но делал это гораздо полезнее (1.3 PPS).
Пар, которые удовлетворяют условию отбора (игрок должен был сделать не менее 200 бросков с и без партнера) слишком много. чтобы описать их всех, полную таблицу я выложу в телеграмм-канал. Если будет интересно посмотреть на график какой-то пары, которая не представлена в статье, пишите в комментариях, выложу. Также, учитывая комментарии из прошлых статей, я опустил многие технические детали исследования, например, что расчет для пары делался не 1, а 100 раз и т.п. Опять-таки, если кому-то эти нюансы интересны, могу написать в комментарии или, если можете прочитать код на R, можете сами все посмотреть в репозитории проекта.
Ну а в конце я вставлю таблицу топ-15 показателей PIMS за 5 сезонов, отфильтрованную от Краудеров и еще несколько графиков, которые мне кажутся интересными. Стоит заметить, что пара Лопес-Коннатон должна подходить под категорию отфильтрованных (вряд ли именно Пэт влияет на бросок Брука), но я оставил их график как демонстрацию разницы в использовании Лопеса между первым и вторым юнитом Милуоки.
PIMS Top-15
Рэндольф-Марк Газоль, сезон-2016/17, PIMS: 2.69
Уэстбрук-Капела, сезон-2019/20, PIMS: 2.01
Джордж-Уэстбрук, сезон-2017/18, PIMS: 1.87
Пау Газоль-Олдридж, сезон-2017/18, PIMS: 2.85
Тернер-Сабонис, сезон-2020/21, PIMS: 3.97 (выборка из 144 бросков)
Грант-Йокич, сезон-2019/20, PIMS: 2.8
Дедмон-Коллинз, сезон-2017/18, PIMS: 2.96
Букер-Эйтон, сезон-2020/21, PIMS: 1.48
Форбс-Миддлтон, сезон-2020/21, PIMS: 2.59
Брук Лопес – Пэт Коннатон, сезон-2020/21, PIMS: 2.42
Дэвис – Марк Газоль, сезон-2020/21, PIMS: 2.02
Телеграм-канал о мире цифр НБА:
Надеюсь, данный анализ был вам интересен. Спасибо за внимание и feedback в виде комментариев и оценок.
Фото: Gettyimages.ru/Al Bello
1) Из-за травм самого Брона (55 и 45 игр в сезонах 2018/19 и 2020/21. В них 200+ пар нет вообще)
2) Брон не очень любит большие ротации: ты либо играешь с ним, либо не играешь. А ГМ Леброн Джеймс делает всё, чтобы большой ротации у команды Леброна-игрока не могло быть в принципе.
Но про расставлять по углам - это точно:
Лав-Джеймс 2016/17:
https://d.radikal.ru/d10/2111/73/f42b13724928.jpg
Кузьма-Джеймс 2019/20:
https://c.radikal.ru/c09/2111/75/9b066aa15a51.jpg
Корвер-Джеймс 2017/18:
https://b.radikal.ru/b29/2111/6d/dcc7cb5ca3f3.jpg
На Дэвиса в чемпионском сезоне Брон не влиял никак (PIMS отрицательный), а вот в прошлом он резко вырос до 1,86. Однако, их карта очень сильно похожа на карту Дэвис-Газоль, так что, видимо, не в Короле дело.