11 мин.

Анализ бросков Сан-Антонио Спёрс

В данной статье сделан анализ бросков Сан-Антонио Спёрс за первые 27 игр чемпионата. Если Вам этот анализ покажется интересным, то пишите в комментариях анализ бросков какой команды Вы хотели бы увидеть ещё. Для одной-двух самых заплюсованных команд (если конечно эта пара вообще наберётся) я сделаю подобный анализ.

Если Вам интересен только результат анализа, то промотайте пункт "Сбор и обработка данных" и начните читать сразу с "Анализ бросков Сан-Антонио в первых 27 играх сезона 2018-2019"

Сбор и обработка данных.

Данные и их сбор играют всё большую роль в нашей жизни. Нас пугают, что "всё, что Вы скажете, может быть использовано против Вас" или веселят историями, как гипермаркет узнаёт о беременности девочки-подростка раньше, чем её родители. Это же касается и НБА. Сейчас, в конце 2018 года, имея компьютер и доступ в интернет любой человек из Твери, Самары, Антананариву и т.д. БЕСПЛАТНО (а если готовы платить, то количество информации ещё многократно возрастает) имеет доступ к такому количеству статистики по НБА, которое не снилось даже генеральным менеджерам франшиз ещё 20 лет назад. Но большие возможности предъявляют и большие требования к сбору и обработке полученных данных.

Я в полной мере это ощутил, когда собирал базу данных по флотерам, использованную в прошлой статье. Сбор и приведение в божеский вид 26 с лишним тысяч бросков, отняло у меня большую часть времени, потраченного на анализ. А всего за сезон совершается больше 200 000 бросков. В темпе как при сборе данных по флотерам, получение информации о всех бросках за сезон займёт где-то целую рабочую неделю, а то и больше.

Поэтому очень сложно обойтись для помощи. Для себя я нашёл и решил изучить язык программирования R, который предназначен для статистической обработки и графического вывода данных. Пока я ещё только в начале пути изучения, но некоторые плюсы я уже могу описать:

  • Скорость очистки данных. Каждый, кто хоть раз копировал данные в эксель со stats.nba знает, что это довольно трудоёмкое занятие: нужно либо аккуратно выделять для копирования таблицу, либо копировать всю страницу, но уже в экселе "чистить" данные от ненужной информации. Со вторым очень помогает R. Всего пара строк кода и он удаляет из таблицы ненужные данные, приводя её в рабочий вид. Это сэкономило мне уйму времени.

  • Воспроизводимость. Ещё одно положительное отличие от анализа в эксель это то, что в R всё работает по написанному программному коду, что позволяет экономить время для однотипных анализов (таких как анализ бросков разных команд), т.к. программный код, написанный для одного анализа в полной мере подойдёт и для других 29 случаев. Да, сначала его написание заняло уйму времени (в первую очередь из-за моего небольшого объёма знаний) и на анализ бросков Далласа (вышел на  "The Smoking cuban" вчера) я потратил гораздо больше времени, чем если бы делал в его в эксель. Но уже при анализе бросков Сан-Антонио я это время сэкономил, используя те же скрипты, что и для Маверикс.

К сожалению, пока у меня небольшой объём знаний о R, особенно в плане графического вывода и автоматизированного сбора информации, поэтому полностью уйти от анализа в эксель не получается. Но очевидно, что использование специальных программ ускоряет и автоматизирует процесс анализа, что позволяет делать его лучше и для данных больших объёмов.

Анализ бросков Сан-Антонио в первых 27 играх сезона 2018-2019.

Спёрс к моменту написания статьи сыграли 27 игр. Они имеют отрицательный баланс побед-поражений (после победы над Финиксом уже 50%) после данного количества игр в сезоне впервые с 1996 года. О проблемах Сан-Антонио в этом году написано не меньше, чем хвалебных од Милуоки и первому настоящему баскетбольному тренеру в карьере Янниса. К этим проблемам относятся обмен Кавая, травма Мюррея, уход ветеранов, две звезды, имеющие однотипные диапазоны броска, знаменитая защита Спёрс, которая в этом сезоне стала знаменитой защитой Никс. Я в этом анализе бросков не буду пытаться найти корень проблем шпор, во-первых потому что не ставил такую задачу, а во-вторых анализ бросков по данным Play-by-Play не самый пригодный для этого материал. Какие-то выводы из представленных данных Вы сможете сделать сами.

Сперва рассмотрим гистограмму бросков шпор (броски с 0 и 1 фута здесь объединены в первый столбец):

Тот же график, но по оси Y отложено количество бросков с каждой дистанции:

Если посмотреть шесть дистанций, с которых было совершенно больше всего бросков, то Сан-Антонио предстают довольно современной командой:

  • 25 футов - 242 броска (Частота 9,98%)

  • 0 футов - 202 броска (Частота 8,33%)

  • 1 футов - 197 бросков (Частота 8,13%)

  • 2 футов - 153 броска (Частота 6,31%)

  • 24 футов - 108 бросков (Частота 4,46%)

  • 26 футов - 105 бросков (Частота 4,33%)

Все дистанции входят в понятие "Rim or 3". Но дьявол кроется в деталях. Да, дистанции входящие в средний диапазон не находятся в топе, но на них всё равно приходится много бросков. У шпор из 17 дистанций на расстоянии 5-21 фута от кольца (входят в short mid-range и long mid-range на PBPStats.com) только две имеют частоту ниже 2%. Для примера, у Далласа ровно наоборот: лишь 2 из 17 дистанций имеют частоту больше 2%. Также на гистограмме видно, что шпоры любят сверхдальние двухочковые: с расстояния 16-20 футов совершается 16,09% всех бросков.

И тут мы возвращаемся к нашим баранам участникам звёздного уикэнда. 

Это гистограммы бросков двух лидеров Сан-Антонио. Картина примерно одинакова: +/- четверть бросков с 0-2 футов, потом проседание частоты до дистанции в 10 футов, рост количества бросков до 20 футов и резкое падение на этой отметке. Ни один, ни второй не бросают с трёхочковой линии, но с удовольствием бросают за два-три шага до неё.

Средняя дистанция двухочкового броска шпор: 9,36 фута. Больше только у Голден Стейта. Но это не тот случай, когда стоит копировать лидера. Средняя величина дистанции двухочкового имеет отрицательную корреляцию с процентом реализации на уровне -0,43.

Так что если вы не имеете 3 из топ-10 лучших шутеров современности, чтобы бросать из среднего диапазона аномально хорошо, то лучше стараться этого не делать. Сан-Антонио не умеет: их процент дальних двухочковых (с 14 футов до трёхочковой) 38,63%. У Голден Стейта на десятку лучше.

Раз уж начали про среднюю дистанцию броска, то рассмотрим график этого расстояния для каждого игрока Спёрс:

Неудивительно, что самой короткой средней дистанцией броска обладает центровой, который три четверти своих бросков совершает из пределов 3 футов и вообще не бросает трёхочковые. Под крайним правым столбцом я ожидал увидеть фамилию Белинелли, но там оказался Бертанс. Однако, если взглянуть на цифры, то ничего удивительного: латыш 72,36% своих бросков совершает из-за дуги, в то время как итальянец на 20% меньше (52,84%). Эта разница, учитывая, что из-под кольца оба бросают примерно 15% бросков, уходит на броски Марко со средней дистанции, что сокращает общую среднюю дистанцию броска.

Ну и чтобы закончить с темой средней дистанции рассмотрим график средней дистанции для каждого типа броска:

 

На этом графике представлен 41 тип бросков, совершенных Сан-Антонио походу сезона. Я уже говорил о подводных камнях и человеческом факторе в Play-by-play журналах бросков, но рассмотреть их всё равно интересно. На этом графике можно различить тенденции, которые интуитивно всем понятны (например, что данки имеют самую короткую дистанцию броска), но из-за большого количества данных он сложен для восприятия. Поэтому я объединил броски в 6 категорий, убрав уточнения (игровую ситуацию, в которой совершён бросок и движение тела игрока):

Здесь уже очевидно, что Данки и лэйапы совершаются в непосредственной близости от кольца, далее идут крюки и флотеры, а джампшоты имеют среднюю дистанцию почти 20 футов, что говорит о том, что большая их часть - это трёхочковые. Стоит заметить, что средняя дистанция джампшота у Далласа хорошо за 20, так что это ещё раз возвращает нас к количеству дальних двухочковых у Сан-Антонио.

За 27 игр Спёрс бросили 2424 бросков, которые операторы отнесли к 41 разной категории. Вот график количества бросков для каждой из них:

Первое место с отрывом занимают джампшоты, а вообще 6 самых излюбленных категорий бросков - это джамперы и лэйапы. А вот график для 6 категорий:

61,22% бросков - это джамперы. По количеству они опережают лэйапы больше, чем на 900 попыток. Опять же, если сравнивать с такими же данными по Далласу, то частота использования джамперов у шпор на примерно 9-10% выше, джамперов в 2,6 раза больше, чем лэйапов (при 2,25 у Маверикс), а также не в почёте данки, которые совершаются только раз за двадцать попыток и занимают 6 место из 6, в отличии от 4 места у соседей по штату. Это понятно, потому что шпоры не имеют таких финишёров на ободе как Джордан и Пауэлл.

Что касается реализации, то получается "реверсивная решётка" относительно средней дистанции броска: чем больше дистанция, тем ниже процент. Пять категорий обитают в диапазоне 0,4-0,6, а вот данки имеют процент реализации 89%. Эти цифры сходны с такими же у Далласа.

При просмотре графика с процентом реализации с каждого фута, можно отметить резкое падение в диапазоне 2-5 футов, а также очень хороший процент для сверхдальних трёхочковых (с 28 и 29 футов Сан-Антонио реализует каждую вторую трёшку, при этом Стеф Карри в ростере шпор не значится).

Если хорошая точность дальних трёхочковых объясняется очень маленькой выборкой (всего 14 бросков), то на падении  процента вблизи кольца стоит остановиться.

Замечу, что это не какая-то фишка Спёрс: у Далласа также падает процент в этом диапазоне (даже сильнее). Причины этого в изменении пропорций в категориях броска и падение реализации лэйапа.

Что в диапазоне 0-1 фут, что 2-4, игроки Спёрс в основном бросают лэйапы. Но дальше идут различия: вместо данков, которые на дистанции 0-1 занимают 2 место по частоте использования, с 2-4 футов больше бросают крюков, флотеров и даже джамперов, т.е. бросок, который реализуется 9 раз из 10, заменяется теми, что имеют процент ниже 50%:

Что касается ситуации с лэйапами, то с 0-1 футов они реализуются примерно в 70% случаях, на 2 футах происходит падение до 50%, а с 3-4 футов только каждый третий лэйап оказывается точным. Тоже самое происходит и у Маверикс: дальше 1 фута от кольца лэйап из очень эффективного броска резко превращается в очень плохой.

В завершении анализа посмотрим на процент реализации в зависимости от игры дома/в гостях и по каждой минуте в каждой четверти.

К графику сравнения  точности бросков дома/в гостях стоит относиться больше как не очень информативному дополнению, т.к. выборка по-каждому случаю всего около 10 игр. Можно отметить, что в диапазоне 5-10 шпоры бросают лучше в гостях, а дома кольца помогают заходить в цель дальним двухочковым.

Ну и последний график в анализе. На графике (его надо читать справа налево, 11 - это первая минута четверти, 00 - последняя) видно, что шпоры имеют проблемы с точностью бросков на последних минутах третьей четверти, а в остальном процент достаточно ровный, в отличии Далласа, который имеет резкое падение точности в концовке каждой из четвертей.

В заключении отмечу, что распределение бросков Сан-Антонио по дистанции нетипично для современной НБА. Но тут шпоры являются заложниками стиля игры двух своих лидеров, которые не любят, да и не особо умеют бросать трёхочковые броски. Спасибо тебе, дядя Кавая.

Надеюсь, данный анализ был Вам интересен. Спасибо за внимание и feedback в виде комментариев и оценок.