Трибуна
5 мин.

Парадокс Симпсона: почему Уэстбрук попадает лучше Карри, хотя бросает хуже

От редакции: вы читаете пользовательский блог, где применяют математические методы к познанию баскетбола. Подписывайтесь, здесь всегда интересно.

Загадка

Стефен Карри выдает в сезоне 41,5% с игры, а Руди Гобер – целых 70,7%. Если знать, что первый из них – рекордсмен НБА по количеству трешек, а второй – центровой, который бросает только из-под кольца (целых 2 попытки за сезон не из “краски” из общих 300+ попыток), то ничего удивительного в этом нет. Очевидно, что семифутеру бросать двухочковые удобнее и бросает он их гораздо чаще. Отсюда и высокий процент попаданий в целом.

А вот у Рассела Уэстбрука в этом сезоне – 44,3% попаданий. И есть большой соблазн тоже объяснить это тем, что атлетичный защитник «Лейкерс» лучше бросает двушки, чем более скромный по габаритам Стеф. Но это не так: у Уэстбрука 47,5% внутри дуги, а у Карри – 48,6%. Из-за дуги тем более лучше у одного из “splash brothers”: 28,9% против 38,6%. Перед нами типичный это парадокс Симпсона: при разбитии данных на группы, внутри групп наблюдается одна динамика, а при объединении всех групп вместе – прямо противоположная.

Отгадка

Объяснение парадокса в данном случае такое: Уэстбрук гораздо чаще бросает двухочковые (560 попыток против 290), а они в целом исполняются с более высоким процентом, чем трехочковые, положительно влияя на общую точность с игры. Карри же больше «пуляет” трешек (500 попыток против 150), которые, хотя они ценятся выше и попадать их сложнее, в статистике попаданий “весят” ровно столько же, сколько и двушки. Таким образом, рассмотрение EFG%, где учитывается еще и ценность забитых бросков, вместо обычного FG%, ставит все на свои места: 53,4% у Стефа и 47,8% у Рассела.

Парадокс Симпсона в спорте встречается довольно часто:

  • пример про бейсболистов Джитера и Джастиса даже попал в википедию

  • общие карьерные проценты легенд НБА Ларри Берда и Реджи Миллера демонстрируют ситуацию, аналогичную той, что разобрана выше (попробуйте, не открывая ссылку, ответить, у кого общий процент выше)

Какие бывают броски

Парадокс встречается так часто, что интереснее было бы найти случаи с более детальной разбивкой по зонам совершения бросков, а не просто по их ценности. Для этого я достал с сайта статистики НБА данные на 28 января о бросках с разных дистанций за этот сезон.

При этом в статистике НБА место совершения броска учитывается сразу в нескольких разрезах:

  • классическая разбивка по ценности попадания: 2-очковые и 3-очковые

  • по дальности от кольца: тут целых две линейки, по 5 футов и по 8 футов. У них там неметрическая система. Они даже называют “Роял чизбургер” четвертьфунтовым чизбургером.

  • по бросковым зонам: из-под самого кольца, из «краски», со средней и 3х-очковые из угла слева\справа и по центру:

Примеры

Начнем как раз с последнего подхода:

Столбцы на графике – процент попаданий игрока из данной зоны, сплошная линия – общий процент с игры (FG%), а пунктирная – доля бросков из этой зоны для данного игрока.

Примечательно, что игроки схожих антропометрических данных так по-разному выбирают\создают себе броски. Домантас более 50% своих совершает около кольца, что даёт ему +5% общей точности в сравнении с Дюрэнтом, хотя тот лучше в каждой отдельной зоне.

В следующей паре наоборот, игроки различны по позиции и габаритам, но довольно похожи по бросковым линейкам:

Два вполне современных игрока, предпочитают броски из-под кольца и из-за дуги, избегают дальних средних. За этими цифрами (а так же за сравнением зарплат) даже можно не заметить, что один из них – главная звезда и лидер команды, а второй – просто хороший баскетболист. Такое существенное отличие по статусу складывается из суммы различий в небольших деталях.

Пример из последней оставшийся разбивки бросков поистине царский – Леброн и Яннис:

Тут парадокс Симпсона проявляет себя во всей красе: общая статистика идет в разрез с множеством частных, несмотря на схожесть в выборе бросков, близости процентов и даже общего количества попыток (примерно 750 у обоих на момент сбора данных).

Врет ли статистика?

Скорее, в данном случае, она наглядно показывает, что баскетбол сложен и даже один его аспект, будучи измерен избыточно просто, может приводить к неверным выводам.

Фото: Gettyimages.ru/Kevork Djansezian