Какая команда НБА ровнее других прошла сезон, а кого колошматило сильнее, чем «Лейкерс»? Узнать это поможет статистический анализ
От редакции: вы читаете блог «По обе стороны Атлантики», в котором объясняют баскетбол с помощью цифр. Поддержите автора плюсом, комментарием и подпиской!
Второй год подряд мы имеем сезон «не такой, как все». Меньшее число игр, ковидные протоколы, из-за которых отменялись матчи, а некоторые команды играли полурезервными составами, пустые трибуны и травмированный Леброн – все это накладывало свой отпечаток. В таких условиях было трудно пройти сезон на одной волне, без спадов. Поэтому мне стало интересно оценить изменчивость результатов на уровне конференций, позиций и команд. В статье представлен верхний уровень анализа, который позволяет ответить на вопрос «Какая из команд ровнее других прошла сезон 2020/21». Более детальную информацию можно будет посмотреть в созданном мною приложении.
Как считаем?
Берется дата отсчета (пусть 22 декабря 2020 года). Это каждый день сезона, когда были игры НБА.
От этой даты у каждой команды отсчитывается одинаковое кол-во игр (например 10).
На этом игровом отрезке считается процент побед каждой команды.
На основе своих результатов команда занимает место в конференции на этом отрезке (с 1 по 15). При равенстве процента побед, команды получают минимальный рейтинг, т.е. если Бруклин и Фила прошли 8-2, а Милуоки 7-3, то ранг парочки будет 1, у оленей 3, а второго места на этом отрезке не будет
Берется новая дата отсчета (23 декабря) и повторяются пункты 2-4.
Расчет останавливается, если от даты отсчета до конца сезона хотя бы у одной из 30 команд нет необходимого количества игр.
Все эти пункты выполняются для 16 различных скользящих окон: от 10 до 25 игр.
Что считаем?
Энтропию НБА. В теории информации энтропия – это мера неопределенности системы. Энтропия НБА – мера упорядоченности результатов. Чем результаты однороднее, тем энтропия меньше. Формула:
Приведу пару небольших примеров.
Пример 1. На 100 отрезках команда 94 раза была первой и 6 раз второй. Ее энтропия:
1 – (94^2 + 6^2)/100^2 = 0.1128
Пример 2. На 100 отрезках команда по 10 раз занимала места с 1 по 10. Ее энтропия:
1 – 10^3/100^2 = 0.9
Как мы видим, у первой команды энтропия низкая, у второй высокая.
Результаты расчетов
Начнем с энтропии конференций. Результаты в Западной конференции стабильнее на большинстве окон (от 10 до 22 игр), но с увеличением окна разница уменьшается и на окнах в 23-25 матчей стабильнее уже Восток. Достигается это засчет сильного падения энтропии с увеличением окна у лидеров конференции («Бруклин», «Филадельфия», «Милуоки») и аутсайдеров («Детройт», «Орландо»). А например у «Юты», одного из лидеров Запада, хотя показатель и низкий относительно других команд, но с увеличением окна почти не падает.
Самые стабильные позиции – это позиции лидеров (1-3 места в конференциях) и аутсайдеров (13-15 места). Список команд, которые на них бывают, ограничен. В тоже время на местах в середине таблицы бывали почти все и энтропия на них стабильно высокая, причем не особо падает с увеличением размера окна. Результаты довольно предсказуемы: если выдать результат 5-5 может выдать почти любая команда в конференции, то вот пройти тот же отрезок 8-2 или 2-8 «удел избранных».
По таблице и графику энтропии команд можно с легкостью ответить на вопрос из начала статьи: в плане результатов «Бруклин» – самая стабильная команда НБА прошедшего сезона. Вот его показатели на 25-матчевом окне:
Несмотря на все изменения в составе, «Нетс» стабильно держались в топ-3 команд Востока, причем большую часть времени на первом месте. Также стабильно вверху, но не столько много времени на какой-то одной позиции, были «Финикс» и «Филадельфия». Другой пласт стабильных команд возглавляют «Орландо» и «Хьюстон». Но тут причина прямо противоположная: команды на протяжении всего сезона были плохи. «Рокетс», если посмотреть их результаты на 25-матчевом окне, ни на одном отрезке не поднимались выше 11-го места на Западе, а «Орландо» – выше двенадцатого. Это не та стабильность, которой стоит гордиться.
На другом полюсе таблицы обитают команды, чей сезон похож на зебру: полоса белая, полоса черная. Причин этого может быть много и их анализ выходит за рамки данной статьи. Кто-то хорошо начал сезон, но поплыл во второй его половине («Лейкерс», их график на превью статьи), кто-то провалил старт, но собрался и выдал ударную концовку («Даллас»), а некоторые умудрялись за сезон несколько раз умереть и воскреснуть. Лучшим примером этого будет график «Вашингтона» на 10-матчевом окне:
Волшебники провалили старт и плелись в хвосте Востока до конца января, затем провели сильный отрезок до середины февраля, опять упали вглубь Восточной конференции на месяц вокруг МВЗ, и нашли второе дыхание на финальный рывок в конце сезона. Вашингтон хотя бы один раз оказался на всех позициях, кроме последней. Результатом всего этого стало попадание в плей-офф и один из самых высоких показателей энтропии.
Приложение
Формат статьи не позволяет более подробно остановиться на каждой из команд и их пути по сезону. Для тех, кто хочет самостоятельно посмотреть по какой кривой шел сезон той или иной команды, а также сравнить их друг с другом, я сделал небольшое приложение (последние две картинки скриншоты из него).
Приложение находится по адресу: https://vladislavshufinskiy.shinyapps.io/nba_entropy_application
С помощью панели слева, Вы можете выбирать команды, типы графиков и величину игровых окон, а также изменять диапазон дат. Давайте обо всех элементах управления по порядку.
Выбор команды: в этом виджете Вы выбираете команду или команды, которые будут отображаться на графике. Не советую выбирать одновременно больше трех команд, особенно если это команды одного порядка (например, Бруклин, Финикс и Филадельфия).
Тип графика. Есть два вида графиков: позиция команды в конференции каждый день (Rank day-to-day) и общее количество дней на каждой позиции (NDAY by rank positions).
Количество игр. Ползунком можно выбрать скользящее окно любой величины: от 1(команда всегда будет на первом месте, если выиграла и 7-10, если проиграла) до 72(место в итоговой таблице конференции).
Выбор диапазона дат. Можно убрать из расчетов часть сезона (например разделить сезон по Матчу всех звезд).
Кнопка Make. Ее нужно нажать при изменении значений в 4 выше указанных виджетах для отрисовки нового графика.
Помимо графиков, есть еще вкладка с данными, где отображаются результаты всех игр выбранных команд.
Ниже гифка, на которой показано, как работать с приложением (можно увеличить, открыв в отдельном окне).
То же самое можно посмотреть в формате видео.
Все, в том числе приложение, можно запустить локально, скачав репозиторий и имея на компьютере установленную среду языка R.
У меня есть несколько проектов, которые находятся на разной степени готовности (от «Только начался» до «Все в принципе сделано год назад, но опубликовать руки так и не дошли, а теперь я не помню, что считал». Хотелось бы написать следующий пост раньше, чем через полтора года, а также оживить телеграм-канал. Писать в него каждый день, как было пару лет назад, я не смогу, но один-два раза в месяц что-то интересное постараюсь добавлять. Желаю вашим любимым командам успехов в плей-офф, если их название начинается с Далла*.
Телеграм-канал о мире цифр НБА:
Надеюсь, данный анализ был вам интересен. Спасибо за внимание и feedback в виде комментариев и оценок.
Спасибо за труд.
Вопрос в том что задумано масштабно, нр выглядит продукт сырым и недоделаным. Вдобавок не все обладают глубокими знаниями в матстатистике.
Я думаю Азат прав. Нужно разбить это масштабное иследование на несколько более простых. И не надо сложных формул и терминов. Достаточно простыми словами иобьяснить что исследует функция. А так это попахивает самолюбованием.
Не уверен, что информация по энтропии самая интересная/полезная, но если Вы софтинку привяжете к забору информации по результатам команд с nba.com, можно много интересных фишек накрутить. :)