Статистический MVP. Вступление или как я провел лето
В начале лета (или в конце весны), когда Дюранту вручали награду MVP сезона, у меня возник вопрос: «А что было бы, если MVP определяли не голосованием, а по формуле, учитывающей личную и командную статистику?». Наверное, подобные мысли посещали многих, ведь цифры объективны (хоть статистика и врет), а голосование всегда субъективно. Тем более, критерии, которыми руководствуются голосующие, часто остаются загадкой. Так появился проект, который получил название «Статистический MVP».
Чтобы ответить на поставленный вопрос, для начала нужно было выбрать те статистические показатели, по которым бы осуществлялся расчет. Недолго думая, я остановился на следующих:
- PPG, RPG и APG;
- PER и WS;
- % побед.
Первые являются основными показателями, на которые всегда обращают внимание. Продвинутая статистика позволяет оценить эффективность игрока и его роль в победах команды, а также включает в себя остальные обычные статистические данные (перехваты, блоки, процент попаданий и др.), от которых решено было отказаться, чтобы не усложнять подсчет. Кроме того, WS является накопительным показателем, что было важным, т.к. в формуле не учитывались проведенные игры и минуты.
Чтобы уравнять шансы игроков различных позиций, подборы и передачи были объединены. Очевидно, что 1 подбор не равен 1 передаче. Конечно, их ценность отличалась в разное время, но (опять же для упрощения) я решил сделать их постоянными. После некоторых раздумий был получен новый показатель, названный резистами (R = 0,8 * RPG + 1,2 * APG).
Несколько слов нужно сказать и о % побед. Правильным было бы брать % побед для каждого игрока, но, как вы уже могли догадаться, я брал % побед команды. Для игроков, менявших команду по ходу сезона, был взят процент последней. Логика тут такова: если игрок переходит в команду, значит, он соответствует ее уровню (спорно, но, на мой взгляд, достаточно справедливо).
Следующим шагом стало придумывание формулы. Я отталкивался от предположения, что если игрок лидировал по очкам, резистам, PER и WS, а его команда победила во всех матчах/выиграла регулярку, то данный игрок является 100%-ным MVP.
Основываясь на этом предположении, я составил три очень простые формулы, число которых, постепенно увеличиваясь, в итоге достигло десяти. В основном добавились формулы с коэффициентами. Это происходило в три этапа: 1) первые коэффициенты я придумал сам; 2) вторые рассчитал, сравнив статистических лидеров и настоящих MVP; 3) а затем увеличивал ценность командных результатов в рассчитанной формуле. Также добавилось еще две формулы: 1) совсем не учитывающая % побед и 2) делающая акцент на WS. Почему я подробно рассказываю про все формулы, хотя для определения статистического MVP использовалась одна, станет понятно в дальнейшем.
Уже после придумывания трех первых формул начался долгий и немного нудный процесс вбивания данных, о котором тоже нужно рассказать. Выборка игроков и ввод данных осуществлялись мной вручную, что сильно затянуло реализацию проекта. Наверное, можно было как-то это автоматизировать и ускорить, но тут уж я сам виноват. Каких-то четких критериев отбора не было: просто бралось человек десять, лидировавших по каждому статистическому показателю, а также лидеры команд и игроки, которые по совокупности показателей могли занять высокое место. Не учитывались игроки, сыгравшие слишком мало матчей или минут. Конечно, есть вероятность, что я кого-нибудь пропустил, но она крайне мала.
На этом пока все, список статистических MVP и формула, по которой они определялись, будут в следующей части.