Продвинутая статистика: какие показатели считают в КХЛ и что делать?
Всем воскресный привет! Сегодня – заключительный день межсезонья и праздник для всех, кто соскучился по игре. Конечно, в хоккейных городах был шанс “утолить жажду” при посещении летних турниров: я, к примеру, выбрался на Кубок мэра Москвы, где посмотрел на чудо-арену и дерби в полсилы. Но речь не об этом. Там знакомый журналист подарил мне красивую брошюру для СМИ и несколько протоколов, в которых было нечто, что в представлении организаторов, похоже, является «продвинутой статистикой». На самом же деле все находится на базовом уровне.
Вот вам протокол заключительного матча между “Динамо” и ЦСКА, в котором решалась судьба Кубка мэра. На первой странице мы видим достаточно примитивные вещи: броски, процент отраженных бросков, штрафное время, время игры в большинстве и меньшинстве с процентом эффективности. Их считают везде, нет ничего удивительного.
На второй странице есть результаты вбрасываний в хронологическом порядке. Указаны номера игроков, которые были на точке в каждом случае, что позволяет оценить их эффективность в данном компоненте игры. Плохо то, что схема льда подготовлена неважно. Левая, средняя, правая зоны в один столбик – словно вбрасываний около синей линии и флангов не существует. Непонятно, зачем было в каждой из трех зон рисовать по две линии с одинаковыми обозначениями и использовать только одну. Да и на сами данные в таком формате остается только смотреть: даже если бы они были в электронном виде, сделать с ними что-то нельзя. Не получится “вытащить” информацию для агрегации нескольких игр или целого сезона. Стоило оформить все в виде рядов, где каждый ряд – это отдельное вбрасывание, а колонки обозначают информацию о нем (зона, команда, выигравший игрок и так далее).
На третьей странице указаны броски игроков с результатами: гол, БОВ – бросок отразил вратарь, БОИ – бросок отразил игрок, БМ – бросок мимо. Рядом статисты попробовали отразить, куда влетела шайба – не без погрешностей, но за попытку надо сказать им спасибо. Точки можно использовать, чтобы разбить броски по качеству (чем дальше от ворот, тем меньше шансов на гол).
Итак, на второй и третьей страницах зафиксированы достаточно примитивные вещи, которые журналисты могут отметить самостоятельно, а специалисты тем более делают. Хочется отметить самый важный момент - польза от этих данных есть лишь в том случае, если указаны все игроков, которые находились на площадке во время броска или вбрасывания, а еще их игровое время. Тогда можно будет рассчитать множество показателей, основанных на бросках. Без этого мы получаем просто красивую картинку. Да, спасибо организаторам за попытку, но делать что-то надо, только если понимаешь как это делать и самое главное зачем. Кстати, со слов того же журналиста, сотрудники пресс-службы Кубка мэра мужественно пытались понять, что такое “награждение лучших игроков турнира” и чем стартовый состав отличается от итогового протокола (как видите, там составы и звенья не указаны).
Начало положено, и я надеюсь, что в скором времени КХЛ обратит свой взор на продвинутую статистику. Возьму на себя смелость дать статистам несколько советов по методике сбора данных. Во-первых, в Лиге уже давно считают игровое время хоккеиста в матче, а значит, есть информация о сменах и можно узнать, кто находился на льду во время событий. Во-вторых, будет здорово сделать примитивный файл событий (аналог НХЛовского play-by-play) и по строчкам указывать броски, вбрасывания и прочие элементы, чтобы болельщики могли видеть детали, а не довольствоваться агрегированными данными по игроку. В-третьих, стоит считать все броски, а не только в створ. Да, знаю, что многие крайне недоброжелательно настроены по отношению к “корси-шморси”, но если на сайте нашей любимой Лиги будет чуть больше статистики, то хуже не станет. Согласны?
А теперь – с началом восьмого чемпионата КХЛ! Отличного сезона вам и вашим командам!