5 мин.

Сравнение shot-stopping метрик

После прочтения статьи Тома Ворвилла (Tom Worville) мы вдохновились идеей сравнения различных способов оценки способности голкиперов отражать удары.

Том Ворвилл в своей статье постулирует:

"Ты не должен использовать процент отраженных ударов для оценки shot-stopping способностей вратарей. Что использовать вместо: разницу между пропущенными голами и допущенными PSxG".

Том называет эту метрику "post-shot goals prevented".

Интуитивно "post-shot goals prevented" предельно адекватная метрика для оценки способностей вратарей отбивать удары. Что касается "процент отраженных ударов", она не учитывает качество ударов.

Единственный недостаток в том, что данные PSxG, которые используются для расчета "post-shot goals prevented", крайне ограничены в публичном доступе. Есть только последние пара сезонов на сайте fbref.com.

Что касается процента отраженных ударов, эту метрику можно найти на том же fbref начиная с 1998 года.

Можно придумать еще две shot-stopping метрики, о которых Том не упоминает:

  1. saved shots per 90 - среднее число отраженных ударов за матч

  2. pre-shot goals prevented - почти что то же самое что и "post-shot goals preventd", но вместо PSxG можно использовать xGoT (expected goals on target). Почему xGoT - просто потому что на understat.com можно найти эту метрику в открытом доступе за последние 5 сезонов.

Цель нашего исследования в том, чтобы оценить насколько далеки(близки?) 3 альтернативные метрики оценки перформанса вратарей по сравнению с "эталонной".

Для оценки "близости" метрик мы будем расчитывать коэфициент корелляции между "post-shot goals prevented" и остальными для одной и той же выбрки вртарей (топ 5 лиг, минимум 10 матчей, сезон 2018-2019)

Словарь терминов

  • xGoT (expected goals on target) - ожидаемые голы (pre-shot) среди ударов в створ, все удары мимо отфильтрованы, не учитывается куда именно наравлен удар, по центру или в угол.

  • PSxG (post-shot expected goals) - ожидаемые голы (post-shot). Вероятность забить гол с учетом того в какую зону ворот был нанесен удар, берутся только удары вствор.

  • post-shot goals prevented - разница между PSxG и пропущенными голами. Это "эталонная" метрика Тома Ворвилла.

  • pre-shot goals prevented - разница между xGoT и пропущенными голами. Альтернативная метрика, более распространенная в публичном доступе.

  • save percentage = ("удары в створ" - "пропущенные голы") / "удары в створ"

  • коэфициент корелляции (correlation coefficient) - метрика, показывающая насколько два параметра коррелируют между собой для одной и той же выборки. чем ближе к единице - тем выше корреляция.

Post shot goals prevented

Давайте для начала рассмотрим топ лидеров сезона 2018-2019 по "post-shot goals prevented" (эталон).

Миранте, Бенитез и Мерет - топ 3 вратаря прошлого сезона (в этом утверждении не учитывается игра ногами, только способности отражать сложные удары).

Начинаем сравнивать с другими метриками.

Число отраженных ударов за матч

На графике ниже по оси X - "post-shot goals prevented", по Y - число отраженных ударов за матч, также добавлена линия тренда.

Как вы видите, линия тренда почти горизонтальная, коэфициент корелляции составляет 0.14. Это означает, что "среднее количество отраженных ударов за матч" является вредной метрикой для оценки способности вратарей, она лишь показывает насколько "заняты" голкиперы в среднем по сезону, эту метрику использовать не стоит.

Это была разминка. Продолжаем.

Процент отраженных ударов за матч

Это та самя метрика, которую Том Ворвилл не рекоммендует использовать.

По оси X - "post shot goals prevented", по Y - процент отраженных ударов за матч. Выборка та же - все вратари топ 5 лиг, проведшие более 10 матчей за сезон.

Уже лучше, линия тренда почти 45 градусов, коэфициент корелляции 0.75. На графике появляются Антонио Миранте, Алекс Мерета и Вальтер Бенитез. Все, кого мы ожидаем увидеть. Метрики неплохо коррелируют.

Есть также точки весьма далекие от линии тренда, их немного, и надо рассматривать отдельно, что послужило причиной того, например, почему Людовик Бутелле находится очень низко по проценту отраженных ударов в створ, но примерно в середине по "goals prevented".

Pre-shot goals prevented

Теперь по оси Y - "pre-shot goals prevented", по оси X - все та же "post-shot goals prevented". Тут нужно сделать замечание, что данные по осям взты из разных источников, по Y - understat, по X - fbref. Искажение может быть выше чем в предыдущих примерах.

Коэфициент корреляции Пирсена тут равен 0.69, что немного ниже чем у "процента отраженных ударов", но все же достаточно высоко, чтобы брать эту метрику в расчет.

Интересно сравнить разброс точек расположенных выше и ниже линии тренда. Разброс не одинаковый. Точки ниже, сгруппированы хуже. Это може означать, что метрика по оси Y тем лучше коррелирует с "эталонной", чем выше точки относительно линии тренда (то есть чем лучше результат голкипера).

Итоги

  • Количество отраженных ударов за матч - вредная метрика.

  • Мы не оспариваем Тома Ворвилла, действительно "post-shot goals prevented" наиболее точная сейчас модель для оценки shot-stopping ability вратарей.

  • Если нет данных PSxG, то допускается использовать "процент отраженных ударов в створ" или "pre-shot goals prevented"

Использованы данные fbref.com и understat.com

подписывайтесь на twitter @ru_stats