Сравнение shot-stopping метрик
После прочтения статьи Тома Ворвилла (Tom Worville) мы вдохновились идеей сравнения различных способов оценки способности голкиперов отражать удары.
Том Ворвилл в своей статье постулирует:
"Ты не должен использовать процент отраженных ударов для оценки shot-stopping способностей вратарей. Что использовать вместо: разницу между пропущенными голами и допущенными PSxG".
Том называет эту метрику "post-shot goals prevented".
Интуитивно "post-shot goals prevented" предельно адекватная метрика для оценки способностей вратарей отбивать удары. Что касается "процент отраженных ударов", она не учитывает качество ударов.
Единственный недостаток в том, что данные PSxG, которые используются для расчета "post-shot goals prevented", крайне ограничены в публичном доступе. Есть только последние пара сезонов на сайте fbref.com.
Что касается процента отраженных ударов, эту метрику можно найти на том же fbref начиная с 1998 года.
Можно придумать еще две shot-stopping метрики, о которых Том не упоминает:
saved shots per 90 - среднее число отраженных ударов за матч
pre-shot goals prevented - почти что то же самое что и "post-shot goals preventd", но вместо PSxG можно использовать xGoT (expected goals on target). Почему xGoT - просто потому что на understat.com можно найти эту метрику в открытом доступе за последние 5 сезонов.
Цель нашего исследования в том, чтобы оценить насколько далеки(близки?) 3 альтернативные метрики оценки перформанса вратарей по сравнению с "эталонной".
Для оценки "близости" метрик мы будем расчитывать коэфициент корелляции между "post-shot goals prevented" и остальными для одной и той же выбрки вртарей (топ 5 лиг, минимум 10 матчей, сезон 2018-2019)
Словарь терминов
xGoT (expected goals on target) - ожидаемые голы (pre-shot) среди ударов в створ, все удары мимо отфильтрованы, не учитывается куда именно наравлен удар, по центру или в угол.
PSxG (post-shot expected goals) - ожидаемые голы (post-shot). Вероятность забить гол с учетом того в какую зону ворот был нанесен удар, берутся только удары вствор.
post-shot goals prevented - разница между PSxG и пропущенными голами. Это "эталонная" метрика Тома Ворвилла.
pre-shot goals prevented - разница между xGoT и пропущенными голами. Альтернативная метрика, более распространенная в публичном доступе.
save percentage = ("удары в створ" - "пропущенные голы") / "удары в створ"
коэфициент корелляции (correlation coefficient) - метрика, показывающая насколько два параметра коррелируют между собой для одной и той же выборки. чем ближе к единице - тем выше корреляция.
Post shot goals prevented
Давайте для начала рассмотрим топ лидеров сезона 2018-2019 по "post-shot goals prevented" (эталон).
Миранте, Бенитез и Мерет - топ 3 вратаря прошлого сезона (в этом утверждении не учитывается игра ногами, только способности отражать сложные удары).
Начинаем сравнивать с другими метриками.
Число отраженных ударов за матч
На графике ниже по оси X - "post-shot goals prevented", по Y - число отраженных ударов за матч, также добавлена линия тренда.
Как вы видите, линия тренда почти горизонтальная, коэфициент корелляции составляет 0.14. Это означает, что "среднее количество отраженных ударов за матч" является вредной метрикой для оценки способности вратарей, она лишь показывает насколько "заняты" голкиперы в среднем по сезону, эту метрику использовать не стоит.
Это была разминка. Продолжаем.
Процент отраженных ударов за матч
Это та самя метрика, которую Том Ворвилл не рекоммендует использовать.
По оси X - "post shot goals prevented", по Y - процент отраженных ударов за матч. Выборка та же - все вратари топ 5 лиг, проведшие более 10 матчей за сезон.
Уже лучше, линия тренда почти 45 градусов, коэфициент корелляции 0.75. На графике появляются Антонио Миранте, Алекс Мерета и Вальтер Бенитез. Все, кого мы ожидаем увидеть. Метрики неплохо коррелируют.
Есть также точки весьма далекие от линии тренда, их немного, и надо рассматривать отдельно, что послужило причиной того, например, почему Людовик Бутелле находится очень низко по проценту отраженных ударов в створ, но примерно в середине по "goals prevented".
Pre-shot goals prevented
Теперь по оси Y - "pre-shot goals prevented", по оси X - все та же "post-shot goals prevented". Тут нужно сделать замечание, что данные по осям взты из разных источников, по Y - understat, по X - fbref. Искажение может быть выше чем в предыдущих примерах.
Коэфициент корреляции Пирсена тут равен 0.69, что немного ниже чем у "процента отраженных ударов", но все же достаточно высоко, чтобы брать эту метрику в расчет.
Интересно сравнить разброс точек расположенных выше и ниже линии тренда. Разброс не одинаковый. Точки ниже, сгруппированы хуже. Это може означать, что метрика по оси Y тем лучше коррелирует с "эталонной", чем выше точки относительно линии тренда (то есть чем лучше результат голкипера).
Итоги
Количество отраженных ударов за матч - вредная метрика.
Мы не оспариваем Тома Ворвилла, действительно "post-shot goals prevented" наиболее точная сейчас модель для оценки shot-stopping ability вратарей.
Если нет данных PSxG, то допускается использовать "процент отраженных ударов в створ" или "pre-shot goals prevented"
Использованы данные fbref.com и understat.com
подписывайтесь на twitter @ru_stats
---
Возможно. Но, в таком случае, необходимо учитывать дистанцию и направление ударов. Например, я, за редким исключением, смотрю все матчи "Эвертона" и даже без какой-либо статистики считаю Пикфорда вратарем ниже среднего уровня. Ему много залетает, как под копирку, ударом головой +/- с линии вратарской после кроссов и розыгрыша стандартов, а также удары низом, в том числе и в ближний угол со средней и дальней дистанции. И, допустим, при прямом сравнении Пикфорда с Райаном последний смотрится намного выгоднее, поскольку оборона "Брайтона" часто дает сбои и ему приходится отражать удары, которые наносятся в основном из пределов штрафной, плюс он банально лучше играет на выходах