3 мин.

«Чужие здесь не ходят». Попытка придумать метрику xG для вратарей

То, что вратари - единственное амплуа игроков в футбол, где в РПЛ играют только русскоязычные игроки, подсказало первую часть названия статьи. Вторая же половина обусловлена ставшей основной за последний год темой блога - продвинутой статистикой. Дело в том, что большинство статистических исследований в футболе посвящены анализу атаки, а игру в защите рассматривают только через результат атак соперников: пресловутые xGA (ожидаемые голы соперников). Так что единственный показатель для оценки игры голкипера по метрикам xG - это разница между ожидаемыми (xGA) и реально пропущенными голами (GA). Он достаточно информативен, но сильно зависит от общего уровня соперничающих команд, особенно если в Лиге (как в РПЛ) есть большой разрыв в классе игроков. А основной «классический» показатель игры вратарей - процент отраженных ударов - никак не учитывает сложность ударов. Отсюда бесконечные споры о персоналиях вратарей РПЛ, возникающие из-за скудности критериев оценки. Внимание же к теме понятно с точки зрения вклада в развитие вратарской школы вратарей из СССР и России, поскольку даже награда от ФИФА названа в честь Льва Яшина.

Составим таблицу из известных данных, касающихся игры голкиперов, разделив внутри клубов показатели разных вратарей. Помимо количества игр, в таблицу внесено количество ударов (Shots) и пропущенные голы (GA). По ним рассчитан процент отбитых ударов. Из продвинутой статистики UnderStat.com взяты ожидаемые голы, созданные соперниками (xGA), а также разница между ними и реально пропущенными мячами (xGA-GA). Этот столбец таблицы «расцвечен» в зеленый (если пропустили меньше, чем создал соперник) и красный (если больше) цвета. Желтым выделены вратари, сыгравшие 2 и меньше игр. Их показатели зачастую очень примечательны, но из-за малой выборки (меньше 15%) не очень надежны и в дальнейших расчетах учтены не будут.

Полученная таблица отражает сложность оценки уровня вратаря только известными показателями. И даже продвинутая статистика не помогает: при одинаковых «зеленых цифрах», определить кто лучше скажем из тройки Гудиев - Кокорев - Песьяков тяжело, поскольку имеется ряд факторов, не учитываемых при расчете. Например то, что количество ударов по их воротам различается в разы, также как и созданная соперником острота. При том, что корреляция основных показателей (% отбитых ударов и «убитых» голов) прослеживается: чем больше «зеленая» цифра, тем и процент выше. На мой взгляд это происходит потому, что показатель отбитых ударов никак не учитывает опасность отраженных ударов. Как его учесть? На мой непросвещенный взгляд может помочь процент опасности удара, равный отношению созданных соперником ожидаемых голов к общему числу ударов (xGA/shots). В физическом смысле он означает сколько опасности в среднем несет каждый удар по воротам. Он позволяет нивелировать разницу в количестве ударов и их опасности для разных вратарей. Полученные результаты приведены в нижеприведенной таблице в столбце, где зеленым и красным цветом «подсвечены» по 2 самых опасных и легких «судеб вратарей» в нынешнем сезоне. Но при определенной информативности процента опасности удара, его надо применять вместе с другими характеристиками, чтобы понять насколько качественно играл вратарь. Например удручающий % отбитых ударов Беленова станет понятен, если посмотреть на % опасности этих ударов. И наоборот, скажем Лещук имеет один из лучших % отбитых ударов, но их опасность невелика.

Поэтому возникла идея получить универсальный показатель для оценки надежности вратарей. Для этого вспомним, что с точки зрения статистики, да и вообще здравого смысла, любой удар по воротам заканчивается либо голом, либо «сейвом» вратаря. Значит сумма двух рассчитанных нами величин (отбитых ударов и «опасности удара») должна равняться 1, или в процентном выражении - 100 %. Но только если вратарь пропускает столько ударов, сколько должен по xGА, что соответствует среднему по РПЛ уровню игры. Результаты расчета приведены ниже.

Полученные результаты позволяют на наш взгляд оценить в полной мере все аспекты игры вратарей и крайне удобны в интерпретации: все, у кого «надежность» больше 1 - хорошо играют, кто меньше - ненадежны. А Латышонок, который имеет 1,1 - вообще абсолютно лучший вратарь по сезону. Для наглядности результаты объединены по цветам.