WhoScored: на сколько можно полагаться на данные индивидуальных статистических данных?
Перевод статьи болельщика Ньюкасла Дэна Алтмана (PhD, профессор, автор экономических заметок для The Economist, The New York Times, The International Herald Tribune).
Ссылка на оригинал статьи и личный сайт автора.
Большинство инструментов для оценки исполнительного мастерства игроков в футболе зависит от количества пасов, ударов, отборов и т.п. Но у этих традиционных показателей есть 3 больших недостатка:
они не всегда трансформируются в пользу для команды, таких как очки и разница в забитых голах;
по ним очень сложно определить влияние всех игроков на результат, осязаемый и нет;
они не учитывают взаимодействие игроков на поле.
Вектор (или показатель) Шепли из экономики решает все эти проблемы. Придуманный обладателем Нобелевской Премии (как раз за этот показатель) экономистом и математиком Ллойдом Шепли, вектор Шепли придуман, что бы выявить вклад каждого участника коллективного действа. В экономике это часто используется , что бы оценить производительност труда людей, работающих в группе.
По существу, что бы использовать формулу Шепли нужно немного воображения. Представьте, что Вы собираете команду, постоянно добавляя в нее нового учатника во всевозможных последовательностях. Каждый раз, добавленный игрок привносит в команду, какой-то осязаемый эффект, который сказывается на результате. Путем вывода среднего значения от всех добавленний отдельного игрока в команду, выявляем его общий эффект на результаты команды. Например, если при каждом добавлении данный игрок существенно влияет на результат, независимо, когда он вступил в игру, значит он очень важный игрок для команды.
Например: Арсенал 5 раз подряд играл в ничью к 70 минуте игры, потом в игру вступал Озил (и никого больше) и команда выигрывала, логичный вывод, что Озил просто мегаполезен для команды, а игрок который уходил с поля абсолютно бесполезен* (прим. перев.)
Если вычислять Вектор Шепли для всех 11 игроков стартового состава, это потребует громадного количества повторений - около 40 млн. что бы определить показатели всех игроков - и может занять недели неотрывной работы, что бы вычислить показатели всего одного сезона. Более приемлемый способ вычислить Показатель Шепли это разделить всех игроков на линии - защиту и нападение.
Я болею за Ньюкасл Юнайтед, поэтому я использую игроков этой команды, что бы впервые вычислить Показатель Шепли в футболе. Я изучил все результаты Ньюкасла в сезоне 12-13, разделив игроков в следующем порядке: группа защиты - вратарь + 4 игрока защитной линии, остальные шесть игроков на поле (за исключением тех, кто получал красную карточку) - группа нападения.
Что бы вычислить Показатель Шепли, осталось всего лишь определить как долго каждый из одиннадцати игроков основного состава играл на поле в течение сезона и разницу в голов в это время. Эти данные более чем доступны на просторах интернета, что является еще одной отличительной чертой от иных сложных индивидуальных статистических данных, так часто используемых.
Для каждого отдельного игрока, Показатель Шепли это его ожидаемый вклад в разницу голов в среднем за минуту. Для такой команды, как Ньюкасл в сезоне 12-13, имеющей отрицательную разницу голов, вполне ожидаемо, что мы будем иметь соответственно отрицательный Показатель Шепли. Большинство игроков должны быть ответственны за плохой результат, однако, тем не менее некоторые будут на верху.
Как и любые показатели в футболе, Вектор Шепли иногда зависит от удачи на поле. Игрок, находившийся на поле в то время, когда один из членов команды совершил ужасную ошибку, логично разделит ответственность за общий плохой результат команды и получит отризательный эффект в своем Показателе Шепли. В тоже время, если игрок находился во время успеха команды, соответственно получит дополнительные балы к своему Показтелю. Однако, эти эффекты в большей мере сглаживаются для игроков, которые провели большинство матчей сезона, когда ты используешь в своих расчетах весь длинный сезон.
Группа защиты: В сезоне 12-13 Ньюкасл использовал 42 различных комбинации игроков в защите. Ниже Показатели Шепли игроков, которые в общем за сезон провели как миниимум 2 полных матча в сезоне.
Тим Крул был самым полезным вратарем. Основываясь на полученных результатах можно сделать вывод, что если бы вместо Тима Крула играл Роб Эллиот, то команда пропускала бы на 0,5 гола больше за матч, что составило бы на 9,5 голов больше за весь сезон.
Джеймс Перч был лучшим защитником, хотя он также играл и в полузащите, за ним идет Фабрицио Коллочини - капитан. Худшими в этой линии были 2 январских подписания, Мапу Янга-Мбива и Массадио Хайдара. Однако, не все подписания были плохими - Матье Дебюши третий лучший защитник.
Группа нападения: Ниже результаты игроков нападения, которые провели как минимум 2 полных матча в сезоне 12-13 за Ньюкасл.
Гаэль Бигиринама самый недооцененный игрок, его показатель по отношению ко многим одноклубникам, значительно занизило всего 413 минут проведенных на поле. Он, а также другие другие креативщики Ньюкасла в лице Сильвана Марво, Йоана Гуфрана и Хатема бен Арфа были самыми продуктивными игроками. Демба Ба, проданный в Челси постредине сезона, был не самым полезным игроком группы нападения, но все же лучше Паписса Сиссе, оставшегосы в команде нападающего. Центральные полузащитники: Вурнон Анита, Йоан Кабай, Шейк Тиоте и Перч - были не самыми полезными игроками, а Перч был значительно полезней, когда играл в защите.
Вывод: Как я писал в моей предыдущей статье, идеальный измеритель обязан позволять делать выводы, позволять делать прогнозы продуктивности команды при добавлении к ней показателей каждого последующего игрока. Показатель Шепли требует осторожности при ее использовании, как и любой показатель полезности игрока в футболе. (вы не можете полностью на него полагаться** - прим. перевод.) Любые показатели основываются на показателях игроков, показанняых в их предыдущей команде, поэтому использование игроков, которые никогда не играли вместе, может привести к самым неожиданным последствиям: разрушение стиля, совпадение позиций и т.п.
Один способ обойти все это - вычислять Вектор Шепли для всей команды, а не для отдельного игрока. Аналогично тому, как высчитываются плюсы-минусы для всей линии нападения в хоккее. В футболе, мы можем посчитать Показатель Шепли для пары центральных защитников или для основной пары нападающих и атакующих полузащитников. Однако, мы всегда можем потерять важные данные о взаимоотношениях между игроками.
Сравнение с существующими измерителями полезности футболистов: Вектор Шепли знает, как трансформировать действия футболистов на поле в разницу голов, что является основной разницей от широко используемых индивидуальных статистических показателей футболистов. Ниже сравнительная таблица Показателей Шепли (по убыванию и позиции на поле) и инвидуальных статистических показателей футболистов Ньюкасла с сайта WhoScored.com по итогам сезона 12-13.
Мы видим совсем незначительную кореляцию (всего лишь около 0,3) между двумя показателями, предположительно из-за того, что Вектор Шепли учитывает факторы, которые никак не учитывают статистики из WhoScored.com
Впервые я посчитал Показатели Шепли несколько месяцев назад, с тех пор они безусловно повлияли на мое мнение о Ньюксле. Я был бы рад продаже Кабайя летом за хорошую цену. После начала сезона, я ужасался мысли увидеть вместе на поле Янга-Мбива и Сиссоко. Однако, я также радовался игрой Гуфрана, Марво и бен Арфа в последние недели. Сейчас, если мы дадим немного времени Бигиринама...