2004-07 - был ли коллапс? Насколько велик Федерер? Разрушаем мифы рейтингом Эло!
Введение
Ровно два года назад вышло сенсационное исследование, основной целью которого было получение ответов на три вопроса, волнующих любителей тенниса:
1. 2003-07: коллапс или обычная / сильная эпоха?
2. Действительно ли на харде и траве уровень игры Федерера образца 2004-07 годов (+ Уимблдон-2003) выше, чем у любого другого теннисиста любого времени?
3. Федерер – король тенниса или Король халявы?
(Суть последнего вопроса заключается в определении сложности сеток швейцарца на его победных турнирах «Большого шлема»).
В качестве методологии было выбрано использование рейтинга Эло, данные которого можно найти на сайте ultimatetennisstatistics.com, вкладка Set Elo Rating. В тексте той работы даны ответы не только на поставленные выше вопросы, но и несколько бонусных, опубликованных в одноимённом разделе.
Упомянутая статья вызвала огромный резонанс среди русскоязычного теннисного сообщества, собрав 395 комментариев и 121 оценку только на том ресурсе, где была опубликована. Однако с тех пор много воды утекло. Во-первых, было проведено ещё 7 турниров «Большого шлема», не вошедших в исходный анализ, во-вторых, сами методики пересмотрены и усовершенствованы.
Изложенные в данном исследовании материалы дополняют и обновляют данные предыдущей статьи, однако основная идея и бОльшая часть информации аналогичны. В связи с вышесказанным, здесь будут приведены только разделы, существенно отличающиеся от исходных. Для полного понимания данной темы настоятельно рекомендуется ознакомление с первой статьёй, за исключением переписанных разделов.
Разумеется, если у читателей останутся определённые вопросы или непонимание после ознакомления с представленными материалами, то их можно задать в комментариях к этой статье. Там же автор статьи призывает сообщать об ошибках в расчётах в случае, если таковые обнаружатся: все материалы этого исследования находятся в открытом доступе, в связи с чем каждый имеет возможность проверить их истинность.
Исходные данные и доказательства коллапса
Как говорилось выше, основным инструментом в данном исследовании является рейтинг Эло. В исходной статье подробно рассказано про рейтинг Эло, в том числе описана его суть, обоснована необходимость выбора данной методики и рассмотрены правила её использования.
Для того, чтобы получить ответ на первый из трёх главных вопросов исследования, необходимо рассмотреть рейтинги полуфиналистов ТБШ, а также рейтинги по итогам года игроков 2003-07 годов и 2011-16 годов, и затем провести сравнительный анализ. Данная работа проделана в исходной статье, поэтому мы повторяться не будем – методика не изменилась, выводы те же самые, включая признание теннисного периода 2011-16 годов «Золотой эпохой тенниса». Необходимо лишь учесть, что за прошедшие два года на сайте ultimatetennisstatistics.com, с которого берутся значения рейтинга Эло, произошли изменения, связанные с тем, что каждому теннисисту увеличили рейтинг на 20…25 пунктов. Это преобразование никак не влияет на суть исследования, поскольку в рейтинге Эло важны не абсолютные значения, а только разность между игроками, которая сохранена, но его необходимо учесть.
Прежде чем приступить к дальнейшему анализу, отметим, что почти все основные результаты исследования находятся в этом файле. В числе прочего, там указаны рейтинги Эло соперников Джоковича, Надаля и Федерера на ТБШ – эти данные взяты с уже упомянутого сайта. Единственное исключение сделано для Надаля на Уимблдонском турнире в 2006 и 2007 годах, поскольку его высокий рейтинг на тот момент был полностью обеспечен грунтом и не отражал реальную силу игры на травяном покрытии. В этом легко убедиться, посмотрев на график изменения его рейтинга Эло по сетам. В 2006 и 2007 годах это изменение шло по одинаковой схеме: стабильный значительный рост за 2 месяца грунтового сезона и стабильное значительное снижение за следующие 10 месяцев хардово-травяного сезона (исключением, подтверждающим правило, стал лишь скачок в ИУ-2007), причём в результате этого снижения, судя по всему, не было достигнуто реального значения рейтинга: прекращение снижения было обусловлено только началом нового грунтового сезона. (Данное свойство перестало выполняться в 2008 году – Надаль научился играть на траве, поэтому к концу травяного сезона его рейтинг не только не упал по сравнению с окончанием грунтового сезона, но и, напротив, даже вырос). Поэтому для большей достоверности рейтинга испанца на Уимблдоне в 2006-07 годах был взят как среднее арифметическое его рейтингов перед началом грунтового сезона и перед началом следующего грунтового сезона.
Переходим к ответам на второй и третий вопросы.
Performance Rating как показатель силы игры
В первой статье для определения уровня выступления игрока на конкретном турнире введён такой показатель, как Performance Rating. Методика его вычисления была позаимствована из шахмат: каждая сыгранная партия получает показатель, равный рейтингу соперника, если игра завершилась вничью, рейтингу противника + 400, если игрок одержал победу, и рейтинг оппонента – 400, если выиграл соперник. После этого PR игрока на турнире брался как средний показатель всех его партий, начиная с четвертьфинала (поскольку именно на решающих стадиях топ-теннисисты начинают играть в полную силу).
Несмотря на то, что данная методика проста и опробована на практике, многие читатели столкнулись с непониманием, почему взято именно число 400 в качестве определения показателей партий. Кроме того, есть ещё один важный нюанс, на который мало кто обратил внимание: в отличие от шахмат с их тремя возможными вариантами счёта партии (1-0, 0-1 или ½ - ½), в теннисе таких вариантов 12, а если же учитывать и счёт тай-брейка, то данное число становится ещё больше. Стало быть, при определении PR’-а по прежней методике разницы между победами 6-0, 6-2, 6-1 и 7-5, 7-5, 7-5 не было никакой, хотя очевидно, что при прочих равных условиях уровень игры победителя этих матчей существенно отличается. Более того, прежняя методика не учитывает счёт и результат тай-брейка – как за выигрыш 7:0, так и за проигрыш 0:7 показатель партии будет равен рейтингу соперника, что, понятное дело, не очень хорошо.
Таким образом, было решено учесть здравый смысл и пожелания читателей и воспользоваться более логичной методикой расчёта Performance’-а. Общая идея такова: определить уровень игры (выраженный рейтингом Эло), теннисист с которым показал бы (по матожиданию) точно такой результат на решающих стадиях, как и игрок, чей PR необходимо рассчитать. Тогда Performance Rating данного игрока равен рейтингу Эло такого теннисиста.
Говоря более формально, рассмотрим все полные партии данного игрока, начиная с четвертьфинала, и в зависимости от результата и счёта каждой определим количество очков, которые он заработал. При этом сумма очков, которые получают победитель и проигравший в партии, всегда равна 1, а чем увереннее победа, тем больше очков даётся. Распределение очков в зависимости от счёта партии приведено в таблице 1 (обоснование – здесь).
Далее, просуммировав очки за все партии, получим результат теннисиста – пусть он равен k очков. Используя основную формулу рейтинга Эло, для любого рейтинга X можно определить, чему будет равно матожидание игрока с этим рейтингом против таких же соперников при таком же числе партий. Тогда PR будет равен такому числу Q, что матожидание игрока с рейтингом Эло Q будет в точности равно k (существование и единственность такого числа следует из монотонности и непрерывности функции E).
Проиллюстрируем данную методику определением уровня игры Федерера во Франции-2009. Начиная с четвертьфинала, швейцарец сыграл 11 партий:
- 3 партии с Монфисом (рейтинг Эло 1968): 7-6(6), 6-2, 6-4, то есть 0,54 + 1 + 0,9 = 2,44 очка.
- 5 партий с дель Потро (2063): 3-6 (-2), 7-6(2) (+3), 2-6, 6-1, 6-4, то есть 0 + 0,6 + 0 + 1 + 0,9 = 2,5 очков.
- 3 партии с Содерлингом (1921): 6-1, 7-6(1), 6-4, то есть 1 + 0,6 + 0,9 = 2,5 очка.
Таким образом, за 11 партий швейцарец набрал 7,44 очка. По формуле (*) можно определить, что ожидаемое количество набранных очков теннисиста с рейтингом Q = 2130,28 равно:
- 2,1538 за 3 партии против 1968;
- 2,9782 за 5 партий против 2063;
- 2,3081 за 3 партии с 1921.
Итого 7,44 очка, то есть ожидаемое количество очков игрока с рейтингом 2130,28 против данных соперников равно фактически набранному Федерером. Поэтому, округлив до целых, получаем, что его Performance Rating во Франции-2009 равен 2130.
Performance Rating’-и Джоковича, Надаля и Федерера на всех победных ТБШ рассчитаны в этом файле и приведены в таблице 1 (жирным обозначено медианное значение).
Таблица 1. Performance Rating на титульных ТБШ
Итак, мы доказали, что на победных ТБШ швейцарец показывал в среднем значительно более низкий уровень игры (2221 по среднему арифметическому и 2213…2225 по медианному), чем Джокович (2329 и 2314 соответственно) и Надаль (2358 / 2340...2343). Для наглядности определим, сколько процентов матчей Федерер выигрывал бы против каждого из этих оппонентов: а) в средней форме по титульным ТБШ; б) в средней форме 2004-07 годов. Расчёты проведены на вкладке "Средняя вероятность победы" файла Crvena_Zvezda: каждый из турниров Федерера сравнивается с каждым из турниров Джоковича / Надаля для определения вероятности победы, а затем берётся среднее значение.
Таблица 2. Средние вероятности победы Федерера против Джодаля на ТБШ
Стало быть, гипотеза о том, что на харде и траве уровень игры Федерера образца 2004-07 годов выше, чем у любого другого теннисиста любого времени, опровергнута: Федерер выигрывает лишь около 30% матчей у Джоковича образца 2011-16 годов и 15% – у Надаля. При сравнении среднего уровня игры на победных ТБШ по всей карьере получаем, что швейцарец побеждал бы Новака один раз из трёх, а Рафаэля – один раз из четырёх. Итак, Федерер образца 2004-07 годов не только не непобедим, но и не самый сильный теннисист в XXI веке, не говоря уж про историю.
В заключение этого раздела рассмотрим последний миф - о "пиковости" швейцарца в 2004-07 годы. Для этого сравним силу игры Федерера в 2004-07 и 2011-15 годах, рассмотрев его PR'-ы на всех ТБШ, где он дошёл до финала, и добавив Открытый чемпионат Австралии 2009 года.
Таблица 3. Performance Rating Федерера на отдельных "тарелочных" ТБШ
Как было показано в первой статье, Performance Rating на ТБШ, в которых теннисист проиграл в финале, занижен относительно PR'-а на "титульных" ТБШ примерно на 70-80 пунктов. Из этого следует, что сила игры Роджера на Открытом чемпионате Австралии-2009, Уимблдонском турнире 2012 и 2015 годов и Открытом чемпионате США-2015 превосходит его уровень на любом ТБШ слабой эры 2004-07, а Франция-2011 и Уимблдон-2014 уступают лишь 1 (Уимблдон-2006), и 3 (+ США-2007, Уимблдон-2005) из 14 "мэйджоров" с наградами соответственно. Полученное утверждение завершает доказательство, что в 2011-15 годах (+ Австралия-2009) Федерер являлся более сильным игроком, чем в "эпоху коллапса".
Расчёт сложности сеток
Основная идея определения сложности сеток сохранена: они определяются параметром, равным вероятности «среднего» победителя ТБШ (то есть обладателя среднего PR’-а на «мэйджорах» с Уимблдона-2003 по настоящее время) выиграть титул – чем выше этот параметр, тем проще сетка. Однако, как показала публикация прошлой статьи, использование данного параметра приводит к ошибочному пониманию среди читателей: многие истолковывают x% для определённого ТБШ не как параметр сложности сетки, а как априорную вероятность для победителя выиграть титул. Для того, чтобы избежать подобных ошибок, было решено измерять сложность сетки неотрицательным коэффициентом: чем он больше, тем сложнее сетка. С этой целью необходимо ввести функцию y = f (x), отображающую вероятностный параметр x на коэффициент сложности y. В качестве такой функции выбрана f (x) = 7/3 (1/x – 1).
В таблице 4 приведены сложности сеток Джоковича, Надаля и Федерера, рассчитанные в этом файле (жирным выделена медианная сложность сетки, т. е. такой, что половина сеток сложнее, половина – проще):
Таблица 4. Сложность победных ТБШ
Итак, как видно из таблицы, самые сложные сетки на титульных ТБШ у Джоковича (средняя сложность 1,55, медианная – 1,68), а самые простые – у Федерера (0,55 средней сложности и 0,4…0,45 – медианной). Теперь посмотрим распределение процента сеток в зависимости от сложности, пользуясь следующими интервалами: 0,76…1,24 – средние; 1,25…1,99 – сложные; 0,4…0,75 – простые; меньше 0,4 – очень простые; 2 и больше – очень сложные. Результаты приведены в таблице 5.
Таблица 5. Количественное распределение сеток титульных ТБШ по сложности
85% сеток Федерера – 17 из 20 – имеют уровень ниже среднего, при этом у него нет ни одной очень сложной сетки. Напротив, половина победных сеток Надаля и почти 60% сеток Джоковича – (очень) сложные. Стало быть, факт того, что Федерер – король халявы, официально доказан. Теперь остаётся определить, насколько помогли ему простые сетки.
Расчёт ожидаемого количества наград
В исходной статье для решения данной задачи была произведена классификация по уровням сложности всех сеток на ТБШ для заданного теннисиста, где он имел шансы на титул (то есть не был травмирован и входил в число топ-теннисистов). Далее, для каждого из 5 видов сеток был определён процент их реализации (отношение числа титулов по данному виду сеток к их общему числу). Наконец, чтобы определить ожидаемое количество титулов теннисиста A по сеткам теннисиста B, достаточно для каждого вида сеток перемножить количество сеток B на процент реализации теннисистом A, а затем полученные 5 значений сложить.
Данный метод прост и изящен, однако критиками была справедливо указано, что при определении "процента реализации", в числе прочего, учитываются несыгранные (потенциальные) матчи теннисиста: например, если он не реализовал сетку, вылетев во втором круге, то данная сетка будет классифицирована в зависимости от силы дальнейших соперников – тех, с кем этот теннисист не сыграл. Кроме того, у данной методики есть ещё один недостаток, незамеченный комментаторами – отсутствие раздельного рассмотрения сеток ТБШ в зависимости от покрытий.
В связи с вышесказанным было принято решение усовершенствовать метод расчёта ожидаемого количества титулов таким образом, чтобы: а) для каждого покрытия расчёт происходил отдельно; б) в расчёт шли только реально сыгранные матчи. Далее опишем суть новой разработанной методики для определения ожидаемого количества титулов A по сеткам B на отдельно взятом ТБШ и проиллюстрируем её Федерером (A) по сеткам Надаля (B) на French Open.
1. Рассмотрим турниры на данном ТБШ, в которых A был топ-игроком и имел априорные шансы на награды. В нашем примере это Открытый чемпионат Франции 2002-15 и 2019 годов для Федерера.
2. Распределим все полные матчи A на этих турнирах по уровню сложности соперников, в зависимости от их рейтинга Эло: очень простые (1799 и меньше), простое (1800 – 1899), средне-слабые (1900 – 1999), средне-сильные (2000 – 2099), сильные (2100 – 2199), очень сильные (2200 и выше). После этого определим количество выигранных и проигранных партий против каждого из этих шести диапазонов. В нашем примере с Федерером выигранные и проигранные сеты указаны в таблице на рис. 1.
Рис. 1. Показатели Федерера на French Open
3. Определяем вероятность выигрыша партии x против каждого диапазона через отношение числа выигранных сетов к общему числу проведённых сетов (столбец 4 таблицы). Далее по формуле определяем среднюю вероятность выигрыша матча (столбец 5).
4. Рассматриваем все турниры на данном ТБШ для теннисиста B, в которых он был топ-игроком и не был травмирован (в нашем примере это Открытый чемпионат Франции 2005-15, '17-'19 годов для Надаля). Далее, для каждого из турниров определяем вероятность игрока A выиграть титул как произведение всех семи вероятностей выиграть каждый отдельный матч (при этом если соперник снялся, то вероятность победы над ним равна 1). Вероятность победы в матче зависит только от рейтинга оппонента и найдена в п. 3.
Например, на рис. 2 показана вероятность Федерера выиграть Францию-2010 по сетке Надаля.
Рис. 2. Шансы Федерера по сетке Надаля
5. Наконец, для получения окончательного результата просто суммируем все полученные значения (рис. 3).
Рис. 3. Матожидание титулов Федерера на French Open по сеткам Надаля
Итак, мы описали алгоритм для определения ожидаемого числа титулов теннисиста A по сеткам B. Аналогично определяется и ожидаемое число финалов, только в п. 4 вероятность финала определяется перемножением 6 чисел – всех, кроме вероятности выиграть финал.
Теперь приведём результаты расчётов ожидаемого количества титулов и финалов ТБШ Джоковича, Надаля и Федерера по сеткам друг друга. Для наглядности по сеткам швейцарца также приведены результаты Энди Маррея, у которого 3 кубка и 8 тарелок на «мэйджорах».
Таблица 6. Матожидание Джоковича, Надаля, Маррея по сеткам Федерера (титулы / финалы)
Таблица 7. Матожидание Джоковича и Федерера, по сеткам Надаля (титулы / финалы)
Таблица 8. Матожидание Надаля и Федерера по сеткам Джоковича (титулы / финалы)
Из данных таблиц видно, при равных по сложности сетках швейцарец по ожидаемому числу титулов находится ближе к Маррею, чем к Джоковичу или Надалю. Таким образом, получен исчерпывающий ответ на третий вопрос: Федерер действительно получал намного более простые сетки на ТБШ, чем Рафоле, а при равенстве условий выиграл бы значительно меньше каждого из них.
Заключение
Все выводы первой статьи подтвердились и во второй: Федерер как теннисист действительно слабее Джоковича и Надаля, даже если рассматривать его уровень игры только в 2004-07 годах, который уступает его уровню в 2011-15; сам период 2004-07 годов является слабой эрой, в противоположность Золотой эпохе тенниса 2011-16; сетки Рафоле на ТБШ значительно превосходят по сложности сетки Роджера. Кроме того, как следует из таблицы 4, US Open-2017 не является самым простым ТБШ в истории с точки зрения сетки победителя – его сложность равна 0,19, а два "мэйджора" швейцарца имеют меньшую сложность: Австралия-2006 (0,16) и Уимблдон-2003 (0,14).
Таким образом, подводя итоги нашему исследованию, можно сделать вывод, что Роджер Федерер – отличный теннисист, но значительно более слабый, чем оптимальные Джокович и Надаль. Преимущество Федерера по титулам ТБШ, неделям на первой строчке и т. д., а также его многочисленные рекорды обусловлены лишь тем, что он минимум 5 лет играл в эпоху коллапса, а серб с испанцем значительную часть карьеры провели в Золотой Эре тенниса.
Если посмотреть победителей БШ в нулевых и десятых, то и без глубокой аналитики всё ясно - в 04-07 из конкурентов был лишь Надаль, который в те годы умел играть только на грунте, но к 08 прокачался и на быстрых, а с 11 в полную силу заиграл Джок.
Основной "титульный" задел Федя сформировал во времена, когда вне грунта не было соперников уровня Надаля 08+ и Джоковича 11+
То что Федя уступает пиковым Рафанолям и Джодалям - капитан очевидность: по личкам у Феди с ними в десятых баланс заметно отрицательный по сумме всех турниров и просто катастрофический, если брать только ТБШ.
Правда, величие Роджера всё это ничуть не умаляет, ибо брать БШ в 36, играть в финале в 37 и заканчивать сезон третьей ракеткой в 38 - это в любом случае что-то невероятное. Мы еще посмотрим, где будут Рафаноли и Джодали в этом возрасте.
https://ultimatetennisstatistics.com/goatList
и хватит пиарить свои полотна в каждой записи
А если вы не хотите, чтобы ваши тексты, посты и действия критиковали и комментировали, не стоит выносить их в интернет на публичные сайты. Зачитывайте их друзьям. Они будут с вами во всём соглашаться и всё говорить, как вам нравится.
Автору респект!