Теннисная статистика
Заметка достаточно "сухая", Вы - герой, если смогли прочитать всё. Тут нет никаких художеств, речь только о циферках.
Мысль об этой заметке появилась, когда я пытался по статам понять, в чем причина итога матча, где манеру и уровень двух игроков я представлял себе крайне смутно. В итоге поняв, что нифига не понимаю, я пуще прежнего (подобные мысли не раз возникали, но быстро исчезали) задумался о том, что нынешняя статистика - ни о чем. Не всё, конечно, но в большинстве своем это набор цифр.
При этом я смутно помнил, что что-то читал на эту тему у пользователя Алекс_лис и после непродолжительных поисков нашел его заметку на эту тему. Собственно, много мыслей совпадает, но кое-что хочется расписать детальнее, а что-то дополнить.
Давайте сначала глянем, что нам по пунктам дает live score, как вообще стоит, на мой взгляд, интерпретировать те показатели, которые он дает, в чем их ограниченность и в конце концов предложения (мысли вслух) о улучшениях, которые бы четче объясняли картину происходящего.
Эйсы. Тут всё просто, хорошая штука. Совсем неплохо знать, сколько подач навылет сделал игрок. При этом в обычных live score, к сожалению, нет показателя, который идет сразу после "эйсов" на турнирах "Большого Шлема" и в Кубках Дэвиса и Федераций - показатель подач, которые соперник не смог вернуть в корт, хотя при этом дотронулся ракеткой до мяча на приеме.
На мой взгляд, между эйсами и такими подачами, которые не вернули в корт, принципиальной разницы нет в принципе. А очень часто бывает, что игрок сделал 5-7 эйсов (условно), но еще больше 20 его подач соперник не сыграл в корт. И по сути теннисист заработал гораздо больше "легких" очков благодаря подаче, чем дает обычный live score.
Это всё вроде и достаточно очевидно, но и опускать нельзя. Важно.
Двойные ошибки. Тоже хорошая штука, нужная. Тут всё понятно. Мне бы, правда, может и хотелось видеть показатель а-ля "двойные ошибки на брейк-поинтах", но это было бы слишком хорошо.)
Процент попадания первым мячом. Тоже, конечно, нужная вещь. Только совершенно бесполезная без одного дополнения - скорости средней первой подачи. Без максимальной можно и обойтись, ИМХО, а вот средняя крайне нужна.
Если Вы анализируете матч с участием игрока, которого Вы знаете - тогда еще ладно. А если нет? Вот не знает человек, что собой представляет Робредо, у которого не редко в матчах бывало и за 80% первым мячом. "Вот это крутой чудак" небось подумает.
Можно и с другой стороны на это глянуть - даже при анализе матча игрока, которого Вы знаете, низкая средняя скорость первой подачи Вам даст пищу к размышлениям. Возможно, у игрока были проблемы с плечом. Так не редко бывает, что игроки жертвуют силой подачи ради того, чтобы в принципе вводить мяч в игру с первой попытки и в какой-то мере так психологически давить на соперника, который ожидает сильную подачу (поскольку первая).
Так что сам по себе % первой подачи показывает крайне мало. Вам тогда придется самому исходить из предложения - подавал игрок, как всегда, или его что-то беспокоило или может он сознательно (будучи в полном порядке) сбросил скорость подачи, чтобы подавать острее по месту и т.д. и т.п.
Процент выигранных очков на первой и второй подаче. Тут уместно повторить ту же самую мысль, что и выше - нужна скорость средней второй подачи. Обязательно.
Имея процент попадания первым и вторым мячом и показатели выигранных очков на первой и второй подаче, Вы можете сами прикинуть, насколько для игрока важно подавать именно с первой попытки, т.е. эффективность первой подачи.
Простой пример - игрок мог подавать 50% первой подачи, но выиграть 100% очков на ней. А мог наоборот - подавать только первым мячом, но взять лишь половину очков. То есть, подать из десяти раз пять с первой попытки и выиграть все очки или подать все десять раз первым мячом и выиграть только пять очков. На выходе - и в том и в другом случае игрок выиграл пять очков на первой подаче, но есть ведь разница, правда?
ИМХО, и при таком анализе нужно учитывать среднюю скорость первой и второй подачи игрока. Ведь может быть так, что средняя скорость первой отличается сильно, а может быть, что и нет (сравнительно). Тогда выводы по степени зависимости от первой подачи будут разные, конечно.
Количествно отыгранных брейк-поинтов. Этот показатель, как и аналогичный по реализации едва ли не самый бесполезный в live score. Или точнее - он мало что показывает без некоторых дополнений. Объясню почему, хотя если Вы уже прочитали заметку Алекса_Лиса, то он там об этом обмолвился, хотя не стал расписывать.
Возьмем, например, такой показатель по количеству отыгранных брейк-поинтов - 5 из 6. И тут же упомянем реализацию - 2 из 9.
Что нам говорят первые цифры? Не больше, чем то, что игрок на протяжении матча отыграл 5 брейк-поинтов из 6. Понимаете к чему я клоню? Матча! То есть, он мог отыграть в одном гейме все пять штук, а один-единственный в каком-то другом сразу проиграть. А мог выиграть пять разных геймов, в которых у его соперника был брейк-поинт. Что совсем в другом свете тогда показывает уровень борьбы, возможные качели по ходу матча.
Аналогичное справедливо для реализации. 2 из 9, первая мысль - слабенько. Но если все эти брейк-поинты были в двух разных геймах и после отыгрыша нескольких соперником игрок все-таки взял его подачу? То получается, что свой шанс в гейме он все-таки не упустил, что и является самым важным - оно сделал брейк. Конечно, это заняло у него больше времени и сил, чем если бы он сделал его с первой попытки, но это произошло в том же игровом отрезке, в одном гейме.
ИМХО, вот это один из самых очевидных показателей, которые хотелось бы улучшить. Такой статистики просто нет. Я бы с удовольствием хотел иметь графу, например, геймы, где был отыгран брейк-поинт(ы). Звучит нескладно, но суть такая.
Количество геймов, сыгранных на подаче. Ну, это просто цифра. Мне вот от нее не холодно и не жарко. Можно и без того не сложно посчитать через количество брейков, сколько каждый игрок имел геймов на своей подаче. Для меня эта графа ни о чем, я на нее никогда не смотрю практически.
Количество очков, выигранных на приеме первой и второй подачи. Понятно, что это необходимо, но очень простая мысль - дайте "эйсы" на приеме. Игроки не редко принимают навылет вторую и даже первую подачу, хотя эйсов с подачи, конечно, в среднем гораздо больше. В принципе, если в этой графе будет "0" или какое-то маленькое число, то это не говорит о плохом уровне приема игрока. Возможно, он просто не рисковал на приеме. А вот условное "10" - это уже кое что. Конечно, одновременно нужно обращать внимание, кто стоит напротив и подает и какая у этого игрока средняя скорость подачи (может это Рохус, а совсем не Карлович), но тем не менее данные были бы полезными.
Я даже думаю, что совершенно отличной была бы графа прием, после которого не последовал ответ. Опять же - не звучное название, но понятна суть. По аналогии с подачами, которые игрок на приеме не смог вернуть в корт, но которые не попали в графу "эйсы", тут бы хотелось видеть количество хороших приемов игроков, которые так удачно вернули мяч в корт, что их соперник не смог ответить тем же.
Конечно, тут есть свои нюансы. Игрок мог еле отбить мяч, а подающий просто с хав-корта в простой позиции ошибся. Но точно так же при подаче - игрок мог подать очень простую вторую подачу, соперник на приеме забежал под сильную руку, чтобы пробить навылет, но промазал. ИМХО, и то и другое нужно включать в соответствующие графы наравне с отличными приемами и отличными подачами. Почему? Это не повлияет кардинально на общий показатель, допустимая погрешность. Мне так кажется в любом случае. Да и это лучше с той точки зрений, что будут "видны" все розыгрыши, где дело не дошло до 3+ ударов, не было обмена с задней линии.
Количество очков, выигранных на подаче, на приеме и общее количество выигранных очков. Хорошие показатели. Пусть в таком виде и остаются.)
В обычном live score больше ничего нет - еще время матча и история личных встреч игроков, но это не суть важно сейчас. Хотя раз уж вспомнил - ИМХО, хорошо бы иметь время каждого сета. А в идеале - среднее время, потраченное на один гейм и среднее количество розыгрышей в гейме. Потому что два часа, например, может продолжаться многогеймовый трехсетовый матч в Роттердаме, где розыгрыши быстрые, а может идти упорная бэйслайнеровская битва из двадцати геймов и двух сетов в условном Майами, где куда больше длинных розыгрышей. Мне кажется, это было бы показательно.
Сразу про "длинные розыгрыши" - конечно, нужна статистика по количеству розыгрышей до определенного количества ударов и после. Во время трансляций матчей иногда дают данные, кто сколько выиграл очков в розыгрышах от 3 до 7 ударов и >7 ударов. Очень хорошая штука, на мой взгляд. Это есть в новых live score на ТБШ, но больше нет нигде, по моему.
ИМХО, однозначно нужно каким-то образом усовершенствовать статистику, которая касается игры у сетки. Это ж полный брррр. Потому что, когда после матча показывают показатели по игре у сетки (6 выигранных очков при 10 попытках, пускай), то это не говорит совершенно ни о чем, кроме как о непосредственно выигранном количестве очков у сетки из общего числа выходов вперед. Тоже самое написал, знаю.) Но просто эту статистику, на мой взгляд, часто интерпретируют неправильно. К слову, мне очень интересно, как определяется "выход к сетке", я как-то пытался сам считать и у меня вышло совсем другое количество рейдов вперед, чем в статистике, но главное не это.
Очко можно выиграть у сетки по-разному. После подачи, на добивании после мощного удара с хав-корта или при рискованном выходе вперед к сетке после равного обмена ударов с задней линии. К чему клоню - высокий % в этой статистике не говорит о том, что игрок невероятно играл у сетки. И наоборот.
Когда Ллодра выигрывает 70% очков у сетки и когда это делает Надаль или Джокович - это, пардон, две большие разницы. Рафа любит идти на определенный риск при выоде к сетке после очень косого, выбивающего форхенда, когда его соперник просто теряет ориентацию и позицию на корте. Новак раньше часто шел вперед из неочевидного только после глубокого слайса в "девятку" корта. Так же любит делать Роддик, кстати. Но мы ведь не будем сравнивать такие выходы и выигранные очки после них с выходами и теннисом у сетки Ллодра. Точнее можно сравнивать только показатели, это конечно. Но вот то, что любят называть "уровнем игры у сетки" - это совсем о другом. В моем представлении хороший игрок у сетки умеет сыграть посланный ему мяч в ноги, обладает быстрой реакцией впереди и играет в корт обводящие удары, четок при исполнении смэшей и т.п. А высокий показатель игры у сетки показывает эффективность. Что существенно, важно, но это всё.
Правда, тут и предложить что-то внятное не могу. Мне кажется, что нельзя очертить такие критерии статистики, которые показывали бы превосходство не только числовое, но и качественное, что ли. Надеюсь, выразился понятно.
На закуску - виннеры и невынужденные ошибки. Начну с конца.
Насколько я знаю, в число НО не входит прием подачи, что на мой взгляд - полная глупость. Поскольку и так какой-то определенный человек включает степень вынужденности-невынужденности в ходе розыгрыша при ошибке, то не понимаю, почему он же не может делать того же на приеме подачи. Ведь часто игрок специально забегает под форхенд, чтобы сыграть навылет вторую подачу и бьет сильно мимо площадки. Это невынужденная ошибка? На мой взгляд, очень часто да.
Есть у меня еще такая мысль - я бы не стал включать в число невынужденных ошибок даже самые явные ляпы, если это случилось в розыгрыше, в ходе которого уже было сделано определенное количество ударов. Скажем, двадцать. Невынужденная ошибка невынужденной ошибке рознь. Очко, которое сразу без борьбы игрок отдал сопернику и когда он это сделал после многих хороших ударов, должно считаться по-разному. "Наевшийся", набегавшийся игрок может с места сыграть в глубокий аут, если у него сбилось дыхание после пробежек туда-назад, и это повлияло на его удар.
По виннерам. То, что должны быть удары навылет поделены на "с форхенда" и "с бекхенда" - очевидно. Сюда же отдельно к этим показателям, эйсам, "эйсам" на приеме еще бы очень хотелось видеть чисто выигранные очки у сетки.
Еще для понимания происходящего в матче нужны само собой вынужденные ошибки. И тут я бы предложил на первый взгляд, наверное, нешаблонное деление - ВО после мощных ударов, ВО после ударов с сильным вращением (любым) и другое. Конечно, определение к той или иной категории - полностью человеческий фактор. Но само по себе количество вынужденных ошибок не дает понимания, почему игрок все-таки ошибался. Это Надаль вынуждал одноручный бекхенд Федерера сбоить (например) или на второй-третий удар Бердыха какой-то игрок уже просто не мог ответить из-за мощи чеха. разные ситуации можно одинаково квалифицировать, как "вынужденная ошибка", но причины кроме самой общей могут быть просто, как небо и земля.
Ух. Есть еще какие-то соображения по смэшам и укороченным ударам, но ладно. Возможно, я "заигрался", но зато при такой картине Вы действительно более менее сможете понять, что происходило на корте, если не видели матч. А если хотите понять еще лучше, то Вам останется разве что посмотреть игру в записи.) Я постарался систематизировать свои мысли и объяснить свою точку зрения достаточно просто, но кажется в концовке вышло немного сумбурно. Дело в том, что первая часть заметки - ИМХО, это всё очевидно, а дальше есть спорные моменты.
В статье более менее нормально все рассказано и дополнения толковые.
Добавлю своё. Если речь идет об игроках которых мы периодически видим на видео (первые 150 рейтинга) то в принципе понимаешь его стиль игры, и за счет чего он выигрывает большинство очков, поэтому когда нет видео примерно можно определить как развивалась ситуация. Что касается низкорейтинговых, то можно обратиться к стату на атр, где видно как он иногда играл в челенджерах и проследить закономерность его набора очков. Для меня важные показатели являются % выигрыша 1,2 мячом, количество принятым на 1,2 подаче, количество брейков (естественно), разница поданных подач (при пересчете на четные геймы), и очень важный показатель разница Total point. Именно разница выигранных очков показывает на сколько было серьезным сопротивление одного перед другим, разница в 10 и больше очков (в сете) показывает явное преимущество. К примеру (если бы не было видео) Федя с Ньеминеным во 2 сете выиграл 10 оч разницы, но если глянуть далее то на подаче Федя выиграл 88% а Ньеминен 65% и принял за сет всего 4 очка, поэту можно судить что у Ярко не было не единого шанса на победу и Федя провел сет оч сконцентрировано не смотря на что счет дошел до 7-6. В другом примере Коля-Гаске 1 сет по стату оч сумбурный без явного фаворита, тотал брейк 5, тотал выигр подачи оба под 65%, разница выигранных тотал очков сета - 3 - итог сумбурная без фаворитная игра с постоянными качелями, где результат может решиться в любую пользу под влиянием ошибок.
Также анализ зависит от типа покрытия, от встречи разных стилей (подаваны, с тащилами, дубаломами и.тд)
Примеры условностей можно приводить бесконечно. Невынужденные ошибки каждый считает на свой лад. Определений виннера масса. Удары с лёта считаются и не считаются, эйсы считаются и не считаются. Я видел даже такое определение виннера, в котором эйс не считался виннером, но непринятая подача считалась. При укоротке выход к сетке считается автоматически, даже если игрок не догнал мяч и т.д.
То же и с интерпретацией статистики. Sanya справедливо заметил, что непринятая подача от эйса по эффективности не отличается. А принятая на хафкорт, после чего противник выиграл очко одним ударом, отличается?
Принято считать, что чем больше разность между количествами виннеров и невынужденных ошибок, тем выше качество игры. Однако это совершенно не обязательно.
Даже количество виннеров не обязательно показывает активность игрока. Оно может показывать, насколько хорошо противник играет в защите. Плохой защитник добегает до трудного мяча, но ошибается, и винненра нет, а хороший возвращает мяч в корт, иногда коротко, и даёт противнику возможность сделать виннер.
К сожалению, такого набора статистических показателей, по которому можно было бы делать однозначные выводы о характеристиках матча, не существует в принципе.
1) Когда я писал ту заметку у меня была 1 простая цель: сделать теннисную статистику / анализ более понятным и интересным для зрителя. Я совершенно не собирался творить некий идеальный набор параметров для анализа матча тренерским штабом. Тренерский штаб может крутить-вертеть ее, как хочет, и добавлять что-то свое, игнорировать какие-то части.
2) Правила сбора статистики и набор показателей д.б. едиными для всех турнуа, где можно такое собирать (где есть хоук ай).
3) Я искренне считаю, что, если есть данные по показателю 1 и показателю 2, то комбинированные показатели можно собирать уже сейчас. Напр-р, если есть показатель по # и % выигранных очков длительностью от 1 до 3 ударов и кол-во выигранных очков на 1 и 2 подаче каждым из игроков, то можно легко подсчитать cheap points (# и % выигранных розыгрышей от 1 до 3 ударов на своей 1 подаче и от 1 до 4 на приеме 2 подачи соперника, например) для обоих игроков.
Методика не будет универсальной, в ней будут ошибки, но это лучше, чем сейчас, и для ТЕЛЕЗРИТЕЛЯ хватит. В конце концов бейсбольная телестатистика тоже не без греха, но как же круто ее порой преподносят телезрителю!
4) Зрителю показывают не всю статистику, а только некий обязательный минимум + то, что кажется важным / интересным комму. Дабы не выносить моск 5 экранами со статистикой. При этом полные статсы доступны где-то в интернете (напр-р, на сайте турнуа) для желающих.
По показателям пройдусь позже.
Во время матча многие тренеры ведут запись матча. Они учитывают те параметры, которые являются проблемными у их конкретного игрока. Например, процент приёма подач за хафкорт, отдельно слева и справа. Или процент вторых подач, после которых их игрок оказался в защите. Понятно, что такие показатели зависят не только от действий их игрока, но и от действий противника.
А сколько нибудь общей системы показателей, которая была бы полезна всем, просто не существует.
Универсальной системы показателей не существует, но это не значит, что никакой численный анализ матча невозможен. Просто каждый раз надо подбирать этот набор отдельно и обосновывать его применимость к данному матчу. Пусть даже это могут быть виннеры и невынужденные ошибки, но придётся обосновать, что именно квадрат первых, делённый на куб вторых, является именно для этого матча показательным.
И в самом деле, чтобы статистически все отражалось во всех смыслах идеально, необходимо несколько расширить критерии и пункты отдельных выкладок.
Но беда в том, помимо всего прочего, что на экранах телевизоров места не будет и для одной пятой части всех возможных и невозможных показателей - восприятие в глазах простых зрителей несколько осложнится.
Последнее - тем, кто пишет более длинные posts: чтобы было проще читать, отделяйте, что ли, четко абзацы друг от друга.