Как можно вычислить влияние судейской ошибки на ход матча? | Исследование судейства в РПЛ
Август 2023-го, «Открытие Арена», «Спартак» - «Зенит», 10-я минута матча. Игнатов получает ту самую, злополучную жёлтую карточку за лёгкий фол на чужой половине поля. Абаскаль после игры выдает свой уже легендарный перл и выставляет себя в, мягко говоря, невыгодном свете.
В комментариях был смех и негодование, последнее разумеется от болельщиков «Спартака» - даже им сложно было понять такую реакцию наставника на поражение. Вряд ли вы найдете человека, который бы оправдывал данную цитату. Но каким бы абсурдным оно не казалось, давайте сейчас выкинем из головы ту жёлтую Игнатову и зададим себе вопрос: можем ли мы злиться на судью даже из-за мелких ошибок, вроде неверно зафиксированного аута или той же карточки? Думаю, ответ очевиден, а тем более это касается игроков, которые нервничают, выходят из себя и получают жёлтые карточки за споры.
В общем-то понятно, что недовольство судьями не ограничивается ошибками в ключевых ситуациях, вроде пенальти и удалений, на эмоциях можно всякое сказать. Частенько бывают такие матчи, где судья не совершал грубых ошибок, но в одном эпизоде не дал штрафной, в другом - угловой, и от его работы остаётся неприятный осадок. Болельщики в таких случаях нередко рассуждают о «заряженности» арбитра (хотя градус возмущения гораздо ниже, чем в случаях с например незасчитанным голом). После таких неоднозначных игр (а их в РПЛ много) вам может прийти в голову мысль: «вот бы был способ вычислить, кому больше всего помогали арбитры, чтобы при этом считались и штрафные и жёлтые карточки, а также учитывалось именно их влияние на ход матча, а не просто количество». Было бы здорово.
Да, это была очевидная подводка к основной теме статьи, здесь пойдет речь об одной модели подсчёта значимости судейских ошибок, благодаря которой в этом блоге мы попробуем изучить работу арбитров в текущем сезоне РПЛ.
Модель довольно интересная, для примера еще ненадолго вернемся к возмущениям Абаскаля: согласно системе подсчета ошибок примерно 30 жёлтых карточек, показанных Игнатову, равны одному ошибочно засчитанному голу на последних минутах матча при ничейном счёте. Проще говоря, если бы Карасев на 10-й минуте матча за фол Игнатова показал бы жёлтую всем игрокам «Спартака», то даже этого было бы недостаточно, чтобы согласиться со словами Абаскаля о «сломанной игре».
А теперь ближе к делу, что за модель подсчёта значимости ошибок? Читатели этого блога уже все поняли, но для широкой аудитории объясняю: год назад здесь начало выходить большое исследование о судействе в РПЛ. Отсматривался каждый матч, где выискивались все судейские ошибки, которым с помощью системы подсчёта значимости начислялись баллы. Сама система была разработана перед началом исследования и включала в себя примерно 500 возможных ситуаций с ошибочным или спорным решением арбитра. Чтобы выяснить, кто от работы судей находился в плюсе, а кто в минусе, баллы за ошибку одновременно начислялись обеим командам в матче (одной +, другой -). Итоги исследования получились довольно любопытными и разумеется захотелось продолжить это дело. Только есть одно но.
Система подсчёта ошибок имела множество недостатков и противоречий, она не очень точно отражала значимость каждого решения арбитра. Поэтому в обзорной статье об итогах исследования я подчеркивал, что все это - лишь проба пера, бета-версия, воспринимать всерьез ее не стоит. Конечно, итоговая таблица команд по лояльности со стороны судейства отразила некоторые закономерности, например особенно частые ошибки против «Крыльев Советов». Но в целом, сказать что-то по ней было сложно, поэтому те же лидирующие места «Зенита» и «Ростова» (как команд, в чью пользу больше всего совершались судейские ошибки) для меня лишь условность.
Перед новым сезоном модель подсчёта была полностью переработана, далее речь пойдет об этом, но не только. Я поделюсь с вами, как создавалась первая версия, почему были допущены ошибки и каким образом исправлены. Все это позволит вам получить ответ на очень интересный вопрос: как вообще возможно хотя бы примерно высчитать значимость судейской ошибки?
И не волнуйтесь, формул «е равно мс в квадрате» вы здесь не встретите, вычислить значимость судейских ошибок на самом деле не так сложно, нужно лишь следить за ходом мысли и вспомнить немного математики с простой логикой.
На чем построена модель подсчёта?
Объяснение важно начать с самой сути модели подсчёта, ее основы. Опять же отмечу, что все механизмы вычисления значимости ошибок довольно простые, но чтобы их понять, нужно начать с общих правил. Для этого давайте спросим себя: Что влияет на значимость ошибки? Год назад я начинал создавать модель именно с этого вопроса, потому что ответ на него позволит выяснить, из чего должны складываться баллы за судейские решение, грубо говоря, почему за один эпизод 1 балл, а за другой 100.
Были определены три критерия, которые влияют на значимость ошибки:
Первый - это сама ошибка, то есть в чем она заключается: в непоставленном пенальти или штрафном, непоказанной красной или жёлтой и тд. Изначально я выделил 10 разных видов ошибок (для сокращения будем называть это так) и расставил их в порядке убывания их влияния на игру. Получился вот такой список:
Здесь я сразу отмечу первое изменение в новой модели подсчета: теперь видов ошибок 14. Ничего совершенно нового здесь не появилось, просто некоторые виды были разделены. Раньше фол в атаке и фол в центре поля котировались одинаково, теперь нарушения в финальной трети со стороны атакующей стороны оценены чуть повыше, так как атака может потенциально привести к забитому мячу (или хотя бы угловому). Ещё одно нововведение - жёлтые для вратарей, они отдельно считались и в прошлом сезоне, но вместо таблицы с отдельными баллами была небольшое примечание: «баллы за жёлтую для полевого разделить на 2». Теперь карточки для вратарей проработаны более детально и отдельно от жёлтых для полевых, чтобы не возникало путаницы. К слову, ее было особенно много при оценке прерванных голевых атак - это особый вид ошибки, который фиксируется, если арбитр остановил игру раньше времени, не разобравшись в эпизоде. В основном под этим имеется ввиду неиспользование «принципа преимущества», когда судьи останавливают игру, хотя пострадавшая команда сохранила мяч и проводила очень опасную атаку. В данном виде ошибки также произошло разделение и стало все немного сложнее.
В целом же с видом ошибок все плюс-минус осталось также, только ещё стоит упомянуть очередность по важности, она тоже немного изменилась:
Второй критерий, влияющий на значимость ошибки - это обстоятельства, при которых случился эпизод, а именно: время и счёт матча. Тут все понятно: гол при счете 3-0 совсем не равно голу при 0-0. Каждый вид ошибки может оцениваться совершенно по-разному в зависимости от условий матча, поэтому неудивляйтесь тому, что иногда ошибочно поставленный пенальти весит больше, чем ошибочно засчитанный гол.
Третий критерий - это очевидность ошибки. Здесь оценивается сложность эпизода для арбитра. В отличие от двух других критериев тут все совсем просто, есть три варианта оценки очевидности: явная ошибка, обычная ошибка и спорное решение. По сути здесь все понятно по одним названиям, но отдельно отмечу специфику спорных решений: их оценка применяется в пограничных эпизодах, которые сложно однозначно трактовать. Если сам эпизод 50 на 50, то баллы уже неизбежно будут начислена, за любое решение арбитра, но весить будут такие эпизоды гораздо меньше, чем обычные и явные ошибки.
Ещё одним отличием третьего критерия является его опора на личное мнение автора, то бишь меня. Здесь ничего поделать нельзя, во всех материалах, где оценивается работа арбитров, присутствует субъективность, тем не менее я стараюсь ориентироваться на мнение различных судейских экспертов. В любом случае оценка очевидности ошибки очень полезна, ведь она позволяет избежать категоричных оценок в спорных ситуациях и отличать ошибки в сложных ситуациях от глупейших ляпов судей
По итогу мы получаем три критерия, из которых складывается вес ошибки: вид, обстоятельства матча и очевидность. Теперь нужно определить, как именно они влияют и откуда берутся числа.
Какие шаги нужно сделать, чтобы вычислить баллы
При определении веса ошибки обязательно нужно учесть, что все три критерия с одной стороны должны иметь отдельные правила внутри себя, а с другой - должны иметь взаимосвязь и влиять друг на друга. Проще говоря, у видов ошибок есть свое распределение по важности: гол весит больше всех, далее пенальти и так далее. Но, это распределение работает лишь само по себе, без учёта двух остальных критериев: обстоятельства матча и очевидности ошибки. Как уже отмечалось выше, если ошибка связана с голом, это не значит, что она будет весить больше, чем ошибка с пенальти (или даже со штрафным), мы должны учитывать все три критерия одновременно, и это - самая сложная часть для понимания, одно дело, когда просто расставляешь по порядку виды ошибок, другое, когда учитываешь их зависимость от счета, времени и очевидности, поэтому тут нужно быть внимательнее.
Нам нужно сделать несколько шагов, чтобы определить взаимосвязь между тремя критериями и рассчитать все баллы, для начала, чтобы не запутаться, мы должны отсечь критерий очевидности ошибки. Вы спросите: почему и как можно это сделать, а я отвечу, что не просто так написал о его простоте и отличий от двух других критериев, тут все легко: нас есть всего три варианта (явная ошибка, ошибка и спорное решение) и в независимости от времени матча, счета и вида ошибок все эти варианты трактуются одинаково и должны иметь между собой одинаковое соотношение.
Так что говоря о взаимосвязи трёх критериев я чуть обманул вас, на самом деле она есть только у вида ошибки и обстоятельств игры, а очевидность всегда трактуется по одному чёткому правилу, в прошлой модели подсчёта оно было таким: 80 процентов баллов от явной ошибки равны простой ошибке, а 30 процентов явной ошибки равны спорному решению, проще запоминается как «100-80-30». Логика простая - ошибка и явные ошибки не должны сильно отличаться между собой, ведь это в первую очередь ошибки. А спорное решение - кардинально другая история, про это я уже писал.
Конечно соотношение баллов здесь выбрано немного наугад, но как быть иначе? Самое главное, что в целом логика тут есть, хотя в новой модели произошло небольшое изменение, вес за спорные решения стал ещё меньше, чтобы сделать бо́льшую разницу между обычными ошибками и пограничными ситуациями. Теперь соотношение таково: 100-80-25.
Так как третий критерий у нас уже есть, задача сильно упростилась. Нам нужно лишь рассчитать показатели для явной ошибки в зависимости от ее вида, счета и времени матча, а потом просто вычислить от полученных баллов 80 и 25 процентов. Теперь можно переходить к основному плану действий. Оба раза, когда создавалась модель подсчёта, я использовал один алгоритм, упрощённо он выглядит так:
На первый взгляд все звучит просто, но вот тут мы как раз переходим к моим просчётам в предыдущей версии, начинается самое интересное.
Главный недостаток старой модели подсчета
Самое важное в алгоритме - это сохранять соотношение по баллам между видами ошибок при любом счёте и времени матча. Если на 56-й минуте при равном счёте 1 красная равна 10 жёлтым (просто пример), то при 2:0 на 40-й минуте красная также должна быть равна 10 желтым. Конечно не обязательно везде строго исполнять это правило, можно допускать погрешности, особенно когда речь идёт о крупном разрыве в счёте, где любая судейская ошибка почти ни на что не влияет. Но хотя бы приблизительно соотношение должно оставаться таким же при разнице в счёте до двух голов.
Уже в самом начале своего алгоритма я совершил ключевую ошибку, которая не позволила мне сохранить между видами ошибок единое соотношение. Мне хотелось, чтобы таблица с баллами воспринималась как можно легче, поэтому я даже не думал, что максимальная оценка может весить несколько тысяч баллов, казалось, что будет слишком много циферек. При этом все значения необходимо было сделать целыми, чтобы не было каких-нибудь 0,7 и прочих десятичных чисел. Эти два желания привели к тому, что изначально я просто установил четкие рамки - максимальное значение - 300 баллов, минимальное - 1. Как вы можете догадаться, 300 баллов относились к явно ошибочному засчитанному (или незасчитанному) голу при равном счёте или когда меняется исход поединка.
Тут кстати отдельно отмечу небольшую сложность со счётом, дело в том, что в обстоятельствах матча нет просто «равного счета», «разницы в 1,2,3 гола» и тд., потому что важность гола зависит ещё и от того, в чьи ворота он был/мог быть забит. Для примера возьмём счёт 2:0, одно дело, когда после гола он меняется на 3:0, совсем другое - когда на табло становится 2:1. При этом второй случай по влиянию на игру сопоставим с тем, когда счёт из 1:0 превращается в 2:0, в итоге получается такая формулировка: атака в ворота команды, которая ведёт в 2 гола или уступает в 1.
Возвращаемся к ключевой ошибке, 300 баллов - максимальный гол, а 1 балл - это спорное решение насчёт фола в центре поля при крупном счёте. Изначально мне казалось, что такой разброс будет достаточным, чтобы между всеми значениями сохранить адекватное соотношение, рассуждение было таким: за сколько времени накопится 300 таких ошибочных фолов, чтобы можно было приравнять их к одной украденной победе/ничьей? Лет 20, если не больше, значит вроде разброс по баллам достаточно большой.
Но для создания реалистичной модели нужно, чтобы логика работала вместе с математикой. Да, иногда приходится рассчитывать баллы на основе своих умозаключений, но нужно стараться использовать реальные статистические данные и уже на их основе делать выводы. А взаимосвязь между фолами в центре поля и голами просто невозможно рассчитать на основе одной логики. По сути вся система была заточена под: «я решил, что гол равен столько-то и все».
В действительности гол должен был весить гораздо больше, но об этом чуть позже, а пока вернёмся к истории создания старой модели подсчета: определив максимальный вес гола в 300 баллов, несложно вычислить баллы для пенальти. Здесь как раз пример сочетания логики и математики, 11-метровые реализуются примерно в 75-80 процентах случаев, значит максимальные баллы пенальти равны примерно таким же процентам от 300 баллов (было решено взять 250). С удалениями все сложнее, но 190 баллов также выглядели относительно нормально. А вот дальше начинался рандом: максимум угловых равнялся 22 баллам - то есть условно каждый 15-й угловой - гол, что не соответствует реальной статистике. Такое правило пришлось принимать как раз из-за маленького веса голов, ведь ауты и фолы нужно было оценить еще меньше, чем стандарты, если сохранить соотношение между угловыми и голами, то для более мелких ошибок уже будет тупо не хватать баллов. Та же история с желтыми, которым пришлось дать 35 баллов, то есть всего 5 ошибок с карточками были равнозначны удалению, хотя понятно, что разница значительно больше, лучше играть без жёсткого прессинга с игроками на желтых, чем остаться в меньшинстве.
В общем, кое-как, криво косо были определены максимумы за каждый вид ошибки, первый шаг алгоритма сделан, хотя уже все выглядело не очень:
Но это я ещё не переходил к проблеме соотношения баллов между видами ошибок в зависимости от времени и счета. Мы видим, что в старой модели подсчёта даже между максимальными баллами зависимость не совсем правильная, а это означает, что данная проблема будет отражаться во всех остальных обстоятельствах матча, причем неудачное соотношение будет становиться все более очевидным, ведь уменьшать баллы для мелких ошибок почти некуда.
Вот как выглядели все эти проблемы: возьмём баллы за ошибочно (не)засчитанный гол, меняющий исход матча, в начале игры, он был меньше примерно в три раза от максимума и равнялся около ста баллам. В рамках гола все логично - в начале игры он значительно меньше влияет на исход поединка, впереди ещё много времени, чтобы отыграться. Но теперь вспоминаем, что жк весит 35 баллов, разумеется этот максимум был именно в начале встречи, карточка в конце игры особо не влияет на исход. В итоге у нас получается, что один гол равен трем ошибочным желтым в начале встречи, уже совсем недалеко от безумных умозаключений Абаскаля.
А дальше мы начинаем рассчитывать изменения менее значимых ошибок и все становится ещё хуже. Голы я хотя бы мог спокойно уменьшить в три раза, но перейдем к ошибкам поменьше: считаем фол в центре поля в начале игры, было 4 балла, делим на 3, получаем с округлением 1. Все, один балл - это минимальное значение, дальше уменьшать некуда, а ведь это лишь равный счет. С ошибками покрупнее была та же история, только они доходили до минимума чуть позже, а вы еще не забывайте, что от полученных баллов нужно вычислять баллы за спорные решения и обычные ошибки.
В общем, из-за слишком маленького разброса баллов мне не удалось создать хорошую модель подсчёта значимости судейских ошибок. Пришлось отказаться от одинакового соотношения между всеми видами ошибок, чтобы, выражаясь просто, хватило баллов. При этом с ключевыми эпизодами (гол-пенальти-удаление) все было ещё более менее, а дальше пришлось импровизировать. Например, если вес гола при равном счёте уменьшался в три раза, то вес углового - лишь в два. Это позволило сделать-таки систему подсчёта баллов и начать исследование предвзятости арбитров, но в модели, как вы уже поняли, оставалось много проблем с соотношением баллов, между тем же голом и угловым оно было разным в зависимости от времени матча, ведь значения ошибки голов снижались быстрее. По итогу выходило, что в конце матча гол равнялся пятнадцати угловым, а в начале игры - уже восьми.
К этим проблемам можно ещё добавить погрешность в расчетах, так как по времени вес ошибки определялся по десятиминутным отрезкам (а в некоторых случаях больше). Это означало, что ошибочно засчитанный гол при равном счёте на 90-й минуте весил столько же, сколько на 81-й, хотя разница здесь немаленькая.
Справедливости ради, предыдущая модель хоть и была кривой, но все же отображала кое-какие тенденции судейства в прошлом сезоне, а в статье-итогах исследования я специально сравнил получившуюся таблицу с таблицей по количеству допущенных ключевых ошибок (гол-пенальти-удаление) и выяснилось, что многие команды находились примерно на своем месте. Но понятно, что систему необходимо было дорабатывать, вышеуказанные минусы не позволяли воспринимать ее всерьез, хотелось действительно создать хороший способ вычисления влияния судейской ошибки на ход игры. Мне кажется, что на сей раз это удалось сделать и ниже пойдет разговор о том, как были исправлены все вышеуказанные недостатки старой системы подсчёта, а заодно вы окончательно поймете, как можно измерить такую на первый взгляд абстрактную вещь, как влияние на игру решений арбитра.
Новая модель - как была решена главная проблема
У вас уже могло появится общее представление о том, как можно оценить решение арбитра, вспоминаем упрощённый алгоритм действий: оцениваем максимальный вес для каждого вида ошибки и фиксируем соотношение между ними, опираясь на логику и статистику (как часто реализуются пенальти, можно ли считать 2 удаления в начале игры таким же приговором, как гол в конце матча и тд.), рассчитываем вес каждой ошибки в зависимости от времени при равном счёте таким образом, чтобы сохранить соотношение между баллами сохранялось, далее повторяем это приболел крупных разрывах в счёте, ну и считаем обычные ошибки и спорные решения.
Алгоритм мы оставляем тот же, только теперь нам нужно увеличить разброс баллов, чтобы хотя бы при равном счёте соотношение между всеми баллами сохранялось, а дальнейшие погрешности были бы незначительными. И тут вопрос: во сколько оценить гол на последних минутах, который меняет исход встречи? Очевидно, что гораздо больше, чем 300, но все равно непонятно, сколько именно.
Нужно использовать реальные статистические данные, а не просто тыкать на бум ради более понятных чисел. Понятно, что опираться на статистику всегда мы не можем, нельзя же вычислить, сколько аутов в финальной трети поля приводят к голу. Тем более нельзя сравнить фолы в центре поля и стандарты, это просто нельзя сопоставить, поэтому кое-где тыканье на бум сохраняется и в новой модели, например мы можем допустить, что 1 угловой равен 20 фолам в центре поля. Да, можно задать вопрос: «А почему не 10 или 30», но мы должны понимать, что в случае с мелкими ошибками их влияние настолько минимально, что мы можем позволить себе здесь погрешность, опираясь только на логику (тем более другого варианта здесь нет). А вот со стандартами и желтыми карточками уже другая история - они более весомые, их легко сопоставить с голом и удалением соответственно, а также именно с этих видов ошибок начинались проблемы, потому что относительно гола их значение было слишком велико. И как же нам использовать реальную статистику, чтобы создать правильное соотношение?
Начнем с угловых, это образец дальнего стандарта, на всякий случай уточню, кто не обратил внимания: стандарты делятся на дальние и ближние в зависимости от места нарушения (специальная карта, которая показывает, где что даётся, будет ниже в документе с общим сводом правил). Ближние и дальние стандарты совсем чуть-чуть отличаются по баллам, их мы посчитаем также на бум, но для начала нужно высчитать значимость дальних стандартов, для чего нам поможет статистика по угловым. Вы можете поискать ее на разных букмекерских и спортивных сайтах и придете к выводу, что обычно число угловых варьируется от 9 до 12 в среднем за матч. Это касается в том числе РПЛ, для удобства можем взять число 10 за средний показатель количества угловых в прошлом сезоне.
В нашем чемпионате проводится 240 игр, умножаем их на 10 и получаем примерное число угловых, исполненных за весь сезон (2400). Можем накинуть ещё 100 угловых, учитывая атакующие тенденции в нашем чемпионате, итого 2500. Теперь нужно посчитать, сколько из этих двух с половиной тысяч стандартов завершились голом. Я решил упростить себе эту задачу и отмониторил лишь первую часть сезона, думаю, этого вполне достаточно, чтобы иметь общее представление о том, как часто реализуются угловые. Вам может показаться, что статистику вытянут те самые убийственные розыгрыши стандартов от «Урала» с Газинским на дальней штанге, но на деле с угловых забивали многие, за полсезона накопилось аж 47 голов. Отмечу, что к ним я относил случаи, когда после угловых назначался пенальти (и он был реализован), а также вторую волну атаки, если мяч быстро возвращался обратно в штрафную, после чего следовал гол. Далее увеличиваем количество голов с угловых в два раза и получаем число 94, которое так и тянет округлить до 100, особенно учитывая, что до этого мы накинули сотню лишних угловых. В итоге получается идеальная ситуация для подсчёта: 2500 угловых, из которых 100 привели к забитому мячу. Делим 2500 на 100 и получаем 25 - именно столько угловых могут в среднем привести к одному голу. Таким образом мы выяснили, во сколько раз баллы за гол должны быть больше баллов за угловой, и это уже не просто абстрактные умозаключения, а данные, основанные на реальной статистике, хоть и с разного рода округлениями и допущениями.
С желтыми карточками ситуация конечно сложнее, ведь их разницу с красной невозможно определить через статистические данные, но здесь мы можем опереться на статистику угловых и добавить немного своих умозаключений насчёт удалений: в старой системе максимальный вес за жёлтую был незначительно выше, чем за ближние штрафные, при этом всего лишь 5 жёлтых равнялись красной, что, как я уже отмечал, маловато. Используем логику: сколько жёлтых нужно показать, чтобы один из игроков либо получил красную (при отсутствии замен от тренера). Ответ - 12, один из футболистов неизбежно получит красную, но в тоже время остальные останутся с жёлтой, значит 12 «горчичников» уже хуже одной красной, а 11 - чуть лучше. Значит баллы за жёлтую можно оценить примерно в 11,5 раз меньше, чем баллы за красную и как раз получится число, сопоставимое с баллами за стандарты.
Далее оставалось выбрать максимальный балл для гола таким образом, чтобы его можно было спокойно разделить и получить максимальный балл для дальних стандартов, который в свою очередь нужно снижать ещё в несколько раз для самых мелких ошибок и тд. Короче говоря , нужен запас баллов.
Методом проб и ошибок я быстро определил оптимальный вес гола, значение стало гораздо больше, теперь в системе подсчёта есть четырехзначные числа, но при этом считать их несложно, по-прежнему отсутствуют всякие 3,567 или 56,0008. Минимум остался равен 1 баллу и каждый эпизод оценивается целым числом Если раньше максимум составлял 300 баллов, то теперь, внимание, 5000. Дальние стандарты весили в 25 раз меньше - 200 баллов, жёлтые карточки для полевых игроков - 220 баллов. В общем, на сей раз с распределением максимальных баллов все вышло без проблем, ниже приведен полный перечень:
Изменения по сравнению со старой моделью подсчёта очевидны, появилась возможность в несколько раз уменьшить баллы даже самым мелким ошибкам, что важно для соблюдения соотношения. Казалось бы, теперь можно перейти к следующему шагу и рассчитать влияние времени и счета матча на каждый вид ошибки, но есть еще один важный нюанс, который связан как раз с соотношением.
Различия между удалениями и голами
Здесь придется раскрыть ещё один мой небольшой обман: соотношение по баллам не должно оставаться одинаковым у всех видов ошибок. Чтобы не наваливать все в кучу и вам было проще понять недостатки системы, я об этом не писал, так как большинство видов все же должны изменяться одинаковым образом, как в примере с голами и угловыми. Но давайте сосредоточим внимание на ошибках, связанных с карточками, можно ли их сравнивать с голом? Конечно нельзя, приведу простой пример: мы для голов логично правило, что в конце матча при равном счёте они весят больше, чем в начале встречи. При этом разницу между ними нельзя назвать огромной, ведь гол - есть гол, при равном счёте он даёт большое преимущество независимо от времени матча. А теперь давайте сравним с удалением. И да, дело не только в том, что нужно отзеркалить изменения значимости баллов, понятно, что в начале встречи красная карточка при равном счёте должна весить наибольшее количество баллов. Но что если красная была показана за несколько секунд до финального свистка, сильно ли она повлияет на итоговый результат? Вопрос риторический, понятно, что гол в начале встречи влияет на исход гораздо больше, чем красная на 90+ минуте, а значит по времени вес гола должен изменяться не так резко, как вес удаления. Можно конечно привести примеры, как было в недавнем матче «Зенита» и «Динамо», где решающий гол некоторые связывали в том числе с отсутствием Барриоса, получившего красную в конце игры. Но даже если это так, сколько найдется примеров игр, где после красной в добавленное время ничего не происходило?
Суть описанного различия в особенности влияния карточек на игру. В отличие от голов, они имеют долгосрочный эффект, само по себе удаление не влияет на результат, оно действует в течение всего оставшегося времени матча, а вот (не)засчитанный гол меняет исход сразу. При этом остальные ошибки можно назвать производной от голов или удаления: пенальти, штрафные, даже ауты в финальной трети поля - все это потенциально может привести к голу, значит соотношение между ними должно быть единым, ну а жёлтые карточки явно ведут к удалению и у них должны быть отдельные правила. Ещё особняком стоят мелкие ошибки в центре поля, так как они не связаны ни с потенциальным голом, ни с возможным удалением.
Таким образом все виды ошибок были разделены на три группы по влиянию счета и времени матча. Внутри групп соотношение между баллами остаётся единым, а между ними связи уже нет.
Теперь мы можем идти дальше по алгоритму, только баллы будут отдельно определяться для каждой группы, ведь влияние счета и времени матча на них совершенно разное.
Определяем баллы для «голевых» ошибок
Создание правил изменений в зависимости от счета и времени матча - важный этап работы, в котором нужно было снова подключать свои умозаключения, ведь невозможно точно посчитать, во сколько раз гол в конце важнее гола в начале. Стоит отметить, что при создании правил я отчасти опирался на старую модель, оттуда как раз были взяты эти самые умозаключения, но теперь изменения проводились по четким правилам.
Для ошибок, которые потенциально приводят к голу, за ориентир был взят собственно гол. То есть при составлении правил я сначала проверял, как они будут работать на примере забитого мяча, а уже потом рассчитывалось все остальное.
Действуем согласно старому алгоритму и рассчитываем изменения голов по времени при равном счёте или в ворота команды, которая ведёт в 1 мяч. Здесь ещё одно отличие от старой модели подсчёта: теперь 1 гол в конце равен не 3 голам в начале, а лишь 2,2 (примерно). Отчасти это было сделано, чтобы оставить определенный запас баллов на более крупных счетов, но тут есть и свою логика, ибо если совершить сразу две ошибки с голами в начале встречи, пострадавшей команде нужно будет выиграть остаток матча с счётом 2-0 или 3-1 и тд. Такое конечно бывает чаще, чем ответные голы в добавленное время, но все равно задача кажется сверхсложной. А при трёх голах она уже выглядит невозможной.
Все остальные «голевые» ошибки также должны снижаться в 2,2 раза, баллы в начале встречи таким образом составляют 45 процентов от баллов в конце. Если гол на 90+ минуте равен 5000 баллам, то нам нужно вычислить 45 процентов от этого числа, чтобы получить гол в начале. Получится число 2250, оно является минимумом, который можно получить за гол при равном счёте. Значение будет увеличиваться постепенно, прямо как указано на графике ниже:
Аналогичные шаги делаем и для остальных видов ошибок. Мы получаем максимальный и минимальный балл явной ошибки, а далее определяем, на сколько баллов нужно каждый раз менять значение для следующего временного отрезка.
Для расшифровки этих знаков вопроса сначала мы должны посчитать, сколько раз значение должно поменяться на одно и то же число, чтобы дойти с минимального до максимального. Выходит 18 раз, далее простая арифметика: вычисляем общую разницу между минимумом и максимумом, 5000-2250=2750, полученное число делим на 18 и получим разницу между соседними временными отрезками - 152,7777777... Вышло нецелое число, но ничего страшного, просто возьмём 152 и 153, будем их чередовать, в конце все равно накопится небольшой остаток и придется прибавить уже 158, чтобы все сошлось, но эта неточность совсем маленькая. Теперь можно легко посчитать баллы, например берём и прибавляем к минимальному значению гола 152 или 153, получим значение для отрезка на 6-10 минуте, к этого значения прибавляем ещё 152-153 и так далее. В итоге получается такая картина:
Тут кстати вы могли заметить одно важное улучшение системы подсчёта, если раньше время ошибки фиксировалось по 10-минутным отрезкам, то теперь они сократились в два раза и составляют всего 5 минут, а значит определение баллов по времени стало точнее.
Проворачиваем схожие вычисления с остальными «голевыми» ошибками и получаем идеальное соотношение между всеми «голевыми» ошибками при равном счёте - в старой системе такого и близко не было.
Теперь переходить к счету, когда потенциальная голевая атака идёт в ворота команды, которая уступает в 1 мяч или ведёт в 2 мяча, тут есть пара любопытных нюансов.
Во-первых зафиксируем, что гол при равном счёте всегда должен весить больше, чем гол при более крупной разнице, а значит максимальное значение меньше 2250 баллов. Логика здесь такая: в независимости от времени гол, влияющий на исход матча ценнее, вот и все. Для удобства было взято число 2000, оно меньше, при этом достаточно большое для гола при минимальной разнице в счёте, когда интрига матча жива.
Далее анализируем влияние гола на итоговый результат по времени, опять подключаем логику: при минимальной разнице в счете значимость гола работает по совершенно другим принципам, нежели гол, меняющий исход матча. В ситуациях, когда счёт (не)становится 2:0 вместо 1:0 (или 2:1 вместо 2:0) ошибка в конце матча не является определяющей, исход матча остаётся прежним, а времени его изменить нет. Получается такой перевёртыш: если значимость гола при равном счёте увеличивалась к концу игры, то здесь все наоборот, появляется тот самый долгосрочный эффект, как с карточками. При этом я бы все равно не стал равнять гол при разнице в 1-2 мяча с удалением, тут есть один очень тонкий момент, который называется «правило золотой середины».
Легче всего его объяснить на примере: предположим, что на табло 2:0 в начале игры и судья ошибочно засчитал гол, который сократил разницу до минимума, счёт 2:1. Вроде бы можно сказать, что такой гол будет весить больше всех при таком счёте, ведь впереди ещё много времени, чтобы отыграться. Однако ведь команда, ведущая в счёте, точно также имеет кучу времени, чтобы забить снова, инициатива может переходить друг к другу ещё много раз, ведь это не ошибка с удалением, где одна из команд остаётся в меньшинстве всю игру. Поэтому с голом нужно нащупать «золотую середину», когда интрига в матче при минимальной разнице в счёте находится на самом вверху, а при разнице в 2 мяча уже почти убита. Допустим, на 70-й минуте при счете 2:0 может казаться, что игра сделана, но тут уступающая команда забивает, счёт 2:1 и впереди ещё много времени, чтобы отыграться.
Это очень тонкая грань, которую невозможно точно определить, но на мой взгляд здесь лучше всего применить такое сложное правило, чем просто считать голы по правилам карточек.
Чтобы правило «золотой середины» работало, нужно, чтобы в начале игры Баллы весили чуть ниже максимума, но постепенно повышались до его уровня, на котором останутся в определенном отрезке игры, а в конце значение пойдет резко вниз и дойдет минимума на 90+ минуте. Вышло таким образом: баллы за эпизод с атакой в ворота команды, ведущей в 2 гола и уступающей в один с 1 по 45+ минуту увеличиваются на 30 процентов, остаются равными с 46-й по 75-ю минуту и с 76-й минуты до конца игры уменьшаются в 10 раз. На числах получается, что ценность гола сначала возрастает с 1400 баллов до 2000, далее максимальное значение сохраняется в той самой «золотой середине», а после 75-й минуты начинает очень резко снижаться до 200 баллов:
Важно отметить, что при рассмотренной разнице в счёте соотношение между видами ошибок с голами соблюдается уже не везде, появляется первое исключение, которое, как я уже отмечал, ничего глобально не меняет, потому что связано с мелкой ошибкой - фолами в атаке. Они не считаются по правилу «золотой середины», но приближены к нему: до 75-й минуты сохраняется их максимальное значение (8 баллов), а далее оно уменьшается в четыре раза.
На будущее отмечу, что если явная ошибка весит 1-3 балла , то соотношения по очевидности эпизода нет: явная ошибка весит столько же, сколько и простая ошибка, а спорные решения не учитываются, это ещё одна незначительная деталь, вот как это выглядит на примере фолов в атаке:
Далее мы переходим к случаям, когда в результате атаки счёт может стать либо крупным, либо сократиться до разницы в 2 гола. Как вы понимаете, тут соотношение не соблюдается уже так четко, что логично, учитывая снижение важности всех эпизодов. Несмотря на это, для большинства ошибок все ещё работают четкие правила, которые вновь поменялись: теперь пресловутая «золотая середина» сместилась в первую половину матча м длится до конца первого тайма, дальше идёт до минимума. Это логично, ведь отыграть два гола меньше чем за тайм очень тяжело.
Принцип остался тот же, значение гола сначала плавно увеличивается, только теперь лишь до 30-й минуты, до конца первого тайма сохраняется максимум в 1200 баллов, а затем начинается резкое снижение (на 96 процентов от максимального значения). На графике это выглядит таким образом:
Отмечу, что показатель в 1200 баллов был взят, потому что он чуть ниже количества баллов при минимальной разнице в счёте в начале встречи, это такое абстрактное правило, основанное на собственной логике, но иначе тут нельзя. Тем не менее здравый смысл здесь есть, если вы сравните максимумы баллов за голы при равном счёте, разнице в 1-2 и разнице в 2-3 гола (5000-2000-1200), то заметите, что наибольший разрыв между первыми двумя показателями, а дальше он значительно меньше. Проще говоря, чем крупнее счёт, тем меньше его влияние, просто сравните, когда гол забивается при 0:0 и 5:0, поэтому и тут есть определенная закономерность.
Переходим к случаям, когда разница в счёте увеличивается до 4-х голов, либо сокращается до 3-х. Тут уже разброс по баллам минимальный и «золотой середины» нет: чем ближе конец матча, тем меньше вес баллов. Подробно разбирать здесь нечего, лишь приведу основное правило: баллы за эпизод с атакой в ворота команды, которая ведёт в 4 мяча или уступает в 3 равномерно уменьшается с 1 минуты до минимального значения для каждого вида ошибки, при более крупном счёте всегда начисляется это минимальное значение. Да, у каждого вида ошибки есть свое минимальное значение, чтобы даже при сверхкрупном счёте гол не весил столько же, сколько фол в центре поля, разумеется там соотношение уже совсем не четкое.
Вот и мы и закончили рассчет для всех ошибок, которые связаны с потенциальным голом, они составляют большую часть от всех видов, поэтому осталось совсем немного. К тому же, правила для ошибок, которые потенциально приводят к удалению, гораздо легче понять, ну а за эпизоды в центре поля все совсем просто, разницы между баллами там почти нет, поэтому следующие две группы разберём коротко.
Определяем баллы за карточки и мелкие эпизоды в центре поля
У жёлтых и красных карточек взаимосвязь между счетом и временем легко понять, потому что здесь нет запутанных правил вроде «золотой середины». При любом счёте ценность карточки будет постепенно снижаться с начала игры до конца, разница лишь в скорости снижения.
Простая логика: красные при 0:0 и 3:0 на 90+ минуте почти не имеют между собой разницы, они весят одинаково, ведь свое влияние они оказывают лишь несколько минут. А вот в начале игры их значения сильно отличаются, при 3:0 удаление будет весить значительно меньше. В итоге мы приходим к простому выводу: чем крупнее счёт, тем меньше разница между карточкой в начале и конце встречи, вот как это правило отражено на графиках.
Как мы видим, линия для крупных разрывов в счёте более пологая, удаление при 3:0 в начале игры и конце имеет не такую большую разницу, как у красных при равном счете.
В общем, с изменением по времени у карточек все довольно легко вычислялось, сложнее было определить максимальный балл в зависимости от счета. Здесь вновь не обошлось без логических рассуждений, вспоминаем максимумы для голов, принцип в целом сохранился: самая заметная разница была между равным счётом и минимальной разницей, при этом дальше вес за красную снижался уже не так резко. По сравнению с голами тут есть небольшое отличие: удаления снижались не так резко, так как сохранялся их долгосрочный эффект, даже при 3:0 они могут привести к серьезным проблемам у команды, ведущей в счёте. По итогу сложилась такая зависимость:
С карточками на этом можно заканчивать, рассчитав красные я уже по отработанной схеме вычислил баллы за жёлтые карточки, конечно не обошлось без исключений, но при равном счёте соотношение едва ли не идеальное.
Для мелких ошибок я просто предоставлю вам полную таблицу изменений баллов в зависимости от времени и счета. Здесь отчасти соблюдается принцип с голами: при равном счёте и минимальной разнице баллы к концу матча увеличиваются, а остальных случаях наоборот. Ну и обращу внимание на ещё одну деталь - в новой системе все спорные мелкие фолы в центре поля не учитываются. У меня нет уверенности, что я могу их все отследить, честно говоря, иногда моментов в центре поля было так много, что некоторые возможные нарушения я пропускал, из-за чего могла возникнуть непоследовательность. Учитывая, что это лишь спорные решения в центре поля - говорить об их влиянии на исход матча глупо, поэтому я решил оставить только ошибки.
Вот таким получился ответ на вопрос: как можно измерить влияние судейской ошибки на ход матча. Ответ, длинною в целый пост, но это и неудивительно, ведь в двух словах такое объяснишь. Теперь давайте подытожим мою работу над новой системой подсчёта и сделаем общие выводы.
Итоги - плюсы и недостатки новой модели подсчета
Если вы следили ещё за прошлым исследованием, то думаю согласитесь, что по сравнению со старой версией новая модель подсчёта получилась просто великолепной: появились более короткие временные отрезки, проработаны недочёты с некоторыми видами ошибок, ну и самое главное - теперь у нас появился адекватный баланс между ошибками, который при наличии интриги в матче сохраняется почти везде. Соотношение по баллам между дальними стандартами и голами отныне построено на реальной статистике, что позволило в целом нормально рассчитать баллы для мелких ошибок, ну и конечно всего этого не могло получиться, не будь увеличен разброс баллов.
Преимущества новой системы очевидны, но я бы хотел отдать дань предыдущей версии, ведь она стала основой, благодаря которой мне удалось относительно быстро создать сегодняшнюю, более реалистичную модель подсчёта. Не просто так говорят, что всё идёт своим чередом, сначала нужно «набить шишек», чтобы потом исправить все допущенные ошибки и получился хороший результат. Причем эта житейская мудрость работает по кругу: с каждой новой попыткой ты не только исправляешь старые недостатки, но и находишь новые.
Так случилось и в этот раз, после работы над новой моделью подсчёта я вдруг осознал, как можно было сохранить соотношение по баллам даже для крупных разрывов в счете. Если вы ещё раз взгляните на картинку с максимальными баллами, то увидите, что можно все числа разделить на 10, так мы получаем все тоже соотношение.
В этом соотношении есть минимальный балл для ошибок в центре поля (1), а так как соотношение везде соблюдается, значит все остальные баллы можно принять за минимальное значение для каждого вида ошибки, а дальше увеличивать их в соответствии со всеми вышеописанными правилами, только идти надо будет наоборот: от крупного счета к равному. Так бы мы получили абсолютно идеальную модель подсчёта, но здесь ее не будет по двум причинам.
Во-первых, я додумался до этого очевидного способа, когда уже писал данную статью, ну и во-вторых, при такой системе показатели за ошибки станут исчисляться настолько многозначными числами, что воспринимать ее уже будет сложно. Я все же хочу отчасти сохранить простоту восприятия, чтобы вам все было понятно. Да и к тому же уже не раз отмечалось, что погрешность при крупных разрывах в счете вообще не играет никакой роли, ну какая разница между голом и штрафным при счете 4:0?
Поэтому даже через год, когда наверное придет черед нового исследования, я не буду все менять в угоду абсолютно идеальному соотношению, в этом нет смысла. Зато теперь вы знаете вместе со мной, как можно с почти ювелирной точностью рассчитать значимость судейской ошибки, вот такое интересное получилось ответвление.
Что касается соотношения баллов в новой системы, то возможно ради повышения точности в будущем разброс баллов будет ещё незначительно увеличен, например до 6000 баллов, но в целом уже сейчас она достаточно хорошо рассчитана
Тем не менее, некоторые болячки старой системы перекочевали в новую, к сожалению исправить их не было времени, да и если честно, я пока не представляю, как можно это сделать. Прежде всего я говорю об учёте неравных составов в игре. Ещё год назад об этом недостатке мне писали в комментариях: например гол при счете 2:0 в ворота уступающей команды не играет очень большой роли, однако ситуация выглядит иначе, если команда, ведущая в счёте, играет в меньшинстве (особенно если вдевятером). Такой фактор конечно повышает интригу в матче, но насколько именно - непонятно. Возможно, вы сможете помочь мне с этим, но учитывая, что уже 9-й тур и многие матчи по баллам рассчитаны с этим недостатком системы, придется с этим смириться в этом сезоне, благо матчей с неравными составами не так много.
Разумеется ещё раз подчеркну фактор погрешности и субъективности, хоть и первый теперь стал заметно меньше благодаря сокращению временных отрезков, но он остался, а субъективность проявляется не только в оценке очевидности эпизода, но и при составлении некоторых правил подсчёта, вроде «золотой середины».
В общем, минусы у системы подсчёта есть, ничего не может быть идеальным. Однако можно смело заявить, что благодаря большому количеству исправлений в этом сезоне уже можно будет более-менее точно определить, кому из команд чаще всего играют на руку судейские ошибки.
Дальнейшие планы на новое исследование судейства
В прошлом сезоне мне не удалось выпускать еженедельные отчёты по каждому туру, чтобы мы вместе следили за ходом исследования, поэтому обойдёмся без обещаний, в любом случае я буду стараться подводить итоги каждого тура. Учитывая, что прошла треть сезона, первые два обзора охватят большой промежуток времени: первый за 1-6 туры (июль и август), второй - за 7-9 туры (сентябрь).
Вместе со статьями будут выходит и видеообзоры со всеми моментами в динамике, а также текстовые отчёты - здесь по сравнению с прошлым сезоном все без изменений, но отмечу, что отчёты теперь будут выглядеть таким образом:
Теперь все разобранные моменты описаны не сплошным текстом, а так, чтобы все было интуитивно понятно. Отдельной отмечу графу «сложность эпизода», в предыдущем сезоне такой характеристики не было. На предвзятость к команде она никак не влияет и пока вы можете не обращать на нее внимание, она создана в первую очередь для того, чтобы отмечать правильные решение арбитров в сложных ситуациях. Раньше я на этом не заострял внимания, теперь же в отчёте будет много не только критики, но и похвалы, которую наши судьи тоже заслуживают. Вообще новое исследование будет больше заточено на самих арбитров, а не на их предвзятости к какой-нибудь команде, потому что эту самую предвзятость на дистанции всего сезона редко можно заметить. Я склонен предполагать, что причина большого количества ошибок в матчах РПЛ кроется в других вещах, а в каких именно - постараемся разобраться в этом сезоне и даже попытаемся создать свой рейтинг судей, который в отличие от рейтинга ЭСК будет учитываться каждая ошибка сезона и сложность эпизода, в котором она была допущена.
Но это все будет потом, а сейчас конечно же я понимаю, что таблица предвзятости будет для вас самым интересным в этом исследовании. Но ее важно правильно трактовать, ориентируясь не на место, а на количество баллов. Чтобы восприятие таблицы было правильным, теперь в ней вы можете видеть специальные зоны, ради наглядности готов заспойлерить вам таблицу по итогам первых шести туров, взглянем на нее:
Мы видим, что здесь есть белая зона и в ней находятся команды, которые на текущий момент времени не имеют серьезного влияния на их результаты от ошибок арбитров. То есть между 5-м и 12-м местом практически нет никакой разницы.
Дальше начинаются зоны с бледными цветами. В них попадают команды, на которых оказывается незначительное влияние со стороны судей. Чтобы оказаться в этой зоне, нужно, чтобы клуб в среднем за матч получал минимум 166 баллов (только в одну сторону). Почему именно такое число? Все просто, по итогу 30 туров такая команда будет иметь 5000 баллов (с небольшим округлением), а они равны гипотетически украденной победе/ничьей. В рамках целого сезона, на мой взгляд, один матч с подобным исходом на 29 игр без единой ошибки - относительно нормальная история, но если больше - то уже незначительная помощь арбитров.
А вот зоны с яркими цветами - это уже заметное подсуживание в одну сторону: минимум 333 балла в среднем за матч и от 10000 за весь сезон. При этом важно понимать, что эта таблица не отражает количество потерянных/приобретенных очков в результате ошибок судей. Тот же ЦСКА здесь в глубоком минусе, причина которого одна - игра с «Ахматом». Но вы же помните, как закончился тот поединок. Поэтому будьте внимательнее, здесь анализируется предвзятость в чью-либо сторону, но количество очков без ошибок арбитров высчитать невозможно, футбол не терпит сослагательного наклонения.
Ну вот и все, что хотелось здесь написать, хотя в статье я еще не описал множество нюансов, поэтому для тех, кто заинтересовался исследованием, оставлю ссылку внизу на полные правила и памятку со всеми баллами.
На этом не прощаюсь.
Telegram-канал, где публикуются все моменты в динамике и оперативно освещаются матчи
Даже если в облегчённом, табличном варианте нам удастся увидеть ваш взгляд на судейские ошибки тура и так называемую "справедливую" таблицу РПЛ - будет очень круто.