Главная проблема в современном судействе MMA
Или все что вам нужно знать о статистике и критериях оценки, чтобы понимать, когда судьи точно не правы.
Когда судейство вызывает вопросы
В любом виде спорта судейство — горячая тема для споров. Что уж говорить о единоборствах, в которых, при отсутствии объективного результата (нокаут, успешный болевой прием или выброшенное полотенце), судьи определяют конечный исход противостояния.
Субъективное мнение судьи, его интерпретация происходящего это всегда пространство открытое для флуктуаций — а уже само по себе это проблема. Не удивительно, что в качестве инструмента решения этой проблемы нам предлагают применить «статистический метод» — добавляют ко мнению одного судьи мнения его коллег, то есть пытаются усреднять значения, «сглаживать выбросы». В фигурном катании, художественной гимнастике, прыжках в воду и других сложных дисциплинах для этого буквально отсеивают крайние оценки, расширяя при этом бригаду до 7 или даже 9 человек.
Бокс и ММА пока не добрались до такого уровня — поединки судят всего три человека и разговоры о том чтобы увеличить это число или как-то иначе реформировать судейство широкой публике пока не слышны.
С другой стороны, может быть в реформах и нет необходимости? В конце концов, в единоборствах результат противостояния, в большинстве случаев, довольно легко оценить: мы с детства учимся определять победителя в драке — обычно для этого не нужно прикладывать специальных усилий.
Поэтому наибольшие вопросы у публики возникают в двух случаях: когда судейское решение кардинально расходится с мнением зрителей, а также когда три судьи один и тот же поединок оценивают абсолютно по-разному.
Давайте посмотрим на один из примеров такого полярного распределения оценок и попробуем разобраться, каким правилами руководствуются судьи, чтобы в следующий раз либо не удивляться судейскому решению, либо спорить с ним с хорошими аргументами в руках.
Статистики не достаточно, но это хорошая база
Сделаем это на примере недавнего противостояния бойцов в весовой категории до 77,1 килограмма. Начнем со статистики, с подсчета объективных показателей, ведь они предназначены как раз для того чтобы «приземлять» наши личные впечатления на суровую реальность сухих цифр.
Этот бой прошел всю дистанцию и в нем не было зафиксировано нокдаунов — единичных существенных событий, которые бы кардинально меняли картину боя. Поэтому мы можем смотреть на все показатели, как будто они обладают одинаковой значимостью.
Важно помнить, что судьи оценивают не бой целиком, а каждый раунд, поэтому статистику мы будем приводить в таком же формате. Всю статистику боя мы соберем в две больших категории: ударная и борцовская техника (это будет удобно для сравнения с субъективными критериями оценки).
Ударная техника
Общее количество ударов
Значимые удары
В первом раунде боец из красного угла сделал больше попыток значимых ударов, но точными из них были очень немногие — отдаем локальную его сопернику из синего угла.
Второй раунд также легко рассудить: как по общему количеству, так и по количеству точных значимых ударов победитель очевиден — боец из синего угла.
В третьем раунде картина интереснее: как общее количество ударов, так и количество точных значимых ударов — лучше у бойца из красного угла, но его соперник при этом был чуть точнее. Три «лишних» точных удара и целых 14 лишних попыток оставляют победу в этой категории за спортсменом из красного угла.
Итого, в этой группе статистических показателей счет 3:0 по общему количеству и 2:1 по значимым ударам в пользу спортсмена из синего угла.
Борцовская техника
В этой категории раунды не могут похвастаться большими цифрами, тем интереснее их сравнивать.
Победитель в первом раунде однозначен: спортсмен из синего угла провел единственный успешный тейкдаун, он же в три раза дольше контролировал соперника.
Второй раунд рассудить сложнее — чему объективно отдать приоритет при равном показателе успешных переводов (по одному у каждого бойца), — количеству попыток тейкдаунов, времени контроля или попыткам сабмишена? При субъективной оценке нам может помочь приоритет критериев, но в объективном подходе просто сравниваем по пунктам: в попытках перевода побеждает боец из синего угла, во времени контроля его визави, в попытках досрочного завершения вновь обладатель синей ленты на перчатках. Итого: спортсмен из синего угла первенствует в двух из трех статистических показателях в этом раунде.
В третьем раунде специалисты по статистике не засчитали ни одной успешной попытки перевода, но зафиксировали время контроля у сетки. Объективной разницей в три секунды можно пренебречь, однако разница в попытках (ноль против двух) вполне очевидна, — третий раунд остается за тем же победителем.
В целом, в этой статистической категории спортсмен из синего угла побеждает по раундам со счетом 0:3.
Если бы судьи выносили вердикт на основании этой статистики — каким бы он был? Довольно однозначным. Синий боец побеждает в каждой категории статистических показателей:
При этом с объективной точки зрения для того чтобы зафиксировать такой счет нужен всего один человек и его даже не нужно называть судьей, а сам поединок можно даже не смотреть — цифры говорят сами за себя.
К сожалению, все что мы сейчас здесь проанализировали не имеет почти никакого значения: статистика не доступна судьям, а ведут ли они собственные подсчеты и пользуются ли при этом такими же категориями — мы не знаем. К тому же, простые объективные показатели не могут претендовать на роль единственно верного описания происходящего. Один значимый удар, ломающий нос соперника и вызывающий обильное кровотечение, может сильно повлиять на субъективное впечатление от конкретного раунда и даже всего поединка, а в статистике такой значимый удар будет всего лишь одним из 102 или 112.
Но, если у нас есть сомнения или мы хотим проверить собственные впечатления после каждого раунда или от поединка в целом, то цифры нам вполне могут помочь.
Как на самом деле оценивают поединок судьи
Очевидно, что одним объективным сравнением статистических показателей ни мы, ни судьи не можем ограничиться, поэтому в Единых правилах MMA есть раздел, описывающий субъективные критерии оценки.
При этом правилами четко зафиксирован как предмет оценки, так и порядок:
Первым критерием («Plan A») является эффективность ударной техники и борьбы («effective striking/grappling»)
Вторым («Plan B») — агрессия («effective aggressiveness»)
Третьим («Plan C») — контроль октагона («control of the fighting area»)
При этом в правилах оценки есть, пожалуй, самая важная оговорка: «Критерии второго и третьего порядка принимаются во внимание только если при оценке первого критерия бойцы оказались равны».
Это принцип настолько важен, что ему посвящен еще один пункт, вводящий понятие веса критерия: «Оценка должна проводиться в определенном порядке, описанном в предыдущем пункте, придавая наибольшее значение (вес) оценке эффективности ударной/борцовской техники, и эффективности агрессии, и контролю октагона».
То есть, по сути, нам предлагают расставлять приоритеты в оценках в определенном порядке и применяться эти «веса» должны только если при оценке первого критерия бойцы оказываются равны.
Сложно? На самом деле нет )
Давайте на примере: забудем про статистику и представим, что нам показалось, что эффективность ударной и борцовской техники соперников была одинаковой. Только в таком случае нам стоит оценивать то, насколько был агрессивен каждый из бойцов и как он контролировал пространство.
При этом, если один из бойцов постоянно был в центре октагона и визуально занимал большее количество пространства, но его соперник проявлял больше агрессии (выкидывал множество ударов или проводил попытки перевода в партер), то преимущество получит именно этот боец. Агрессия важнее контроля.
Если же один из бойцов постоянно контролировал октагон, выкидывал кучу ударов, но постоянно промахивался, в каждом раунде проводил по несколько безуспешных попыток перевода в партер… и при этом его соперник реже бил, но чаще попадал и в каждом раунде проводил один успешный перевод, то боец проявлявший больше агрессии и контроля должен проиграть этот раунд. Потому что все остальные критерии не оцениваются, если у одного из соперников есть преимущество в эффективности ударной техники и борьбы.
Как работают критерии
Снова цитаты из правил: «Ударная техника оценивается по тому влиянию(эффекту), к которому привели принимаемы е расчет разрешенные удары». Поэтому при равном количестве ударов, выиграет тот чьи удары будут эффективнее — нанесут больший, субъективно оцениваемый, урон. Может быть поэтому бойцы стараются улыбаться после пропущенных панчей? Играют не только на публику и нервах соперника, но и стараются минимизировать воспринимаемый судьями урон?
«Борцовская техника оценивается по успешности исполнения и влиянию(эффекту) которое оказали переводы в партер, попытки приемов, получение позиционного преимущества и его возвращение», — то есть, опять же, во главе угла именно эффективность и урон.
Боец, который дважды перевел соперника и контролировал его в партере, но никак не повлиял на самочувствие своего противника, — проиграет в судейских глазах, человеку, который сделал один суплекс, после которого оппонент быстро встал, но весь остаток раунда заметно покачивался. Даже не успешная попытка рычага локтя, после которой жертва перестала бить больной рукой должна быть оценена выше, чем три подряд захвата на «гильотину», которые не привели ни к чему, кроме потери бойцами времени в патовом положении.
Примеряем роль судьи
Разобравшись с критериями оценки мы понимаем, что для того чтобы рассудить каждый раунд нам достаточно начать с оценки эффективности (влияния, урона) ударной и борцовской техник соперников. Если в этих аспектах мы сможем в каждом раунде выявить победителя, то остальными критериями мы, согласно правилам, обязаны пренебречь.
Давайте посмотрим под этим углом на сам поединок. Чья ударная и борцовская техника были наиболее эффективны в каждом раунде?
К сожалению, в статистике мы видим разницу между «обычными» и «значимыми» ударами, но такого разделения может быть не достаточно, чтобы зафиксировать настоящий урон, причиненный соперниками друг другу.
Поэтому воспользуемся методологией, предложенной каналом TheWeasel и оценим каждый удар по степени урона как легкий, средний или тяжелый. Средним будем считать хорошее, точное, плотное попадание. Тяжелыми будем признавать удары, которые ведут к существенному изменению состояния соперника и (зачастую) начинают серию действий, которая потенциально может завершить бой (fight finishing sequence).
При этом в отличие от официальной статистики мы не будем считать попытки ударов и удары, которые полностью были заблокированы — т.к. ни то ни другое не наносит урона. Если же блокированный удар все-таки нанес урон, то он окажется в одной из категорий.
Оценка первых двух раундов однозначна — боец из синего угла нанес больше урона в каждом из них. Это видно в прямом эфире и невооруженным глазом.
Третий раунд, судья, который не имеет возможности заглянуть в статистику ударов и не может покадрово разобрать каждый эпизод, вполне может отдать бойцу из красного угла. Будем считать, что один из судей, насчитал больше значимых ударов, а второй оценил эффективность ударной и борцовской техники как равную и применил следующий по значению критерий.
Вот какой результат получается при такой оценке:
Как там у настоящих судей?
И здесь начинается самое интересное — вот как распределилась оценка судей в реальности:
Рик Уинтер (Rick Winter) — 9:10, 10:9, 9:10 — 28-29 — в пользу бойца из красного угла.
Сол Д’Амато (Sal D'amato) — 10:9, 10:9, 9:10 — 29-28 — в пользу бойца из синего угла.
Крис Ли (Chris Lee) — 9:10, 9:10, 9:10 — 27-30 — в пользу бойца... из красного угла!
При этом посмотрите на лицо бойца будущего победителя в том время как ринг-анонсер объявляет последнюю оценку.... Он понимает, что точно не мог выиграть все три раунда, но и не хочет верить, что три раунда отдали его сопернику:
Обратите внимание, что в поединке не оказалось ни одного раунда, мнение судей о котором было бы единогласным.
При этом Крис Ли решил, что Робертс был сильнее во всех раундах! Судя по всему, первый раунд этот судья отдал просто за попытку удушающего треугольника, которая при этом не несла никакой реальной опасности (и даже не была отражена в официальной статистике). Второй раунд, видимо, за агрессию и контроль, а третий за плохо оцененный урон от ударов.
Анализ статистики с которого мы начали, а также доскональный подсчет количества ударов и оценка их урона говорит нам о том, что наиболее точным описанием произошедшего была бы однозначная победа бойца из синего угла. И более вероятным результатом, с учетом несовершенства субъективных оценок судей, — счет 30-27, 29-28, 29-28 в пользу бойца из синего угла.
Это же вывод подтверждается данными сайта mmadecisions.com: журналисты, представляющие независимые профессиональные медиа, отдали Эмееву победу со счетом 29-28 в 10 из 12 случаев, как и 81 % из 152 мнений простых болельщиков.
Поэтому в данном случае, можно утверждать, что если работу Сола Д`Амато можно признать удовлетворительной, то Рик Уинтер и особенно Крис Ли с оценкой поединка не справились. При чем последний провалился на столько, что даже местный комментатор поединка отметил, что «счет 27-30 у многих людей должен вызвать серьезное недоумение».
Объективные трудности и квалификация судей
Мы начали с того, что наибольшие вопросы к судьям возникают, когда они кардинально расходятся в оценках одного и те же события. В чем же могут быть причины такого положения дел?
Первый кандидат — объективные трудности. Сидя в разных точках вокруг октагона, судьи могут плохо видеть происходящее в нем. Действие может быть заслонено для них операторами, рефери в ринге, самими бойцами. Судьи могут видеть замах и траекторию, но не видеть конечной точки, куда пришелся удар. Видеть результат (кровь на лице одного участника поединка), но не успевать рассмотреть точную причину (рассечение у другого бойца). Могут просто не успевать оценить всю последовательность действий, которые происходят и сменяют друг друга с большой скоростью (размен ударами, нюансы борьбы в партере).
При этом возможность видеомониторинга хоть и одобрена атлетической комиссией Невады (штата, где проходил поединок), но остается для судей опциональной. Небольшие экраны на регулируемых подставках могут использоваться судьями, но при желании они могут просто убрать их в сторону.
Во-вторых, корень проблемы может лежать в квалификации судей. Если трое судей оценивают один и тот же поединок, но два из них не соблюдают предписанный порядок применения критериев, каждый отдавая предпочтение разным категориям (контроль и агрессия vs попытки тейкдаунов), то очевидно, что итоговые оценки у них могут быть разными.
Обучение и сертификация, постоянная практика, семинары по обмену опытом — все это должно способствовать постоянному повышению квалификации судей. Но еще больше этому же могла бы способствовать прозрачность оценок и открытость самих судей, их готовность выйти к публике и объяснить свои решения. Способность объяснять простыми словами сложные вещи один из хороших индикаторов того, что человек действительно понимает что, почему и как именно он делает. К сожалению, мы пока не наблюдаем примеров такого поведения.
Главная проблема
Но все-таки кажется, что ближе к истине третий вариант — несовершенство самих критериев и порядка их применения.
В интервью каналу ESPN профессиональный судья MMA Бен Картлидж отмечает, что после изменения критериев в 2016 году они перестали простыми и, в какой-то степени, очевидными и наглядными. Если раньше «тейкдауны выигрывали раунды» или «тот кто сверху, тот и победитель» были валидными эвристиками, то теперь порядок критериев точно определен, но массовая публика об этом не знает — поэтому результат работы судей может сильно расходиться с впечатлением, которое складывается у зрителей.
Сами критерии стали более точными и их применение стало для судей более однозначным: сначала оцени эффективность/ущерб, и только при равенстве все остальное. Но возможно, тот факт, что массовая публика плохо разбирается в этих критериях как раз и означает, что они не лучшим образом описывают происходящее.
Более того, если на примере конкретного поединка мы смогли показать, что, судя по всему, даже профессиональные судьи могут сталкиваться с трудностями в правильном применении порядка оценивания — это хороший индикатор, того, что применение этих критериев в описанном виде — не такая простая задача даже для профессионалов.
И, на самом деле, это легко объяснить. Поединок по правилам смешанных единоборств — очень сложная ситуация, с большим количеством влияющих друг на друга событий. При этом совокупность этих событий создает у любого человека (не важно, зрителя, тренера, бойца или судьи) цельное впечатление, которое далеко не полностью определяется эффективностью ударов и борьбы.
На общее впечатление от поединка влияют все произошедшие события, поэтому, когда правила предписывают не принимать во внимание часть из них, а другую оценивать только по одному критерию — это противоречит психологии людей.
Мы не умеем в режиме реального времени раскладывать поединок на мельчайшие составляющие и выбирать из них для оценки только отдельные элементы. Поэтому, когда мы заставляем судей оценивать происходящее, отбрасывая 60-80 процентов всех микро-событий и принимая во внимание только 20-40 самых значимых, — мы обрекаем их на два исхода: совершение ошибки (когда судья не справляется со своей человеческой природой) или вынесение вердикта, который не совпадает с впечатлением обычных зрителей.
Представьте, что после отпуска, который ваш знакомый провел путешествуя по нескольким городам, вы спросите у него, какой из населенных пунктов ему понравился больше всего и почему, а в ответ услышите, что лучшим ему показался тот, в котором влажность воздуха была на пять процентов меньше, чем в остальных. Кого угодно удивит такой ответ, а между тем именно такие, по своей сути, ответы мы видим каждый раз в судейских записках. Безусловно, эффективность важнейший показатель, но он не может полноценно описать происходящее в октагоне, так же как разница в уровнях влажности не может полностью описать разницу впечатлений от двух городов.
Что с этим делать? Авторам правил — дорабатывать описание и порядок применения критериев. Нам с вами — внимательно читать правила, разбираться в том, как судьи должны оценивать поединки, и тренироваться в такой же оценке — повышать свое разрешение, чтобы получать еще больше удовольствия от любимого спорта и при этом точно знать, когда и почему конкретного судью стоит «отправить на мыло».
— Судейство в каком поединке вызвало у вас наибольшее удивление за последнее время?
А вообще по части критериев - в голову приходит бой Альдо-Мораес. Тогда люди искренне не могли понять, почему идущий вперёд три раунда Альдо проиграл убегающему Мораесу. Но, как хорошо показывает пост, идти вперёд недостаточно))