10 мин.

Олимпийский детектив. Кто кого ограбил на льду Пхенчана

Отзвучали последние аккорды Анны Карениной и Евгения Медведева не сдержала эмоций, расплакавшись прямо на льду. Через минуту надежды на золото королевы драмы раздавит поезд имени Алины Загитовой - 15-летняя дебютантка стала олимпийским чемпионом. Ирония судьбы: в олимпийском профиле Загитова назвала своим героем, наряду с Алиной Кабаевой, Евгению Медведеву.

Следом за апсетом года в социальных сетях и медиа поднялась буря протеста. Негодующие звезды, эксперты и просто фанаты Медведевой плакали в прямом эфире, свистели на трибунах и кричали  об ограблении четырехлетия с экранов ТВ, страниц газет и журналов.

Ждать долго, когда поднимется ответная волна, не пришлось. Сторонники олимпийской чемпионки объявили, что их кумир - победитель "вопреки", сокрушившая не только сопротивление конкуренток на льду, но и противодействие собственной национальной Федерации, поддержавшей в очной схватке свою давнюю фаворитку.

azem

А судьи кто?

В этой публикации я проведу расследование на тему предвзятости судей к Медвегитовой и выясню кого гнобили судьи в Пхенчане. Вообще, фанаты способны различать только белое и черное, брызгать эмоциями и кричать "я так вижу".   Пора ответить на вопрос предельно честно , опираясь на цифры, факты и доказательства. Сектантский дальтонизм лечить собираюсь математикой. Если будет казаться, что текст перегружен таблицами и техническими деталями, то все так и задумано. Хочешь что-то заявлять в белый свет, делай это с ответственностью. Короче, вычисления будут, чтобы вы не думали, что автор гонит джинсу.

Место преступления — это таблица результатов[Scores table] прокатов фигуристок. Я ее немного доработал, чтобы подготовиться к расследованию.

TSS - окончательные баллы, которые пошли в зачет спортсменам.  Это сглаженное значение, которое получается из среднеарифметического значения по набору оценок судей, из которого исключили экстремальные значения.

Mean - простое среднее арифметическое судейских оценок без всяких сглаживаний. Я буду работать именно с этим параметром, чтобы узнать истинное мнение судей без искажений.

Std - среднеквадратичное(стандартное) отклонение, которое показывает рассеяние значений множества, по которому его вычисляют. Н-р, для множества [1, 2, 3] среднеарифметическое составит Mean = 2, и у набора [-100, 6, 100] точно такое же среднеарифметическое Mean = 2, хотя эти множества по характеру значений кардинально отличаются друг от друга. Эту разницу и покажет стандартное отклонение Std, которое составит в первом случае 1, во втором 100.06.

Раскраска по строкам с оценками фигуристкам — это тепловая шкала от красного к белому, от минимальной оценки к максимальной выставленной спортсменке.  Градиент по столбцу Std выполнен наоборот от максимального к минимальному значению.

Scores

На этом вводная часть закончена, пора начинать, собственно, расследование. Можно сразу присмотреться к стандартному отклонению оценок. У Алины Загитовой очень маленькое стандартное отклонение Std, что говорит об единодушии судей при оценке ее выступления. Значит ее баллы вполне заслуженны и сомнению судьями не подвергались. По Евгении судьи немного разошлись во мнениях, но ничего криминального нет. Сравните со стандартным отклонением Келайни Крейн, у которой оценки пляшут от 52 до 63.

Также сразу можно увидеть, что Алине минимальные баллы выставили судьи Deck и Jiang, а Fomina, Guskov и Abele выставляли средние оценки. Еще Fomina, Guskov и Abele выставляли высокие оценки Жене, а Deck и Jiang выставили ей опять минимальные. На первый взгляд получается, что американский и китайский судьи злодеи, а русский арбитр честно отсудил обеих спортсменок. Можно успокоиться и закрыть дело об ограблении за отсутствием состава преступления.

Но если приглядеться, то увидим, что Deck и Jiang сами по себе довольно жесткие судьи. Они всем девушкам из верхней половины ставили меньшие по сравнению с коллегами оценки. Deck исключение сделал только для соотечественниц, а судья Jiang  - для азиаток и божественной Каролины.

Получается, что у каждого арбитра  есть свой оригинальный стиль судейства, значит нам нужно выяснить насколько оно отклоняется от мейнстрима ака истинной оценки фигуристки. Если не забыли, истинная оценка — это среднеарифметическое значение Mean. Составлю новую таблицу [Differences table], где распишу отличия выставленной судьей оценки от истинной. Эту разность назовем отличием.

Differences

Здесь наглядно видно, что Deck и Jiang усердно минусовали обеих соперниц. Fomina, Guskov и Abele Алине выставили заслуженные оценки, а вот Женю они очень любят. В таблице отличий мы можем увидеть, кого любят и ненавидят судьи.

Цель исследования - сорвать маски с членов жюри и увидеть их истинные намерения. Для этого понадобятся кое-какие критерии адекватности судейства.  Для этого я вычислил среднее значение отличий судьи Judge Mean и стандартное отклонение отличий Judge Std. Среднеквадратичные отклонения у всей панели более-менее ровные.

Для общей картины пригодится дисперсия Judge MSE, которая отражает характер разброса оценок судьи относительно истинных оценок фигуристок. Вычисляется дисперсия именно по баллам, а не по значениям отличий. Эта сравнительная характеристика показывает адекватность судьи как оценщика в сравнении с его коллегами.

Как видим, очень ровно судит словацкая судья и ее суждения не расходятся с истинными оценками спортсменок, а вот Deck, Jiang и Guskov очень нестабильны и риск выставления ими незаслуженной оценки очень высок. Fomina и Abele середнячки и их поведение не выделяется на общем фоне. Значит ли это, что американец и китаец все-таки и есть те злодеи, на которых идет охота?

Давайте подумаем еще. Deck мог просто заснуть на клавиатуре и случайным образом выставлять оценки. Слабое Judge MSE может отражать лишь темп его похрапываний. Или можно сделать более реальный вывод, что Deck очень строго судит сильных фигуристок, а вот более слабых он поддерживает не только морально. Ба, Deck - добряк с обостренным чувством справедливости. Еще он патриот. Судья Jiang  вообще может быть расистом, есть такое подозрение. К тому же они были на виду с самого начала. В хороших детективах обычно такие подозреваемые на самом деле чисты, как утренняя роса. А вот злодеи рядятся в ангельские одежды и скрывают свои преступные наклонности.

Для продолжения расследования требуется сузить область поиска. Предвзятость судьей не распространяется сразу на всех спортсменок по определению.  Поэтому логично сосредоточиться на конкретных  соперницах, чьи судьбы решались на корейском льду. Составим таблицу отличий для призеров олимпиады и вычислим те же судейские критерии [Differences table].

Bias

[Personal chart] - таблица, которая отражает, как каждый судья лично для себя расставлял фигуристок по местам.

Картина резко изменилась. Появились новые подозреваемые Kozuka, Fomina, Guskov  и Abele с большими стандартными отклонениями  Judge Std. Deck можно освободить из-под стражи, поскольку мы видим, что стандартное отклонение Judge Std для лидеров у него мизерное. Judge MSE отражает лишь его чрезмерную жесткость в сравнении с коллегами, но предвзятости к медалисткам у него нет. Jiang  так же никого не выделяет из Медвегитовой.

Судья Fomina (RUS) честно поставила заслуженную оценку Загитовой, Медведеву просто обожает, а вот Кейтлин Осмонд она хладнокровно пристрелила. За канадку вступились японка и кореянка, при этом к Алине и Евгении они вполне нейтральны. Поэтому оставим их в покое.

Бросается в глаза забавная согласованность действий троицы Fomina, Guskov  и Abele: честные оценки Алине, грибы Жене и расстрел Кейтлин. Причем только они поставили Медведеву на первое место, остальные шесть арбитров отдали предпочтение Загитовой [Personal chart].

Интерпретация выявленных аномалий: ФФКР ( в лице судьи Fomina и дружественных судей из СНГ) хочет сделать на Олимпиаде дубль 1-2, причем в плане человечка на высшей ступени пьедестала отдает явное предпочтение Евгении Медведевой перед Алиной Загитовой. Для этого они нагло грибуют Женю, честно оценивают Алину ( минуснуть не могут, чтобы не уйти под Осмонд) и жестко гнобят бедную Кейтлин. Мне кажется, что именно фактор Осмонд, как угрозы серебру, сильно повлиял на расклад оценок российских спортсменок.

Кажется, предвзятые судьи в отношении соперничества Алины и Жени выявлены. Возникшие подозрения требуется подкрепить уликами. Для этого я введу параметр предвзятости судьи Bias, определяемый как разность отличий судьи от истинных оценок фигуристок, и распишу в новой таблице [Bias table]. Показатель предвзятости  таким образом есть мера любви и ненависти судьи в отношении двух соперничающих спортсменок. Например, для судьи Fomina (RUS)  Bias в отношении Медвегитовой составит 0.51-2.78 = -2.27.

Естественно, число предвзятости само по себе ничего не говорит. Надо выяснить, что оно означает. Самое время провести перестановочный тест - требуется взять все тридцать оценок судьи Фоминой из короткой программы, взболтать и смешать. А потом необходимо поочередно выставлять оценки двум обезличенным фигуристкам и для каждой пары оценок вычислять предвзятость.  Всего будет 870 перестановок без повторений. Далее остается выполнить частотный анализ по значениям предвзятости Фоминой и посмотреть, где находится значение Bias по Медвегитовой равное -2.27.

Распределение частот предвзятостей [Bias Frequency] у Фоминой получилось в форме колокола - распределение вполне нормальное - а значит судья выставляет оценки в здравом уме и твердой памяти. И теперь видно, что меньшее или равное значение предвзятости Фомина демонстрировала только в 179 случаях из 870, т.е. примерно в 21%.Если разделить девушек на 5 групп по степени любви и ненависти к ним Фоминой, то это эквивалентно тому, что принцесса противостояла золушке. Напоминаю, что речь идет о спортсменках не только из одной страны, но и  ученицах одного тренера, которые вели упорную борьбу за олимпийский титул. Тем не менее разница налицо. Абеле и Гусков демонстрируют такой же неадекватный уровень предвзятости по отношению к подругам-соперницам.

Bias

Для произвольной программы просто повторю все, построив аналогичные таблицы и графики . Здесь результаты уже другие. Стандартное отклонение у Алины опять меньше, чем у других медалисток, по Осмонд установлен рекорд по отклонениям. Вот такой вот большеглазый канадский лебедь раздора.

scorefp

Таблица отличий[Differences table]. Fomina на этот раз грибует Алину, нагло грибует Евгению, а с Кейтлин  она вытворяет дикие вещи - минус 7.13 от истинной оценки канадки. Но рекорд все-таки побит французским судьей Louesdon выставившим Осмонд минус 8.33. Однако в отличие от короткой программы в панели появился канадский арбитр, который защищал свою подопечную. Странно, что ISU не поставил в КП судью из страны одной из претенденток на медали, но зато дали судить Абеле, первой в истории фигурного катания латвийской судье на Олимпийских играх, в обеих программах.

Differencesfp

[Differences table] для призеров олимпиады. Fomina снова отличилась большим стандартным отклонением.

Medalistfp

Причем в произвольной программе Fomina уже не делает предпочтений между Загитовой и Медведевой, сосредоточившись на борьбе с канадской угрозой. Abele же минуснула Загитову. 

Biasfp

Выводы

По итогам произвольной голоса судей разделились - пятеро арбитров отдали предпочтение Алине, четверо выбрали Евгению. Раздельное судейское решение, равенство очков, дополнительные показатели - длинная программа оказалась не определяющей. Исход борьбы за золотую медаль решил рекорд Загитовой в короткой программе, где она без вопросов была лучшей. С этим не согласились только судьи из России, Казахстана и Латвии, причем степень их несогласия не была адекватна ситуации (уровень предвзятости у всех троих около 20%). Кому свистим, дамы и господа? Тут все предельно ясно. Q.E.D.

end