Турнир прогнозов Elite // Итоги Кубка Стэнли
Больше приколов можно найти в моём блоге.
В конце поста бонус — планы по развитию на следующий год.
А сейчас приветствуем лидеров!
Среди 28 участников моего первого турнира (каждого из которых я благодарю)
3 место в упорной борьбе разделили waleragrewzew и Pokerok (с результатом 25,3%). Поскольку мной не объявлены дополнительные показатели при равенстве очков, они делят приз и получают по 500₽ 🤝
Заслуженное 2 место и 2000₽ — kostya187 (27,3%), который весь турнир шёл в лидерах!
1 место
3000₽, звание риск-аналитика и лучшего эксперта дифференцированных прогнозов Кубка Стэнли 2024 получает Vertil с показателем точности 30,3%!
Продвинутые метрики
Пора понять, кто был ювелирно точен, а чьи прогнозы зашли на халяву.
В спорте не существует предопределённых исходов, невозможно знать будущее наверняка, поэтому подвергнем критическому анализу красивые попадания участников в результат «соткой» и многочисленные нули при неожиданных результатах серий (привет, Флорида-Тампа, Виннипег-Колорадо, Флорида-Эдмонтон).
Медиана
Позволяет увидеть, у кого очки набраны равномерно и постепенно, а кто поимел несколько больших выигрышей (которые могли быть случайными). Медиана — это «обычный» выигрыш участника, в нашем турнире в основном равняется 20-30.
Недостаток медианы — нечувствительна к крупным прогнозам (ставящий по-крупному, имеет низкую медиану, яркий пример — alex023, которому кстати не хватило 5 очков до 3 места).
Пример расчёта: возьмём выигрыши alex023 (15 серий плей-офф), и отсортируем. 0, 0, 0, 0, 0, 10, 10, [15], 20, 30, 40, 50, 50, 50, 100 Число посередине, 15 — и есть медиана.
Средняя ошибка
Тут всё просто, ошибка — это разница в числе матчей, насколько участник промахнулся в прогнозе. Между 4:1 и 4:2 разница — 1 матч. Между 4:2 и 3:4 разница — 2. Максимальная возможная ошибка — 7, а у нас в турнире топ ошибок выглядит так:
Пример расчёта: ставка 60 на 4:2 и 40 на 2:4, серия закончилась 4:3. Ошибка error = (1*60 + 2*40) / 100 = 1,4. Чем меньше, тем лучше.
Стандартное отклонение (ошибка²)
Почти то же самое, только для каждой ставки берётся ошибка в степени 2. Позволяет увидеть тех, кто не совершал больших ошибок (например ARAMIS777, лидер по этому показателю)
Пример расчёта: ставка 30 на 4:1, 50 на 4:2 и 20 на 4:3, серия закончилась 4:3.
Однако, эксперты могут возразить — исходы 4:2, 2:4 более вероятны, чем семь матчей, а расположены не рядом, что приводит к большой ошибке = 3. В большинстве ситуаций для команды-лидера победа в 7 матчах вероятнее, чем проигрыш 2:4, поэтому не логично ставить только на два отдалённых исхода — 4:2 и 2:4. При счёте 2:2 наиболее вероятные исходы — 4:2, 4:3, и только потом 2:4 (проверено на исторических данных). Так что величина ошибки — неплохой показатель точности прогнозов. Однако, при счёте в серии 2:3, гости вероятнее всего выиграют 2:4, либо проиграют в 7-м матче. Счёт 3:4 в таком случае менее вероятен и лучше ставить на исходы, отдалённые друг от друга (4:3, 2:4), что ведёт к накоплению величины ошибки.
ROC AUC [рок аук]
Позволяет решить эту проблему. Метрика используется для оценки качества моделей машинного обучения, но её можно применить и для нашей цели, чтобы выяснить, кто из нас машина по предсказанию исходов 🔥🚘🔥
Если кратко, ROC AUC отражает баланс в прогнозах, и позволяет сравнивать участников с разными тактиками. Метрика снижена у тех, кто слишком «распыляется» мелкими ставками, либо промахивается по-крупному. Также позволяет увидеть, кто заработал очки на халяву (тогда AUC меньше, чем у соседей по таблице).
Кривая ROC наглядно показывает предсказательную способность участников. Метрика AUC равна площади под кривой ROC. Значение 0,5 соответствует диагонали на графике и случайным предсказаниям (если поставить на все исходы серии по 12,5 баллов (100 / 8)). Качество прогнозов определяется тем, насколько кривая выгнута в сторону верхнего левого угла, максимальное значение ROC AUC равно 1.
Чья кривая расположена выше в левой части, тот отлично угадывал крупные ставки (> 40). Чья кривая выше в центре, тот стабильно и качественно выигрывал по 20-30 баллов. Если вы заинтересовались, можете углубиться в тему.
Прерывистые линии у тех, кто поставил не на все серии турнира:
Пример расчёта в python: roc_auc = sklearn.metrics.roc_auc_score(result_vector, prognosis_vector), куда передаются векторы результатов серий и прогнозов участника (15 серий * 8 исходов = 120 элементов в каждом векторе).
Можно заметить, что метрика ROC AUC высока у долго лидировавших участников. Те, кто рискнул и вырвался в лидеры в конце турнира, имеют меньший ROC AUC. Мне это видится наиболее справедливым признаком мастерства, так что я планирую в следующем году...
Планы
Определить победителя общего турнира по метрике ROC AUC, лучший по очкам также будет награждён
Запустить платный турнир (со взносом 500 или более). Призовой фонд получит четверть участников, лучших по очкам
Увеличить собственный призовой фонд общего турнира в несколько раз. Напомню, в этом году 6000₽ были разыграны между 3 призовыми местами. Собираюсь наградить призами 13 человек (необычным способом, но об этом в следующем году)
Запустить турнир по Кубку Гагарина (призовой фонд не обещаю, т.к. НХЛ люблю сильнее)
Прошу лидеров минувшего турнира написать мне в л.с. sports.ru или fantasy-h2h.ru реквизиты и соответствующее имя для получения приза
Насладиться финальными результатами можно здесь
Но эти ва-банки мне не очень нравятся, — русская рулетка)
А вот по метрике AUC точно нельзя случайно оказаться в топе, она чувствительна к риску. Конечно сложно это объяснять на пальцах, но буду пробовать