3 мин.

Поиски букмекерского Святого Грааля, начало

Раз уж на меня после первого поста аж 70+ человек подписалось, решил со вторым не затягивать, тем более, что материал для него был уже готов.

Я ставками интересовался лет с 16, играл по мелочи, что-то выигрывал, чаще проигрывал, а о том, что к этому всему можно применить научно-статистический подход, задумался лишь в последнее время, когда ставить-то уж лет 5 перестал совсем. Зато задумался серьёзно и принялся за поиски букмекерского Святого Грааля, под которым я понимаю такую модель ставок, которая позволит, не разбираясь в чисто спортивных обстоятельствах, предшествующим матчам, а ориентируясь только на математические расчёты, предсказывать их результат и выигрывать.

От построения сложных моделей с использовниям хитроумных статистических методов я (впрочем, пока?..) отказался, в силу того, что букмекеры, в любом случае, разбираются в этом лучше, и уж оценить, кто в матче фаворит, наверняка смогут точнее меня (если не брать во внимание случаи: "Жопой чую, так будет, надо ставить!"). Поэтому мысль, которая меня посетила, была такой: нужно привязаться к букмекерским коэффициентам, их истории, и на основе точных прогнозов буков и их ошибок постараться что-то предказать.

Первой задачей было достать историю этих самых коэффициентов. Точнее, даже с того, что я на них наткнулся, изучая статьи по языку R, всё и началось. Существует несколько отличных сайтов с данными по многим турнирам, их результатами и коэффициентами на них, например:

  • http://www.football-data.co.uk/ - чемпионатов мало, зато данные подробны и представлены в практически идеально подходящем для обработки виде .csv-файлов

  • http://www.oddsportal.com/ - много видов спорта, но данные представлены не слишком удобно, нужно или долго ковыряться руками, или писать скрипты для web-scraping'а (чего я, например, пока не умею, но планирую научиться)

  • http://www.sportstats.com/ - почти то же самое, только видов спорта и чемпионатов меньше, более глубоко в разницу не вникал

Следующим делом я посмотрел, как буки угадывали исходы европейских футбольных топ-чемпионатов. Ожидаемо оказалось, что втупую ставить на наиболее вероятные по их мнению исходы невыгодно. Однако отдельные команды способны, при таком подходе, систематически приносить прибыль. В нижеприведённых таблицах значения - это прибыль по итогам сезонов, если за единицу брать ставку на один матч.

По домашним матчам:

t1

По выездным:

е2

Но, конечно, гарантий никаких, что так и в будущем будет продолжаться, да и год на год не приходится, поэтому я решил данной темой на практике не пользоваться.

Также была попытка выбрать матчи не конкретных "прибыльных" команд, а команд с наилучшими показателями предсказуемости за 3-5 предыдущих сезонов. Моделирование и прогон модели на сезонах 12-15 гг. показали несостоятельность такого подхода: на некоторых командах можно заработать, но другие легко утягивают всю схему в минус.

Ещё пытался смотреть не на команды, а на интервалы коэффициентов, с расчётом, что, может, на самых очевидных (или, наоборот, неочевидных) матчах можно заработать. А потом это ещё и с командами совместил. Всё равно не каждый год выгодно получается, потому рисковать не хочется.

Очередной тупиковой веткой оказалась попытка подловить букмекеров на стартовом отрезке чемпионата, взяв исторические данные только по первым 5-ти турам.

Аналогично дела обстоят с распространённой схемой игры в догоны на ничью: если повезёт, что-то заработаешь, если нет - разоришься к чертям, проверено математикой. Точнее, возможно, и реально заработать, найдя алгоритм выбора команды для такой игры, но, например, наиболее "ничейные" на протяжении нескольких сезонов команды периодически выдают длительные серии без ничьих.

Таким образом, на данный момент Грааль за тридевять земель от меня, однако есть ещё одна задумка для модели, о которой, в общих чертах, я расскажу, когда пойму, насколько она рабочая.

Буду рад отзывам-замечаниям-советам-благодарностям, не стесняйтесь!