Поиски букмекерского Святого Грааля, начало
Раз уж на меня после первого поста аж 70+ человек подписалось, решил со вторым не затягивать, тем более, что материал для него был уже готов.
Я ставками интересовался лет с 16, играл по мелочи, что-то выигрывал, чаще проигрывал, а о том, что к этому всему можно применить научно-статистический подход, задумался лишь в последнее время, когда ставить-то уж лет 5 перестал совсем. Зато задумался серьёзно и принялся за поиски букмекерского Святого Грааля, под которым я понимаю такую модель ставок, которая позволит, не разбираясь в чисто спортивных обстоятельствах, предшествующим матчам, а ориентируясь только на математические расчёты, предсказывать их результат и выигрывать.
От построения сложных моделей с использовниям хитроумных статистических методов я (впрочем, пока?..) отказался, в силу того, что букмекеры, в любом случае, разбираются в этом лучше, и уж оценить, кто в матче фаворит, наверняка смогут точнее меня (если не брать во внимание случаи: "Жопой чую, так будет, надо ставить!"). Поэтому мысль, которая меня посетила, была такой: нужно привязаться к букмекерским коэффициентам, их истории, и на основе точных прогнозов буков и их ошибок постараться что-то предказать.
Первой задачей было достать историю этих самых коэффициентов. Точнее, даже с того, что я на них наткнулся, изучая статьи по языку R, всё и началось. Существует несколько отличных сайтов с данными по многим турнирам, их результатами и коэффициентами на них, например:
http://www.football-data.co.uk/ - чемпионатов мало, зато данные подробны и представлены в практически идеально подходящем для обработки виде .csv-файлов
http://www.oddsportal.com/ - много видов спорта, но данные представлены не слишком удобно, нужно или долго ковыряться руками, или писать скрипты для web-scraping'а (чего я, например, пока не умею, но планирую научиться)
http://www.sportstats.com/ - почти то же самое, только видов спорта и чемпионатов меньше, более глубоко в разницу не вникал
Следующим делом я посмотрел, как буки угадывали исходы европейских футбольных топ-чемпионатов. Ожидаемо оказалось, что втупую ставить на наиболее вероятные по их мнению исходы невыгодно. Однако отдельные команды способны, при таком подходе, систематически приносить прибыль. В нижеприведённых таблицах значения - это прибыль по итогам сезонов, если за единицу брать ставку на один матч.
По домашним матчам:
По выездным:
Но, конечно, гарантий никаких, что так и в будущем будет продолжаться, да и год на год не приходится, поэтому я решил данной темой на практике не пользоваться.
Также была попытка выбрать матчи не конкретных "прибыльных" команд, а команд с наилучшими показателями предсказуемости за 3-5 предыдущих сезонов. Моделирование и прогон модели на сезонах 12-15 гг. показали несостоятельность такого подхода: на некоторых командах можно заработать, но другие легко утягивают всю схему в минус.
Ещё пытался смотреть не на команды, а на интервалы коэффициентов, с расчётом, что, может, на самых очевидных (или, наоборот, неочевидных) матчах можно заработать. А потом это ещё и с командами совместил. Всё равно не каждый год выгодно получается, потому рисковать не хочется.
Очередной тупиковой веткой оказалась попытка подловить букмекеров на стартовом отрезке чемпионата, взяв исторические данные только по первым 5-ти турам.
Аналогично дела обстоят с распространённой схемой игры в догоны на ничью: если повезёт, что-то заработаешь, если нет - разоришься к чертям, проверено математикой. Точнее, возможно, и реально заработать, найдя алгоритм выбора команды для такой игры, но, например, наиболее "ничейные" на протяжении нескольких сезонов команды периодически выдают длительные серии без ничьих.
Таким образом, на данный момент Грааль за тридевять земель от меня, однако есть ещё одна задумка для модели, о которой, в общих чертах, я расскажу, когда пойму, насколько она рабочая.
Буду рад отзывам-замечаниям-советам-благодарностям, не стесняйтесь!
а кто, например? я блоги ставочные здесь не читал ещё.
по моему глубокому убеждению никогда нельзя опираться на статистику. ибо НИКОГДА не совпадают все значимые факторы новой игры и прошлых - вплоть до судьи и погоды.. не говоря о составах, тренерах, календарной усталости, текущей мотивации и прочее-прочее.
Если и можно выстраивать стратегии опираясь на какие-то цифровые модели, то только на динамике коэффициентов, что некоторые блоггеры и пытаются и тут на сайте тоже.делать
На moneypunter’e тебя нет? Там сидят любители ботостроительства.
Несколько выше коэфф. на "осечку фаворита". Как бы ни была "Бавария" или "Барса" крута, ВСЕ матчи чемпионата не выиграет. В Англии вообще нет ярко выраженного гегемона, тот же "великий "Челси" начал чемпионат с двух "осечек".
По динамике коэффициентов. На том же oddsportal.com есть раздел dropping odds (падающие кф.), где фиксируется резкое падение кф. на событие. Но, насколько я понимаю, это не значит, что букмекерам стало что-то такое известно (хотя, не исключено), что изменит баланс сил, а свидетельствует о том, что на какую-либо из команд идёт больше ставок, и надо снизить кф., сохраняя маржу.