Сигналы и шум
Люблю читать...
Сейчас читаю книгу "Сигналы и Шум" господина Нейта Сильвера.
Вообще много всего прочитал, например, учебник по теории вероятности два раза, статистике раза три. :) то есть есть с чем сравнивать.
Эта книга, как и большинство импортной литературы написана в стиле: одна здравая мысль омывается литрами воды из разных источников. Мне лично заходит довольно не плохо такая манера подачи информации. Читается достаточно легко, ну и основная мысль книженки усваивается.
Книга, как ни странно, посвещенна прогнозам, и основная мысль в том, что в мире огромное количество информации, которая максимиум, что может дать это понятие о самых общих тенденциях процесса. и является по сути шумом засорящим эфир. а есть информация, которой, мало и именно она является сигналом указывающим на реальную тенденцию, назовем это так. И основной задачей в прогнозировании, опять же по мнению автора, является верное отделение сигналов от шума.
Есть в книге и множество моментов посвященных ставкам на спорт и спорту. Читаю отрывками, начал с главы 8, поэтому и приведу пример от туда. Там рассказывается о американском капперке Бобе Вулгаресе, которые чудом поднялся на шальной ставке Ва-Банком на Лейкерс с диким перевесом над линией. После этого он стал ставить уже в соотвествии с БРМ и на плаву до сих пор. Секретом его называется то, что после того как его машинка определяет общую вероятность события на основе основной массы информации, в числе которой и просто шум, и дает ему список событий с минимальным перевесом по её мнению. Далее уже Боб, который очень внимательно следит за НБА и даже, якобы обладает небольшой аналитической службой, шлифует прогноз на события ищя перевес над линей с помощью информации-сигнала. Для разных типов ставок, информация может быть разная: от востребованности одним из игроков в хорошем контракте на следующий сезон до записи в инстограмме о вечеренки у одного из игроков. В этой же главе в общих чертах указывается как к этому прикрутить модельку на основе теоремы Байеса.
Букв написал уже много, а только подошел к сути поста. :)
Так вот, совпали два события.
1. Я решил собрать пул информации на основании которой можно оценивать вероятность исхода в событии;
2. Я начал читать эту книгу.
Эти два события дали мысль попробовать оценить весь пул идей через критерий "шум/сигнал". Особенно это будет интересно в рамках того, что Я хотел зафигачить модельку в прямом эфире и её публично потестить.
Мною и коллегой Колпинским https://www.sports.ru/profile/5120112/ определены следующие информационные потоки, на основании, которых строится вероятность наступления футбольного события.
1. Последние результаты команд дома/на выезде. Данная информация позволяет определить общие тенденции, общую инфу она даст, перевес нет. В целом это шум.
2. игра против забивных/ не забивных команд, хорошо/плохо обороняющихся. Нуууу такое... по средним значениям однозначно оценивается буками и является шумом, если эту статистику персонифицировать и уточнить, то она может стать сигналом, т.к. попаны так глубоко не роют.
3. наличие/отсутсвие основных игроков. На мой взгляд эта инфа слабо учтена в ранней линии и является сигналом и уже полностью учтена в поздней линии и является шумом.
4. отставки тренеров. в ТОПовых лигах - однозначно шум, т.к. сразу отражается инфа в линии. В низших лигах может слушить и сигналом. 50/50 в целом оцениваю.
5. влияние календаря. в целом ближе к шуму, т.к. буки так же изночально закладывают это в кефы.
6. погода. Экстремальные отклонения типа температуры -20 градусов или сильный ветер в сторону одних из ворот однозначно сигнал.
7. совпадение интересов команд. Вроде сигнал. Если владеть этой информацией в полной мере, то можно очень неплохо наживать, но добыть информацию в низких лигах по этлому вопросу сложно.
Факторы взятые у коллеги.
8. принципиальность матча - дерби. Считаю, что это сигнал, при разном урове команд, например, недавняя игра Марсель-ПСЖ. но шум при равном уровне команд, например, Спартак-ЦСКА.
9. время матча. С этим уже все современные клубы научились бороться, поэтому отнесу к шуму.
10. Судья. При наличии тенденций в манере судейства, однозначно сигнал.
Вроде бы все из того что было написано и все в целом находится на поверхности. Совсем не взяли мы такие факторы, которые определяют уровень и класс игры: количество ТТХ команды, километраж, которые выдают игроки, умение реализовывать стандарты, умение играть против автобусов и прочих тактических упражнений. Всё перечисленное в этом абзаце может дать сигнал и соответственно перевес. Но где собирать эту статистку, а собирать её нужно автоматизированно, Я не знаю и использовать, наверное, ни когда не буду.
Пока, наверное, хватит. Много мыслей появилось в голове. Теперь нужно попробовать все факторы оцифровать, прикрутить к реальным событиям и потестить. Займемся этим в ближайшем будующем.
пока все.
Можете почитать и оценить синергию чтения, ставок и графоманства. :)