Начался новый год... и новый охотничий сезон НБА - 2019.20
Всем - здравствуйте !!!
После очередного и традиционно долгого отсутствия блог возобновляет свою работу. Вернее, ее публичную часть. Непубличная и не думала прекращаться. Работа над новым сезоном началась через мгновение после окончания предыдущего. Два компьютера практически не выключались не только все межсезонье, но и прихватили еще и месячишко из нового сезона. Таков был обьем вычислений.
Качественная баскетбольная аналитика, как мне кажется, требует обязательного вычисления предполагаемого счета предстоящего матча. Без этого она не более чем болтовня. Все и всегда "пляшется" от линии. Вот как бы ни был крут или плох какой-либо командный показатель, в линии запросто может оказаться цифра намного круче или намного хуже. Поэтому сам по себе никакой показатель ничего не значит, только в сравнении. Одна и та же цифра 100 одновременно является большой по сравнению с 80 и малой по сравнению со 120. Поэтому то что "нарисовали" в линии подлежит обязательному сравнению... что бы было с чем - нужно считать...и, хочешь сделать хорошо - делай сам.
Это не просто. Что работает лучше - сезонный расчет (все матчи) или раздельный (только домашние/только гостевые) ? Может и то и другое, а потом смешать ? Если да, то в каких пропорциях ? И как глубоко "копать" - брать все матчи, последние десять или может быть всего пять ?...и т.д. и т.п. .....
Ответить мог только эксперимент. Просто взять и перепробовать все возможные варианты !!! А потом отобрать лучшие.
Так и поступил. База для расчетов есть - на протяжении нескольких лет собирал свой статистический архив. На данный момент это что-то около 60 000 прогнозов для проверки каждого варианта расчетов. Нехилая цифра, и в переносном и в прямом смысле - при самом простом "базовом" способе расчета компьютер с четырех-ядерным процессором тратил на один вариант около 12 часов времени, а на более тяжелый в смысле количества цифр "продвинутый" способ нужны были целые сутки !!! А очередь на проверку состояла из многих сотен вариантов !!! Представляете ???... Все лето и всю осень два компьютера трудились практически в круглосуточном режиме... и этого не хватило !!! Более-менее перебор был закончен примерно через месяц после начала сезона в НБА.
Результаты неоднозначны... Расчеты показали, что некоторым надеждам сбыться не суждено...а некоторым дана вторая жизнь. Списанный мной ранее способ расчета показал более высокую эффективность, чем тот на который я его заменил. Просто ему была нужна другая дистанция расчета... Игнорируемый ранее из-за кажущейся примитивности "базовый" способ при определенных условиях (дистанция расчета, процент смешения) оказался более конкурентоспособным, чем я предполагал ранее.
Изобретен новый, уже четвертый способ прогнозирования (суть ясна из названия - "трендовый") и его эффективность подтверждена практикой. Года 2-2,5 назад один из местных блогеров, вроде житель Торонто, Канада, в комментариях написал, что у них там на Западе, каппер с проходимостью (ой дай бог памяти, давно было, смутно помню) что-то в районе 53-54-55 процентов уже считается суперуспешным. Так вот, на испытаниях лучший результат "трендового" способа прогнозирования - 57,3 % (+34 406 / -24 784) !!! Конечно, просто так в нынешней регулярке такой процент не повторить, все-таки сами-то тренды создавались на основе данных архива о прошедших чемпионатах, а в текущем тенденции могут быть совсем иными, да так оно и есть, вспомните хотя бы о возрастании конкуренции после миграции звезд в очень бурное межсезонье, о торпедировании травмами доминирующего суперклуба, да и вообще - все течет, все меняется... Но ведь и резервы есть. На испытаниях система выдавала по 28 прогнозов на матч (ит1, ит2, фора, общий тотал, на матч, на 2 половины, на 4 четверти) и все считались, сейчас нужно в разы меньше, а при отборе и качество должно возрасти. А если еще и голову подключить человеческую (у кого она есть), система не может учитывать такие факторы как травмы, мотивация, "сливы" (не в смысле фрукта !!!), а человек - может... Процент может быть и повыше...
Как видите, сделано много... и многое еще предстоит сделать. Желающие могут поучаствовать...
Но об этом после...На днях отведу этому отдельный пост.
А пока вернемся к ставкам. Трендовый способ прогнозирования у меня сейчас является ведущим. Первоначальное тестирование идет около месяца. Сложностей хватает. МетОда еще сыровата. Есть перекосы в сторону определенных видов ставок, когда они совпадают с тенденциями матча, залетает по 7 ставок с матча. Когда нет, то нет... по столько же. К счастью, первое происходит почаще... Есть трудности с локализацией. Вариантов ставок много, столько не проставишь, нужен отбор, для чего составляется рейтинг. По идее, чем выше место в нем, тем выше проходимость. На деле все несколько иначе. Три дня назад, в НБА был большой день, 14 матчей. Приличная выборка. Так вот, первые матчи рейтингов по трендам версии 2, зашли в 57%, вторые в 43%, третьи в 50%, четвертые в 57%, пятые в 61%... что ж...работа продолжается.
Теперь практика, времени до начала матчей уже совсем не остается. Сегодня я дам статистические расчеты по базовой и продвинутой системе, рекомендации трендовой, расчеты по игрокам. То есть, сделаю всю черновую работу. А окончательный выбор будет за вами, просто возьмите из списков то, что больше нравится, проверьте свою чуйку. И посмотрим, что из этого получится...