Спросите у Стивена. Первое знакомство
На самом деле это не совсем первое знакомство. Мы уже говорили о нём здесь, и даже выкладывали изображения. Проблема в том, что к общению с ним нужно сначала подготовиться. Сразу он понятен далеко не всем.
Итак, Стивен - это файл Excel. Я сделал его для того, чтобы он считал за меня вероятности, валуйность и прочие полезные показатели. Раньше это приходилось делать самому. Изучать MyScore или другой похожий сайт, смотреть, как играли команды в прошлых турах. Важные моменты приходилось выписывать. Считать средние, анализировать их, и так далее. Мне всегда хотелось доверить это Excel, потому что он всё это умеет делать сам. Нужно только правильно внести данные.
Стивен далеко не первая вариация на эту тему. Пришлось перепробовать много форматов. В итоге я остановился на этом, но и в него иногда вношу дополнения.
Он появился прошлым летом, когда в европейских чемпионатах был перерыв. Пришлось тестировать его на МЛС, Корее, Китае, Швеции и прочих непопулярных лигах. Его преимущество в том, что ему не важно, как называются команды и откуда они. Главное, чтобы было что посчитать. Проходимость пока не опускалась ниже 70%.
В общем, без него мы больше игры не анализируем. Он стал полноценным участником нашего проекта, и я решил, что будет интереснее, если дать ему имя. Будет кем-то вроде нашей версии Стига из Top Gear. Долго мы думали, и в итоге назвали его Стивен: в честь Стивена Хокинга. Мне очень нравится эта идея.
Как он работает?
В файл заносятся только игры регулярного чемпионата. В нём нет кубков, еврокубков и товарищеских встреч. Это сделано специально, потому что в кубках часто играют резервные составы, и статистика может отличаться.
Анализируем матчи через вероятности и средние.
Если команда забивала в 8 играх из 10, значит в 11-ой вероятнятность её гола - 80%.
Средние подскажут сколько именно будет голов.
Ещё есть отклонения. Это наша идея, о которой ниже расскажу подробнее.
А вообще, Стивен и сам может обо всём рассказать. Я буду анализировать матчи через диалоги с ним. Точнее - мы. Так будет проще отделить то, что думаю лично я от того, на что указывает статистика, то есть он. Да и просто так веселее. И читать диалоги легче.
Я: Да, Стивен?
Стивен: Да, Создатель! :)))
Я: Давай сначала покажем, как файл выглядит полностью.
С.: Примерно вот так. Как пример используем игру Банфилд - Юнион Санта Фе. Она пройдёт сегодня ночью.Я: В это трудно поверить, но человек, который видит скриншот впервые, не совсем понимает как его читать.
С.: Чтобы доступно его обяснить, я расскажу про каждый блок отдельно. Всего их 5, и каждый выполняет свою функцию. Их можно смотреть отдельно друг от друга, но лучше оценивать в совокупности.
А начинается любой подобный скриншот с информации о местах, которые занимают обе команды.
С.: Сначала идёт место в турнирной таблице.
Потом место по домашним матчам для домашней команды, и по гостевым для гостевой.
Места по забитым и пропущенным, и в конце место с учётом только 8 последних матчей.
По сути, это текущая форма.
Я: А что означают цвета, которыми эти места подсвечены?
С.: Зелёный - выше, красный ниже. Чем интенсивнее цвет, тем больше разница.
Блок №1
Я: О чём первый блок?
С.: В первом блоке я перечисляю все сыгранные матчи обеих команд. Сверху-вниз по порядку. Левая половина страницы (под названием команды 1) - это игры первой команды, правая - игры второй.
Обе половины практически зеркально повторяют друг друга.
По краям названия соперников. Следующий столбец - место, которое этот соперник занимает сейчас в таблице. Место я указываю для того, чтобы была примерно понятна сила соперника. Особенно актуально это для малоизвестных чемпионатов: одного названия команды там бывает недостаточно.
Я: А что за разноцветные кружки после них?
С.: Зелёный кружок - победа, жёлтый - ничья, красный - поражение. Сверху указано сколько всего было побед, ничьих и поражений. Кстати, для простоты каждый столбец кроме названия ещё обозначается буквой. Например, если мы сейчас говорим о столбце с исходами первой команды, то можно просто сказать - столбец "А", или колонка "А". Буквы идут в алфавитном порядке.
Я: Спасибо, что пояснил. Тогда переходим к столбцу "B". Что в нём?
С.: Столбец "B" это забитые голы, а "С" - пропущенные. Причём, не важно, гостевой был матч или домашний - сначала всегда идут голы той команды, которую анализируем.
Я: А что сверху? Над названием столбца.
С.: "G+" - это название, то есть забитые голы. Над ним процент матчей, в которых команда забивала. А над ним это же соотношение, только в натуральном выражении.
Я: В нашем случае "Банфилд" забивал в 13 играх из 19, и это 68%. Пропускали в 12 из 19 (63%).
С.: Да, всё верно.
Я: Колонки "D" и "E" - это что?
С.: Это суммы голов за два матча. Обычно каждая команда играет по очереди: матч дома, матч в гостях. Получается двухматчевый цикл. Чаще всего дома играть получается лучше, чем на выезде, поэтому домашний результат компенсирует гостевой.
Если смотреть матчи такими парами, можно увидеть много закономерностей. Эти же циклы помогают считать отклонения, о которых ещё расскажу.
Я: Давай разбираться. "Банфилд" начал чемпионат с домашнего матча с "Бельграно", в котором выиграл 2:1. Во втором туре на выезде проиграл "Ривер Плейт" - 1:3. Итого, забили 3 мяча за 2 игры, а пропустили 4. Что это нам даёт?
С.: Отдельно один цикл ничего. А вот если смотреть несколько подряд, можно найти закономерности. На примере "Банфилда", можно заметить, что в первых 4 циклах (то есть 8 матчей) они забивали не меньше 2 мячей за цикл. Если мы находимся посередине такого цикла, и знаем сколько команда забила в первом из двух матчей в цикле, можно предположить сколько будет во втором. Сейчас как раз такой момент, когда следующая игра вторая в цикле. "Банфилд" уже забил 2 мяча в прошлом матче с "Химназией". А мы видим, что чаще всего за один цикл он забивает именно 2 мяча. Это говорит нам о том, что вряд ли он забьёт много в нашем матче.
Я: Как ты это понял?
С.: Вверху над названием колонки указывается 2 значения. Нижнее - это медиана. Она равна 2.
Я: Что такое медиана?
С.: Медиана - это среднее значение, но без учёта пиков. В нашем случае, она не будет учитывать 4 гола, которые "Банфилд" забил "Росарио" в четвёртом туре, и не все нули возьмёт в расчёт. Медиана исключает минимальное и максимальное значения. Она будет точнее, чем средняя, потому что средняя учитывает пики.
Я: Медиана по забитым голам в двухматчевом цикле у "Банфилда" равна 2?
С.: Верно. А они уже забили 2 гола в прошлой игре. Значит если забьют даже 1 в нашем матче, автоматически превысят это значение. Важное замечание: нельзя смотреть только на забитые голы "Банфилда". Важно, сколько пропускает соперник. У "Юнион Санта Фе" это будет столбец "W". Прошлый матч они выиграли 3:0, то есть не пропустили. Как видишь, только раз было такое, чтобы в двухматчевом цикле они вообще не пропускали. Поэтому велика вероятность, что пропустят в следующей игре. Особенно, если учитывать, что их медиана по пропущенным голам -2.
Я: А что значит число над медианой?
С.: А это уже простая средняя. "Юнион Санта Фе" пропускает 2 мяча в двухматчевом цикле и в среднем 0,7 за игру. А забивает 1,2 гола за игру и 3 за двухматчевый цикл.
Я: Правильно я понимаю, что мы ждём, что "Банфилд" забьёт?
С.: Рано делать выводы. Давай смотреть дальше. Самое интересное начинается со столбца "G". Тут статистика только по домашним матчам "Банфилда". Если строка пустая, значит играли на выезде. "G" - исходы,
"Н" - команда забила,
"I" - команда пропустила,
"J" - было "Обе забьют",
"К" - был тотал больше 2,5.
Я: Если стоит 1 и выделено цветом, значит событие наступило, если "0", не наступило.
С.: Так и есть. Вот "Банфилд" забил в последней домашней игре, но не пропустил. А до этого не забивал в двух домашних играх подряд.
Я: Я вижу, что обе команды забивали в 4 играх из всех домашних, и только 3 раза было ТБ2,5.
С.: Все эти показатели ты можешь посмотреть в "шапке" каждого столбца. Над названием. Жирным шрифтом - статистика в домашних матчах, обычным - по всему чемпионату.
Я: "Обе забьют" случалось в 4 из 10 домашних встреч (40%), и в 8 из 19 вообще (42%). А по гостевой команде тот же принцип?
С.: Абсолютно. Только здесь мы указываем гостевые встречи.
Я: Я смотрю, "Юнион" на выезде тоже только 40% матчей сыграл на "Обе забьют".
С.: Да, тоже 4 из 10. Вот и думай, велика ли вероятность такого исхода в их очной встрече.
Я: Расскажи про колонки "F" и "U".
С.: Это разница мячей. Только в динамике. В этих колонках ты можешь увидеть, как меняется разница мячей каждой из команд. "Банфилд" выиграл свой первый матч в сезоне со счётом 2:1. Разница мячей +1. Второй матч проиграли 1:3 - разница -2. К +1 после первого матча прибавляем -2, получается -1. И так далее. В "шапке" над названием нижнее число - это разница мячей после всех матчей, а верхнее число - это изменение только за последние 5.
Я: Я вижу, что "Юнион" ни разу в сезоне не уходил "в минус". То есть, у них не было затяжных серий из поражений. А хозяева дважды проигрывали по 3 встречи подряд. Этими сериями они уводили разницу в минус.
С.: У нас остались столбцы по центру: L,M,N,O. Давай расскажем о них, когда дойдём до отклонений.
Блок №2
Я: Динамика средних. О чём тут речь?
С.: Тут 3 части: 2 по краям и одна общая в центре.
Идея в следующем. Для того, чтобы понять, как сыграет команда свой следующий матч, нужно понять, в какой точке она сейчас находится. В этом, по сути, и есть наша с тобой главная задача. Для этого так много разных параметров. Мы должны оценить их все одновременно, и понять, куда движется команда. На этом принципе построен второй блок. Мы идём от общего к частному. Ты видишь два столбца из цифр: первый - забитые голы, второй - пропущенные.
Смотреть нужно сверху вниз. Смотрим по "Банфилду":
Дома забивают - 0,8
Вообще во всех матчах - 1,1
В последних 5 матчах - 0,6
В последних 3-х - 1,0
В последней игре забили 2. (зелёный кружок спава показывает исход)
И сразу под последним результатом мы видим расчёт того, как должны сыграть, чтобы быть в рамках этих средних.
Я: По пропущенным голам все срединие держатся в районе единицы. Но в последнем матче 0 голов. Значит ли это, что команда должна пропустить?
С.: Если не пропустит, будет уже три нуля подряд. Это потянет среднюю вниз. Как ты видишь, такого с командой ещё не было. Средняя по пропущенным всегда находится рядом с единицей. Это значит, что каждый ноль потом компенсируется одним, а то и двумя голами. Смотри сам, как было до этого: два нуля, потом двойка. Потом снова два нуля и подряд 1,2,3. Делай выводы.
Я: Я бы подумал, что "Юнион" должен много забить, но вижу их 3 забитых мяча в последней встрече.
С.: Их средняя по забитым не уходит далеко от единицы. То есть три забитых гола в прошлой игре должны компенсироваться нулём, или в крайнем случае единицей. Мой прогноз - не больше одного гола.
Я: А какой посчитать общий прогноз по средним?
С.: Для этого я предлагаю посмотреть все параметры вместев части по центру: средние, медианы, средние в последних 5 матчах и особенно домашние и гостевые средние. Если «Банфилд» забивает на своём поле 0,8 гола за игру, а «Юнион» в гостях пропускает 1,1 я буду считать, что это общее значение для них будет 1. На этом можно построить прогноз по каждой из средних. А в итоге, получится некий счёт, одинаково подходящий под все показатели.
В нашем случае это 1,0 - 0,9. Если их округлить до целого числа, получится 1:1.
Для полноты картины добавим сюда проценты вероятности голов обеих команд, «Обе забьют» и тотала 2,5.
Рядом с вероятностью, которую мы считаем от прошлых матчей, я ещё добавляю собственный расчёт. Например, ранее мы уже посчитали, что вероятность для «Обе забьют» по обеим командам равна 40%. А справа от неё стоит 33%. Эта вероятность посчитана по моему собственному алгоритму и дополняет основную.
Хотя вероятный счёт по средним получился 1:1, процент на то, что обе команды забьют крайне не высок. Поэтому будем смотреть дальше. Может другие блоки дадут больше информации.
Блок №3
Я: Это мой любимый блок. Я лучше воспринимаю информацию визуально, поэтому хотел все эти средние изобразить вместе в одной системе координат, и сравнить друг с другом. В итоге придумал такую форму.
Если одна команда забивает больше другой, то её средние должны быть физически выше на графике. По этому принципу я решил средние значения помещать в одном "окне".
Как смотреть этот... Даже не знаю как его назвать. Это и не график и не рисунок. В общем, это.
Слева я обозначил уровни: 0 голов, 1 гол, 2 гола, 3+ (то есть три и больше).
Под надписью "Max" файл показывает максимальное количество голов, которое команда вообще забивала. Мы видим, что по "Банфилду" это 2.
Дальше идут 2 столбца: Total и Home. В них указывается как часто команда забивала соответствующее количество голов. "Total" - все матчи, "Home" - только домашние.
Вот например, напротив нуля у "Банфилда" стоит 6 во всех матчах и 4 в домашних. Значит они не забивали в 6 матчах чемпионата, 4 из которых были домашними.
Кстати, внизу указано количество матчей вообще и дома: 19 и 10.
Дальше в чёрном поле пошли средние:
AG+ это средняя "Банфилда" в домашних играх. Она автоматически оказалась на уровне между "0" и "1".
AG+5 это средняя "Банфилда" в последних 5 матчах. Она почти равна домашней средней - 0,6.
AG- это средняя по пропущенным "Юниона" в гостевых матчах. Она равна 1,1.
AG-5 это средняя по пропущенным "Юниона" в последних 5 матчах: 0,6.
Dev - это отклонение. По сути, это то количество голов, которое должен забить "Банфилд", чтобы быть в своей средней по сезону вообще. Дальше расскажу поподробнее.
Ну и последние столбцы, подсвеченные красным - это частота с которой "Юнион" пропускает соответствующие количества голов. Видим, что чаще всего в гостях они пропускают 2 мяча - 4 раза такое было. А если смотреть все матчи, то чаще всего (9 раз) они не пропускали ни одного гола.
В самом последнем столбце галочкой выделяются уровни, на которых больше всего голов. То есть конкретно по "Банфилду" может быть от 0 до 2 голов, но больше всего средних оказалось между "0" и "1".
Блок №4
С.: Здесь я предлагаю свои варианты.
В левой части сверху вниз перечислены все события, по которым можно посчитать вероятности. Из этих вероятностей считается справедливый коэффициент на конкретное событие. Галочка появляется напротив самого вероятного.
В нашем матче она появилась напротив события с коэффициентом 1,54. Такой коэффициент получается у меня на то, что команда 1 забьёт.
Самый высокий коэффициент - 10,0 даётся на 2 гола "Юниона". Это не удивительно, ведь вероятность такого исхода не выше 10%. Эти коэффициенты можно сравнивать с тем, что даёт контора, и искать валуи.
В правой части цветом подсвечиваются наиболее подходящие варианты для ставок. Для того, чтобы подсветилась ячейка, должно сойтись сразу несколько критериев.
В нашем матче я выделил исход без ничьей, "Обе забьют" - нет, и Тотал меньше 2,5.
Я: Всё это вписывается в выводы, которые мы сделали по предыдущим блокам.
Можно вспомнить вероятный счёт по средним, который получился 1:1 и который подразумевает "Обе забьют", но здесь уже нужно действовать на своё усмотрение. Решать, чему верить больше - средним или вероятностям.
Я доверюсь тому, что советует Стивен. Тоже считаю, что голов должно быть мало.
Блок №5
Я: Вот мы и подошли к десерту. Отклонения. Для того, чтобы понять, что такое отклонения, нужно снова вспомнить двухматчевые циклы.
Представьте себе, команда сыграла 5 матчей и забила в них 7 мячей. 5 матчей - это 2 полных двухматчевых цикла и 1 незаконченный. Шестой матч как раз закроет его. Сколько голов должна забить команда в 6-ой игре?
Это можно посчитать по формуле:
Dev G+ = AG+5*6-sum(5 games),
где Dev G+ - это отклонение по забитым голам,
AG+5 - средняя команды по забитым голам в 5 последних матчах,
sum(5 games) - сумма голов в последних 5 матчах.
Подставляем параметры из нашего примера. Всего было забито 7 голов в 5 матчах. Средняя - 1,4.
Dev G+ = 1,4*6-7
Dev G+ = 1,4
Получается, для того, чтобы оставаться в своей средней, команда должна забить 1,4 гола. Понятно, что придётся округлять.
Чтобы считать отклонения, нужно чтобы 2 из 5 последних матчей первой команды были домашними. Тогда следующий будет третьим и закроет незаконченный двухматчевый цикл. А у гостевой команды наоборот - 2 игры из 5 должны быть гостевыми.
В пятом блоке напротив названий команд стоит кружок. Если он зелёный, значит условие выполняется. Если красный, значит не выполняется. В нашем случает у обоих команд нужное количество матчей дома и в гостях.
Внизу суммарное количество голов дома и в гостях по каждой из команд. А рядом количество матчей дома и в гостях.
"Банфилд" дома сыграл 10 раз, и 9 на выезде.
Дома забил 8 голов, а пропустил 9.
На выезде забил 12, а пропустил 9.
Красный индикатор напротив этих показателей говорит о том, что не выполняется второе условие для отклонений. К моменту следующей игры у команды 1 должно быть на 1 домашний матч меньше, чем выездных. А у второй команды наоборот: гостевых меньше, чем домашних.
У нас по обеим командам не выполняется, поэтому отклонения использовать не будем.
Запомним просто, что отклонения показывают, сколько команде нужно забить и пропустить, чтобы вернуться свою среднюю по сезону.
С.: По-моему получилось неплохо. Думаю, нужно подвести некий итог.
Я.: Резюмируем.
Файл анализирует сыгранные матчи команд и на их основе делает прогноз на очную встречу.
Файл не учитывает травмы, тактики и мотивации команд. Только счёт прошлых игр.
Для того, чтобы проанализировать игру, нужны результаты 5-7 предыдущих матчей.
Файл не учитывает кубковые встречи и их невозможно посчитать по файлу.
Надеюсь, было понятно и информативно. Теперь будем выкладывать превью матчей по файлу в формате подобных диалогов.
У Стивена есть свой канал в Telegram, куда он ежедневно выкладывает скрины с разбором матчей дня:
Подписывайтесь, ставьте плюсы и делитесь своими идеями.
Стивен: Всем удачи!
💻Наша группа в вКонтакте:
https://m.vk.com/razdvoenieblog
🖌Чат в Telegram:
PS: эффектно было бы, если бы 3-3 сыграли)
В любом случае - спасибо за проделанную работу, файлик очень полезный
Спасибо за спасибо!