5 мин.

Среднеквадратическое отклонение в расчете тоталов

Очень сложный заголовок, но постараюсь на простых вещах объяснить, для чего стоит считать и обращать внимание на среднеквадратическое отклонение при расчете тоталов в матче.

Начнем с основы, что такое среднеквадратическое отклонение(СКО дальше по тексту)?

Наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания (аналога среднего арифметического с бесконечным числом исходов). Обычно он означает квадратный корень из дисперсии случайной величины, но иногда может означать тот или иной вариант оценки этого значения.

Из определение ничего не понятно.

Теперь буду объяснять на словах.

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п.

Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными.

С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением. Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Взял определение из Википедии, потому что лучше и проще объяснить нельзя.

Остается главный вопрос, а как считать СКО?

Я не буду писать тут формулу, у всех есть эксель. Используйте формулу СТАНДОТКЛОН.В. и протягивайте значения, по которым хотите посчитать СКО.

СКО считать именно на голы в матче нет смысла, так как этот показатель в матче зависит от других факторов. Наверно обращали внимание, что у команд бывают сухие серии без пропущенных и забитых голов, хотя состав команды не поменялся, тактика игры тоже и т.д.. СКО следует применять к показателям, от которых зависят голы.

В своем исследование на тоталы, я применял СКО к ударам по воротам. Так как без ударов по воротам не будет голов. И чем ниже число СКО от среднего по всему чемпионату, тем выше шансы на то, что среднее кол-во ударов в матче у команды более предсказуемо.

Пример приведу по MLS, который скоро возобновится. По сути, этот инструмент можно использовать и на другие чемпионаты. Взял MLS, потому что начну на него ставить.

Для расчета тотала и СКО и тотала в матче, я взял следующие параметры:

  1. Кол-во голов команд за последние 3 сезона с разбивкой по командам

  2. Кол-во ударов по воротам каждой из команд

  3. Кол-во заблокированных ударов командами.

Для чего мне нужны эти параметры?

Очень просто.

Первым делом я считаю, через сколько ударов по чужим и своим воротам забивает и пропускает команда. Для этого я использую средние значения каждой команды по сезонам.

Формула простая:

Через сколько ударов команда забьет:

(Ср. значение ударов по воротам соперника — ср. значение заблокированных ударов соперником) / ср. количество голов забито командой.

Через сколько команда пропустит:

(Ср. значение ударов по соперником по воротам команды — ср. значение заблокированных ударов командой) / ср. количество голов пропущено командой.

Таким образом мы получаем простые числа, через сколько ударов случаются голы у команды. Нам эта информация необходима для того, чтобы дальше спрогнозировать кол-во голов в матче, исходя из нашего предположения сколько будет нанесено ударов по воротам каждой из команд.

Для чего и почему именно удары? Для расчета любого предположения, нам нужна какая то точная цифра. Удары подходят лучше всего, потому что 0 ударов по воротам случается редко. И мы можем вывести среднее кол-во ударов по своим и чужим воротам за определенный промежуток. Тем самым взяв эти значения по ударам как сложившийся факт. Далее уже считать проще.

Среднеквадратическое отклонение в расчете тоталов, изображение №2

На таблице приведен один из примеров матча в МЛС, сыгранный недавно, матч Колорадо — Сиэтл. Матч закончился со счетом 1-0.

Разделил расчеты на 3 части: Данные, расчет по ударам и с применением СКО.

  1. В данные забиваю средние значения по командам.

  2. Расчет по ударам заполняется частично вручную. Зеленым цветом выделил таблички, которые необходимо вручную вписывать. Расчет ударов по воротам я беру за последние 30 матчей команды, далее вычитаю из среднего значения минимальное значение ударов, которые были. Далее эту разницу делю на на сколько оба предыдущие значения отличаются и прибавляю к минимальному значению по ударам. Табличка тут, вписываю в удары значение «Прибавляем число к минимуму»:

Среднеквадратическое отклонение в расчете тоталов, изображение №3

Далее по формулам простым рассчитывается тотал матча и сравнивается со средним тоталом.

  1. Расчет с СКО такой же как и по ударам, только на количество ударов команд применяется коэффициент СКО по ударам. Т.е. забитые голы умнодаются на СКО ударов. Так же пересчитывается тотал матча и считается исход, исходя из того какая команд забьет больше голов.

По большой таблице выше, видно что у двух команд СКО по забитым голам выше 1, а по пропущенным ниже 1, но не сильно. Это говорит о том, что у команд предсказуемый исход по количеству забитых голов. Команды в среднем забивают больше 1,4 гола. А вот по пропущенным голам, значение ниже 1, это значит что их СКО выше среднего по всему чемпионату и предсказать кол-во пропущенных голов тяжело и предсказать сколько пропустят команды сложно.

В общем то, несмотря на то что обе команды забивные, матч закончился со счетом 1-0, тем самым показав что сколько пропустят команды посчитать сложно. При ТБшном чемпионате, сыграла ставка ТМ. Формула нам помогла, но еще важно обращаться внимание на СКО.

На первый взгляд, может показаться сложным бредом, но я провел статистику на 8 матчах.

Среднеквадратическое отклонение в расчете тоталов, изображение №4

Зеленым — угаданные исходы.

Красным — не угаданные.

Хочу отметить, что матч Колорадо — Нэшвил, даже при угаданных количествах ударов, исход не угадал. Андердог выиграл этот матч.

Потому, отсюда вывод — СКО важная переменная при расчете тотала любого матча.

Я буду пользоваться данной формулой при своих ставках на MLS в ближайшее время. Но обязательно нужно включать голову и смотреть, какой СКО у команд на удары, насколько предсказуем этот показатель.

Надеюсь объяснил не сложно. Кому нужен эксель файл, пишите в личку)