12 мин.

Про новый подход

Здравствуйте, друзья.

Сразу скажу, что данная статья необязательна к прочтению, но обязательна к написанию, поэтому, если не особо интересуетесь футбольной статистикой, лучше закройте вкладку и посмотрите подборку голов Дмитрия Лоськова

Напомню, что не так давно я выкладывал статистический разборчик по претендентам на Золотой Мяч и обещал выложить в ближайшее время подобный разбор по нападающим и атакующим полузащитникам лондонского Арсенала. Как видите, овации в адрес Криштиану уже утихли, а статьи нет как нет. Сейчас я расскажу, почему.

Почему?

Потому что метод, по которому я собирал и анализировал данные, был обречён на провал. Я собирал данные вручную копипастом с Хускорда и за несколько недель собрал чуть меньше тысячи строк данных (одна строка = статистика по одному игроку за один сезон), а когда понял, что мне нужно внести небольшую корректировку в расчёты, понял, что это ещё несколько дней работы. Поэтому сбор данных пришлось делать заново и по возможности автоматизированно, поэтому теперь источником данных является Опта, и за пару дней я смог собрать 5 тысяч строк информации.

Ну а дальше-то что?

Подход остался похожим на то, что был раньше, но выборка для определения оценок теперь была не 150 игроков, а все игроки чемпионатов Англии, Испании, Италии, Германии, Франции и России за последние 3 сезона, поэтому оценки стали куда более отражающими действительность.

К чему привела смена источника данных?

На Опте и Хускорде некоторые данные совпадают один в один, некоторые есть только на Хускорде (на Опте нет статистики неудачных попыток дриблинга, по крайней мере, в том Фиде, что я имею), некоторые только на Опте (на Хускорде нет приличной статистики по вратарям или по направлениям передач), поэтому расчёты претерпели лёгкие перемены.

Что ещё нового в расчётах?

Теперь все процентные показатели, где оценка зависит от доли удачных ситуаций (точные пасы или выигранные верховые дуэли), испытывают на себе лёгкое колдунство: у всех игроков от среднего показателя удачных ситуаций на матч отнимается определённая величина, что приводит к следующему: игрокам, которые делают это мало и редко, не поможет большой процент, потому что малая отнятая величина превратит его большой процент в маленький.

Понять этот подход сможет простая картинка-пример, где сравнивается игра головой Высоченного Атлета, у которого примерно одна выигранная верховая дуэль из примерно трёх за матч, и Техничного Гнома, у которого примерно 0,16 побед из примерно одного верхового единоборства за два матча:

 

001

Как видим, до применения вычета Гном играл головой хуже Атлета примерно в полтора раза, что не было похоже на правду и было даже комплиментом этому юркому парню из пещер и подземелий, но после применения вычета у него остался ноль, тогда как Атлет остался Атлетом.

Надеюсь, понятно.

В разных критериях эти вычеты разные, это я позволю оставить на откуп собственной субъективности. Далее в таких ситуациях просто буду указывать «с учётом вычета».

Вкратце про методику для тех, кто не знаком

Для игрока каждой позиции обозначаются некоторые ключевые характеристики, которые находят отражение в его статистике, например, удачные обводки или точность ударов. Характеристики могут быть абсолютными, т.е. количество удачных действий на 90 минут игрового времени, или относительными, т.е. средняя успешность (например, точность) за сезон.

По каждой из характеристик каждый игрок может получить оценку от 1 до 10: десятка в какой-то характеристике означает, что игрок в этой характеристике один из лучших в мире, единица – что игрок в этом очень плох, а величина 5,5 соответствует среднему значению из всей обработанной первоначально базы.

Отсюда нюанс: десятка и единица закреплены всегда жёстко, и если десятке соответствует, к примеру, 3 действия за матч, то игрок с 4 действиями получит тоже только десять и будет почти равен с тем, кто сделал, например, 2,5 действия и получил за них 9,5 баллов. Методика-с.

Ну ладно, всё по порядку.

Про вратарей

По вратарям имеем 4 критерия: SAVES – процент сэйвов с учётом вычета, OFFTHELINE – процент удачных выходов с учётом вычета, SAFETY – безопасность в коротких передачах, LONG PASS – точность длинных пасов с учётом вычета.

Получаем диаграмму:

 Индекс «2015» означает сезон 2015 – 2016.

002

Клаудио Браво сильнее Петра Чеха в двух параметрах: процент спасений (SAVES) и точность длинных передач (LONG PASS), при этом несколько уступает в безопасности ближних передач (SAFETY), т.к. больше в них рискует, и имеет откровенный провал в игре на выходах (OFFTHELINE).

Про центральных защитников

По центральным защитникам имеем следующие критерии: INTRCPTN – число перехватов за матч, DEFNG – процент удачных защитных действий с учётом вычета, HEADING – процент выигранных верховых дуэлей с учётом вычета, SHOTS – количество нанесённых ударов в створ за матч, KEYPASS – ключевые пасы за матч, LONG PASS – точность длинных пасов с учётом вычета, SAFETY – безопасность в коротких передачах (на своей половине), DSCPLINE – дисциплина в плане жёлтых и красных карточек.

Получаем диаграмму:

 

003

Боатенг надёжнее в оборонительных действиях (DEFNG), зато у Хуммельса больше перехватов (INTRCPTN). Боатенг больше помогает атаке (LONG PASS и KEYPASS), зато Хуммельс больше заряжен на чужие ворота (SHOTS). Головой оба играют хорошо (HEADING), обрезов на своей половине оба позволяют себе достаточно много (SAFETY). У Хуммельса почти нет карточек, у Боатенга вагон (DSPLINE).

Про крайних защитников

По крайним защитникам имеем следующие критерии: DEF ACTY – количество защитных действий за матч, DEFNG – процент удачных защитных действий с учётом вычета, CROSSES – процент точных навесов с учётом вычета, KEYPASS – ключевые пасы за матч, DRIBBLE – число удачных обводок за матч, SAFETY – безопасность в коротких передачах (на своей половине), DSCPLINE – дисциплина в плане жёлтых и красных карточек.

Получаем диаграмму:

 

004

Алекс Сандро и Сесар Аспиликуэта оба очень активно помогают обороне (DEF ACTY), причём игрок Челси в обороне надёжнее (DEFNG) и получается куда меньше предупреждений (DSCPLINE), но зато латераль Юве на порядок превосходит своего визави во всех делах, связанных с работой с мячом: минимум обрезов на своей половине (SAFETY), максимум дриблинга (DRIBBLE) и опасных передач (KEYPASS и CROSSES).

Про полузащитников

По полузащитникам имеем следующие критерии: DEF ACTY – количество защитных действий за матч, DEFNG – процент удачных защитных действий с учётом вычета, HEADING – процент выигранных верховых дуэлей с учётом вычета, PASS ACC – точность передач с учётом вычета, CROSSES – процент точных навесов с учётом вычета, LONG PASS – точность длинных пасов с учётом вычета, FRWRD PASS – число передач вперёд на один неточный пас, THRGH BALLS – число разрезающих передач, CROSSES – процент точных навесов с учётом вычета, KEYPASS – ключевые пасы за матч, DRIBBLE – число удачных обводок за матч, SHOTS – точность ударов с учётом вычета, DSCPLINE – дисциплина в плане жёлтых и красных карточек.

Получаем диаграмму:

 

005

Бускетс и Иньеста не зря носят полосатую форму: показатели точного паса (PASS ACC) и точности длинных передач (LONG PASS) у обоих отличные. В плане передач вперёд (FRWRD PASS) и особенно сквозных передач (THRGH BALLS) Андрес ожидаемо сильнее, в плане активности (DEF ACTY) и надёжности (DEFNG) в обороне ожидаемо сильнее Серхио. Показатели по ударам (SHOTS), дриблингу (DRIBBLE) и ключевым передачам (KEYPASS) показывают, в чьи задачи входит создание креатива на поле (Иньеста), а кому этого делать не полагается (Бускетс). Ну а навешивать (CROSSES) в Барсе вообще не принято.

Обработка диаграммы выше даёт диаграмму более обобщённых критериев по каждому игроку: DEFEND – оборона, причём в первую очередь надёжность оборонительных действий, PRESS – прессинг, по сути вовлечённость в оборонительные действия, DEVELOP – выход из обороны, базирующийся в первую очередь на статистике передач вперёд и дальних передач, CREATE – креатив, в первую очередь ключевые пасы, ATTACK – атака, то есть завершение: удары и голы.

Например:

 

006

За защиту (DEFEND) и прессинг (PRESS) отвечает Бускетс, Иньеста помогает; за выход из обороны (DEVELOP) отвечает Иньеста, Бускетс помогает; за креатив (CREATE) отвечает Иньеста, Бускетс не помогает; атаковать (ATTACK) этим двоим не положено, а то помешают дракону.

Про игроков атаки

По нападающим и атакующим полузащитникам имеем следующие критерии: DEF ACTY – количество защитных действий за матч, HEADING – процент выигранных верховых дуэлей с учётом вычета, SHOTS p/mtch – удары в створ за матч, SHOT acc – точность ударов с учётом вычета, GOALS p/mtch – голы за матч, GOAL EFF – голевая эффективность ударов с учётом вычета, CROSSES – процент точных навесов с учётом вычета, KEYPASS – ключевые пасы за матч, DRIBBLE – число удачных обводок за матч, SETPC SUFFRD – заработанные стандарты.

Получаем частную диаграмму:

 

007

Жиру бьёт чуть чаще (SHOTS p/mtch), чуть точнее (SHOT acc) и чуть эффективнее (GOAL EFF), посему забивает чуть больше (GOALS p/mtch), зато Алексис больше помогает защите (DEF ACTY), зарабатывает больше стандартов (SETPC SUFFRD), больше использует (успешно) дрибблинг (DRIBBLE) и чаще выдаёт ключевые передачи (KEYPASS). Оба предпочитают не навешивать (CROSSES).

И общую диаграмму:

 

008

Жиру несёт чуть больший атакующий потенциал (ATTACK), зато в остальных параметрах практически ничего не показывает, тогда как Алексис даёт команде очень большой прирост по креативу (CREATE) и выходу из обороны (DEVELOP), а также, пусть и немного, но помогает обороне (DEFEND и PRESS).

Про команды

Мы теперь можем посмотреть на игроков целой команды за сезон с учётом всех общих критериев: Def – оборона, Prs – прессинг, Dev – выход из обороны, Crt – креатив, Atk – атака.

009

Как видим, у вратарей есть только параметры защиты (Def) и выхода из обороны (Dev). Игроки отсортированы по времени, проведённому на поле; очевидно, что чем больше сыгранное время, тем больше набранной статистики, и тем меньше погрешность расчётов, поэтому объективно оценивать Рибери или Бадштубера тяжело. Практика показывает, что более или менее разумные числа без скачков начинаются от тысячи минут.

Можем оценить стартовый состав команды с учётом вклада каждого игрока в командную игру, причём показатели общих критериев несколько трансформируются:

1)      для удобства восприятия по каждому критерию подобран такой коэффициент, чтобы у команды с идеальной игрой по этому критерию он равнялся ста при сложении этого критерия у всех игроков;

2)      в зависимости от расположения игрока на поле его вклад в определённый критерий может меняться (например, для критерия прессинга максимум находится в полузащите и т.д.).

 

009

Числа внизу – суммарные величины по каждому критерию.

У каждого критерия каждого игрока стоит цветная метка, указывающая на вклад игрока в критерий:

010

Хави Алонсо вносит большой вклад в выход из обороны (DEVELOP), средний вклад в прессинг (PRESSING), малый вклад в оборону (DEFEND) и креатив (CREATE), не вносит вклада в атаку (ATTACK).

Справа от всех критериев каждого игрока находится ещё одна цветная метка, указывающая на общий вклад игрока в командные действия. Очевидно, что игрокам линии обороны здесь всегда будет сложно получить метку не чёрного или красного цвета, тем не менее, это позволяет предварительно бегло оценить сильные и слабые места в составе.

Суммарные показатели по всем критериям можно представить графически:

011

Пунктирная линия – средняя величина по всем критериям. В данном случае у Баварии достаточно сбалансированная диаграмма с лёгким перекосом в сторону выхода из обороны, что, пожалуй, не удивляет.

Бонусы

Ну и напоследок на сегодня пара бонусов для тех, кто дочитал:

012
013
014
015

Думаю, разберётесь сами.

На этом всё

На этом всё, это введение здесь лишь для того, чтобы в основных статьях не тратить время на объяснение этих диаграмм.

В ближайшее время – статьи про Спартак и Зенит.

Спасибо.