Разбор матча с «Фулхэмом» без эмоций и почти без слов
Как и обещал, проделал некоторую работу, почему-то жутко устал - так что даже на фоне изначалльных планов текста и эмоций здесь будет меньше. В основном, будут только пояснения, ибо без них никуда. Приступим же.
Для начала - общая таблица по матчу (кликабельна).
Необходимые пояснения:
минуты - пятиминутные отрезки матча;
для дополнительного удобства (надеюсь) закодировал цветами показатели разных команды, где это требовалось;
владение - владением мячом "Уиганом" в данных отрезках;
удары - все за данный отрезок, включая блокированные;
события - сюда выносятся забитые мячи, попадания в каркас ворот (не пригодилось, так что сокращения не придумал) и big chances.
Теперь два отдельных, более основательных пояснения.
Big Chances
Не буду заниматься словесной эквилибристикой, дам слово человеку, который в объяснении данного показателя собаку съел. Итак, цитирую Вадима Лукомского: "явный голевой момент (clear cut chance/big chance) – статистический показатель Opta. Официальное определение – ситуация, в которой игрок при прочих равных должен забивать; как правило, выход один на один или удар с очень близкого расстояния".
Атакующий потенциал (примечание - через некоторое время показатель был переименован в "инициативу")
Тут уже кроме меня отдуваться некому. Пойдём по порядку:
компания Opta занимается среди прочего тем, что регистрирует, на каком участке поля происходили те или иные игровые события;
всё поле можно условно разделить на трети (см. картинку выше): условные "нашу", "центр поля" и "их";
в результате, в произвольном отрезке времени можно разбросать все произошедшие игровые события по этим третям;
далее - в каждом пятиминутном промежутке с помощью данных с сайта Squawka.com я смотрел процент произошедших событий на чужой и нашей третях. Центр поля меня не интересовал, так как там не происходит ничего опасного или сильно влияющего на игру;
из полученного процента действий на "их" трети (т.е. в атаке) вычитается аналогичный процент на "нашей" (т.е. в обороне), получается положительное/отрицательное число - "атакующий потенциал";
легко видеть, что чем больше это число, тем больше команда реально доминировала над соперником в данном отрезке матча, проводя в заключительной, а не в подготовительной фазе атак больше времени, чем в обороне;
для примера: если команда в пятминутку владела мячом 70% времени, но значение АП при этом не шибко больше нуля - значит, в этот отрезок времени команда не произвела ничего содержательного (см. "Игнашевич, Сергей" и "Березуцкий, Василий").
Далее следуют более наглядные графики двух основвных показателей из таблицы. Также кликабельно, если угодно.
Футболисты
Перейдём теперь непосредственно к участникам матча. Естественно, "Фулхэм" меня не инетерсует.
Условные обозначения:
Pos - на какой позиции(-ях) играл. Если по ходу матча менял, то указывается, с какой минуты начал на новой;
D - "дуэли", они же, если угодно (хотя, на мой взгляд, это не совсем одно и то же) - "единоборства". Сюда заносятся: удачные/неудачные отборы, верховые дуэли, обводки, а также фолы, совершённые на игроке и самим игроком;
D% - процент выигранных дуэлей. Методика расчёта взята с сайта Squawka.com, данные - с WhoScored (ибо роднее). Формула: все удачные действия + фолы на игроке делятся на все дуэли вообще. Эмпирически выведено, что для защитников хорошим результатом (по крайней мере, на дистанции) является около 65%, для ЦП - около 61, атакующих игроков кроме центральных нападающих - около 58, собственно для ЦН - около 47;
Р - общее число передач;
PA% - процент точных передач;
KP - передачи под удар, key passes. Whoscored автоматом записывает ассисты туда же;
S - удары по воротам (исключая заблокированные);
для вратаря приводится количество отбитых ударов и процент таковых от всех ударов в створ;
примечание: через некоторое время в таблицу был добавлен показатель Def ("значимые оборонительные действия" - то есть, отборы, перехваты и заблокированные удары), а хорошие результаты по процентам дуэлей и передач стали отмечаться цветом.
---
В общем, более-менее всё. Сегодня пройдёт более актуальный матч с "Миллуолом", и уже завтра я постараюсь сделать аналогичный пост. Разве что добавлю отдельный разбор авторов-ассистентов в голах и BC - на это сейчас сил уже просто нет.
Наслаждайтесь, рассматривайте цифры, анализируйте. А я пошёл отдыхать :3
P.S. Текст писался с чистого листа, перечитывать конкретно сейчас совершенно неохота, так что извините заранее за ошибки и описки.
P.P.S. Замечания и предложения приветствуются.
На самом деле, тоже неидеальное - прямо кожей чую, что до Показателя Истины ему чего-то не хватает, но ничего лучше в голову не приходит.
Если ты просто про процентные показатели, а не разницу между ними, то такое, конечно, тоже возможно, и изначально я от этого и отталкивался, но конечной целью было получить быстрый и более-менее адекватный разбор матча, используя минимум цифр. Так и родился АП.
>ты брал действия атакующий команды на защитной трети другой, так?
Нет, действия обоих команд на защитных третях. В случае обороняющихся - это, допустим, отборы или выносы - маркёры противостояния атакующей активности других. А если команда устраивает перепасовку _на своей трети_, а не на своей части центра поля (зона около срединной линии), то это тоже может служить показателем активности соперника - допустим, прессинга или перекрывания всех мало-мальских вариантов впереди - что тоже показывает доминирование одних над другими, пусть в данном случае и не в креативном плане.
>много пасуется на защитной трети оппонента, но не наносит ударов
>как это увязать с показателем АП
Для этого и приводятся данные по BC и общим ударам. Штука в том, что все показатели надо рассматривать вместе, и именно для этого и нужен человек, для анализа - а машина просто предоставляет цифры. По крайней мере, до изобретения "Универсального показателя". Забавно, мы в такой ситуации похожи на алхимиков, ищущих философский камень.
>как выбирать интервалы
Во-первых, имеющийся у меня инструмент (данные Squawka) позволяет разбивать матч только на отрезки, кратные пяти минутам. Во-вторых, на мой взгляд, чем меньше по размеру отрезки, тем меньше шанс упустить что-либо значимое. При такой разбивке будет видно и коренной перелом после замены, и небольшой, но мощный атакующий порыв соперника, который в более крупном интервале потерялся бы.
---
Благодарю за вопросы, было интересно отвечать.
И не совсем понятно - "далее - в каждом пятиминутном промежутке с помощью данных с сайта Squawka.com я смотрел процент произошедших событий на чужой и нашей третях" - ты брал действия атакующий команды на защитной трети другой, так?
Еще один вопрос, если одна команда много пасуется на защитной трети оппонента, но не наносит ударов (либо шансы взятия ворот с точек, с которых бьют - минимальны) по воротам соперника, как оценить такой потенциал? Если он будет намного выше команды соперника? Понимаю, что для этого и есть BC, но как это увязать с показателем АП, так что бы было адекватно отражено?
И последний вопрос, который меня мучил, когда я сам занимался статистикой: как выбирать интервалы? По 5 минут (как ты это сделал) или, например, по ситуации на поле? Допустим, замена повлияла на матч, и я делаю интервалы не равномерные, а до замены и после замены, но перевожу все в относительные величины.
Уж прости, если закидал вопросами, я тоже как-то делал статистический анализ конкретного матча, но там, как и у большинства "статистиков" идея довлела над самой статистикой. Т.е статистику во многом я использовал, как доказательство увиденному. Поэтому вот и вызывает такой повышенный интерес твоя попытка создать универсальную модель под все матчи.
2. Думаю, что атакующий потенциал, это действия в атаке направленные на взятие ворот. Но в данном случае, я бы брал просто атакующие действия - не совсем понимаю, зачем все действия брать, ведь есть команды, которые любят подолгу разыгрывать мяч на своей трети при начале атаки, и никак ведь не скажешь, что соперник якобы не давал выйти. Но опять же мой личный взгляд.
3. Понял
4. У тебя же нет возможности матчи то толком смотреть, это я упустил....
И тебе спасибо, интересный показатель. Можешь меня в друзья добавить? Есть кое-какая идея насчет статистики, может быть фейловая, а может быть доработаем :)