Разбор матча с «Фулхэмом» без эмоций и почти без слов
Как и обещал, проделал некоторую работу, почему-то жутко устал - так что даже на фоне изначалльных планов текста и эмоций здесь будет меньше. В основном, будут только пояснения, ибо без них никуда. Приступим же.
Для начала - общая таблица по матчу (кликабельна).

Необходимые пояснения:
минуты - пятиминутные отрезки матча;
для дополнительного удобства (надеюсь) закодировал цветами показатели разных команды, где это требовалось;
владение - владением мячом "Уиганом" в данных отрезках;
удары - все за данный отрезок, включая блокированные;
события - сюда выносятся забитые мячи, попадания в каркас ворот (не пригодилось, так что сокращения не придумал) и big chances.
Теперь два отдельных, более основательных пояснения.
Big Chances
Не буду заниматься словесной эквилибристикой, дам слово человеку, который в объяснении данного показателя собаку съел. Итак, цитирую Вадима Лукомского: "явный голевой момент (clear cut chance/big chance) – статистический показатель Opta. Официальное определение – ситуация, в которой игрок при прочих равных должен забивать; как правило, выход один на один или удар с очень близкого расстояния".
Атакующий потенциал (примечание - через некоторое время показатель был переименован в "инициативу")
Тут уже кроме меня отдуваться некому. Пойдём по порядку:

компания Opta занимается среди прочего тем, что регистрирует, на каком участке поля происходили те или иные игровые события;
всё поле можно условно разделить на трети (см. картинку выше): условные "нашу", "центр поля" и "их";
в результате, в произвольном отрезке времени можно разбросать все произошедшие игровые события по этим третям;
далее - в каждом пятиминутном промежутке с помощью данных с сайта Squawka.com я смотрел процент произошедших событий на чужой и нашей третях. Центр поля меня не интересовал, так как там не происходит ничего опасного или сильно влияющего на игру;
из полученного процента действий на "их" трети (т.е. в атаке) вычитается аналогичный процент на "нашей" (т.е. в обороне), получается положительное/отрицательное число - "атакующий потенциал";
легко видеть, что чем больше это число, тем больше команда реально доминировала над соперником в данном отрезке матча, проводя в заключительной, а не в подготовительной фазе атак больше времени, чем в обороне;
для примера: если команда в пятминутку владела мячом 70% времени, но значение АП при этом не шибко больше нуля - значит, в этот отрезок времени команда не произвела ничего содержательного (см. "Игнашевич, Сергей" и "Березуцкий, Василий").
Далее следуют более наглядные графики двух основвных показателей из таблицы. Также кликабельно, если угодно.


Футболисты
Перейдём теперь непосредственно к участникам матча. Естественно, "Фулхэм" меня не инетерсует.

Условные обозначения:
Pos - на какой позиции(-ях) играл. Если по ходу матча менял, то указывается, с какой минуты начал на новой;
D - "дуэли", они же, если угодно (хотя, на мой взгляд, это не совсем одно и то же) - "единоборства". Сюда заносятся: удачные/неудачные отборы, верховые дуэли, обводки, а также фолы, совершённые на игроке и самим игроком;
D% - процент выигранных дуэлей. Методика расчёта взята с сайта Squawka.com, данные - с WhoScored (ибо роднее). Формула: все удачные действия + фолы на игроке делятся на все дуэли вообще. Эмпирически выведено, что для защитников хорошим результатом (по крайней мере, на дистанции) является около 65%, для ЦП - около 61, атакующих игроков кроме центральных нападающих - около 58, собственно для ЦН - около 47;
Р - общее число передач;
PA% - процент точных передач;
KP - передачи под удар, key passes. Whoscored автоматом записывает ассисты туда же;
S - удары по воротам (исключая заблокированные);
для вратаря приводится количество отбитых ударов и процент таковых от всех ударов в створ;
примечание: через некоторое время в таблицу был добавлен показатель Def ("значимые оборонительные действия" - то есть, отборы, перехваты и заблокированные удары), а хорошие результаты по процентам дуэлей и передач стали отмечаться цветом.
---
В общем, более-менее всё. Сегодня пройдёт более актуальный матч с "Миллуолом", и уже завтра я постараюсь сделать аналогичный пост. Разве что добавлю отдельный разбор авторов-ассистентов в голах и BC - на это сейчас сил уже просто нет.
Наслаждайтесь, рассматривайте цифры, анализируйте. А я пошёл отдыхать :3
P.S. Текст писался с чистого листа, перечитывать конкретно сейчас совершенно неохота, так что извините заранее за ошибки и описки.
P.P.S. Замечания и предложения приветствуются.










На самом деле, тоже неидеальное - прямо кожей чую, что до Показателя Истины ему чего-то не хватает, но ничего лучше в голову не приходит.
И не совсем понятно - "далее - в каждом пятиминутном промежутке с помощью данных с сайта Squawka.com я смотрел процент произошедших событий на чужой и нашей третях" - ты брал действия атакующий команды на защитной трети другой, так?
Еще один вопрос, если одна команда много пасуется на защитной трети оппонента, но не наносит ударов (либо шансы взятия ворот с точек, с которых бьют - минимальны) по воротам соперника, как оценить такой потенциал? Если он будет намного выше команды соперника? Понимаю, что для этого и есть BC, но как это увязать с показателем АП, так что бы было адекватно отражено?
И последний вопрос, который меня мучил, когда я сам занимался статистикой: как выбирать интервалы? По 5 минут (как ты это сделал) или, например, по ситуации на поле? Допустим, замена повлияла на матч, и я делаю интервалы не равномерные, а до замены и после замены, но перевожу все в относительные величины.
Уж прости, если закидал вопросами, я тоже как-то делал статистический анализ конкретного матча, но там, как и у большинства "статистиков" идея довлела над самой статистикой. Т.е статистику во многом я использовал, как доказательство увиденному. Поэтому вот и вызывает такой повышенный интерес твоя попытка создать универсальную модель под все матчи.