4 мин.

На пути к новому виду аналитики

Автор: Marek Kwiatkowski

Перевод статьи с сайта от 02.08.2016

Я занимаюсь футбольной аналитикой уже четыре года и зарабатываю этим на жизнь, начиная с 2014 года. Это был замечательный опыт, но не буду отрицать, что новых идей в нашей области уже давно нет. На самом деле это не «кризис в аналитике» или обвинение нашего коммьюнити. Вместо этого я хочу указать на один критический барьер, который мешает развитию статистики, и определить дальнейший план действий. Вкратце, я хочу отстаивать более теоретический, концептуальный подход к футбольному анализу, который, по моему мнению, назрел.

Будет легко прочитать эту короткую статью как призыв к основам, а не к прикладным исследованиям и, следовательно, отвергать идеи как непрактичные. Постарайтесь не делать этого. Мне нравится прикладная футбольная аналитика, и я твердо верю, что она имеет ценность, так же, как и разные мнения. Но я также считаю, что сейчас мы достигли той точки, когда была проделана вся очевидная работа, и чтобы продвинуться вперед, мы должны сделать шаг назад и пересмотреть эту область в целом.

 

Я считаю футбольную аналитику настоящей научной дисциплиной: количественное исследование конкретных множеств сложных систем. Представьте, что это принципиально не отличается от других наук, таких как биология, физика или лингвистика. Это просто менее материально. И, на мой взгляд, мы сейчас достигли точки, когда вся дисциплина сдерживается ключевым аспектом этой незрелости: отсутствием теоретических разработок. Существующие научные дисциплины опираются на теоретические представления для организации своих открытий и предоставляют язык, на котором можно высказывать предположения, приводить аргументы и находки, связанные друг с другом. Нам не хватает такого языка для футбольной аналитики. Мы занимаемся биологией без эволюции; физикой без исчисления; языкознанием без грамматики. В результате, вместо того чтобы строить целостную и постоянно расширяющуюся совокупность знаний, мы собираем отдельные домыслы.

 

Почти весь теоретический арсенал, который мы используем сегодня для описания и изучения футбола, состоит из событий типа «на мяче», то есть он напрямую связан с необработанными данными. Мы говорим об «отборах», «воздушных единоборствах» и «больших шансах», не задумываясь о том, являются ли они подходящей единицей анализа. Я считаю, что это не так. Это не значит, что события ненастоящие; но они являются лишь побочными эффектами сложного и нестабильного процесса, который является футболом, и в отдельности несут мало информации о его истинной природе. Сосредоточиться на них - значит наблюдать за проходящим мимо поездом, глядя на искры, которые он испускает на рельсах. Единственным установленным теоретическим представлением в футбольной аналитике на данный момент являются ожидаемые голы. По понятным причинам они стали центром в нашей области, базовым элементом. Но поскольку он фокусируется на конечном результате (вероятности забитого гола), все остальные действия без влияния на xG игнорируются. Этот акцент на значении футбольного действия или схемы, а не на его природе серьезно подрывает наше понимание основных принципов игры. Точно так же, как отдельные события, связанные с мячом, ожидаемые голы почти ничего не говорят нам о динамических свойствах футбола.

 

Действительно, количественная динамика футбола остается самой большой и до сих пор не исследованной областью игры. У нас очень мало понимания того, как мяч и игроки пересекаются с временем и пространством в ходе игры, и как их траектории и действия объединяются в командную динамику и, в конечном итоге, дают результаты команды, включая голы. Этот разрыв в знаниях заставляет усомниться во всей полноте количественного анализа игроков: поскольку мы не знаем, как отдельные действия игроков вписываются в динамику команды, как мы можем утверждать, что оцениваем игроков надежно? И до того, как возникнет очевидное возражение: эти динамические процессы остаются неисследованными не из-за отсутствия данных отслеживания. Данные о событиях, которые широко доступны в настоящее время, содержат много динамической информации, но пока мы не можем рассматривать эти данные в совокупности.

 

К счастью, появляется новая концепция, которая занимает центральное место: цепочка владения (possession chain). Цепочка владения - это последовательность смен владений на мяче, когда мяч находится под эффективным контролем одной команды. Футбольный матч можно рассматривать как (упорядоченный) набор последовательных смен владений. Это очень позитивное развитие событий, поскольку владения имеют гораздо большее значение как фундаментальные строительные блоки игры, чем события. Это потому, что они по своей природе динамичны - они охватывают время и пространство. Я считаю, что их следует изучать ради них самих, а если вы только считаете их, чтобы выяснить, кто должен получить больший шанс на удар в конце, то, на мой взгляд, вы делаете аналитику неправильно - или, по крайней мере, нет так хорошо, как вы могли бы.

 

Чтобы привести пример такого исследования и почему это важно, рассмотрим вопрос: что делает два владения похожими? Для человеческого мозга, обученного распознаванию образов в течение миллионов лет, это относительно простой вопрос. Тем не менее, довольно сложно, основная исследовательская задача разработать формальную меру сходства, учитывая разнородный характер данных, которые составляют владение (непрерывные пространственные и временные координаты, дискретные события и их упорядочение). Ради аргумента предположим, что у нас есть мера, которой мы довольны. Он имеет непосредственное и мощное применение: теперь мы можем измерить сходство стилей игры команд и игроков, измерив сходство владений, в которые они вовлечены. Этот метод должен быть гораздо более точным, чем нынешние методы, основанные исключительно на результатах, и, как мы знаем, сходство стилей игры имеет множество применений в тактике и скаутинге. Но это не конец истории. Наша гипотетическая мера, уже давшая значительные прикладные преимущества, теперь может быть возвращена к фундаментальным исследованиям. Согласно нескольким относительно умеренным дополнительным допущениям, мера дает богатую структуру множеству всех возможных владений, что потенциально позволяет нам развернуть столетние исследования в общей топологии и метрических пространствах, чтобы делать заявления о футболе. Но несмотря на все эти потенциальные выгоды, предмет остается неисследованным из-за двойных препятствий неадекватного теоретического арсенала и ощущаемого отсутствия непосредственной прикладной выгоды.