Учеба на футбольного аналитика в Германии - первые 2 недели
Так как этот пост открывает серию постов, посвященных одной теме (и скорее всего, только эти посты составят блог в ближайшее время), то сначала расскажу немного о себе. Мне 30 лет, 10 лет живу в Германии (откуда переехал из Сибири после окончания университета) и последние 3 года я работаю в одной из компаний DFL (Sportec Solutions) футбольным Data Scientist'ом (о том. как это получилось, можно почитать здесь). За это время я и моя команда сделали много интересных вещей для немецкого и американского футбола:
Bundesliga Match Facts - продвинутые статистики, основанные на ивент- и позиционных данных. Самая известная из них это, конечно, xG, но есть как и простые - Player Speed (максимальная скорость игрока), Speed of Shot (скорость удара), так и более сложные - Pressure Index / Pressure Handling (меры прессинга и успешности действий под ним), Passing Profile (профиль всех пасов игрока, где сложность каждого паса оценивается числом xP от 0 до 1 - «ожидаемым пасом») и многих других. Эти статистики, предназначенные в основном для обычного зрителя, вы могли видеть во время трансляций Бундеслиги в виде инфографики, а также на сайте и приложении Бундеслиги)
Data Story Finder - утилита для комментаторов, находящая из вышеупомянутых Bundesliga Match Facts интересные истории о матче и подсвечивающая их в Commentary Live System - приложении для комментаторов, куда до, во время и после матча собирается специально отобранная информация о матче.
Advanced Stats Platform - с прошлого года мы поставляем услуги по анализу данных для МЛС: отчасти это связано с их новым партнерством с Apple, а также со сменой стратегии по использованию данных внутри лиги. Поэтому мы должны были сделать скалируемую и конфигурируемую платформу, на которую можно было бы «насадить» все то, что мы уже сделали для Бундеслиги, а также делать что-то новое и уникальное для МЛС. К тому же, если завтра к нам придет, например, Серия А, то за 1-2 недели мы сможем дать абсолютно такой же сервис, как для немецкой и американской лиг.
Различные отчеты для клубов 1 и 2 Бундеслиги, а также всех национальных сборных Германии. Я не могу рассказать их детальное содержание, но они содержат продвинутые статистики и модели, реализуемые на выше упомянутой Derived Stats Platform.
А также некоторые другие (и тоже, к сожалению, конфиденциальные) проекты для медиа, клубов и даже судейского корпуса.
Все это звучит здорово, но есть одно «но» - зачастую во время работы ты закапываешься в рутину и редко общаешься с людьми вне твоей команды / компании /только клиентами. К тому же, в какой-то момент я бы, возможно, хотел уйти работать в клуб, организовав работу с данными и понимая потребности и требования работников клуба - тренера, игроков, аналитиков, медицинского штаба, а также менеджмента. Поэтому несколько лет назад, отучившись на категорию C (посты об учебе в 2019-2020 - раз, два, три, четыре, пять, более свежее интервью с Антоном Имша, отучившимся на категорию B тут) я проработал полтора года тренером, видеоаналитиком и скаутом в молодежной и основной командах клуба 4-ой лиги (о работе можно почитать здесь и здесь, о скаутских курсах - здесь), но когда стало невозможно совмещать с работой в DFL, на какое-то время ушел в IT, а в прошлом году решил быть ближе к клубам и начать учиться на футбольного аналитика. Людей видишь чаще, знакомишься с новыми, получаешь знания, и что еще важнее - получаешь нетворкинг.
Как стать футбольным аналитиком (официально)
Как ни странно, чтобы стать футбольным аналитиком, совсем не обязательно учиться в каком-нибудь учебном заведении или посещать курсы. Более того, последние 10-15 лет аналитиками становились в основном либо самоучки-энтузиасты, либо бывшие игроки / тренеры (хотя, конечно, есть и большая часть выпускников спортивных вузов). А сейчас можно найти массу материалов, обучающих работе с видео, найти доступ к видео, найти доступ к данным и со всем этим начинать строить свое портфолио, публикуя аналитику в медиа. И скорее всего, сейчас это все еще самый быстрый способ попасть в индустрию с нуля.
Но в Германии решили делать немного по-другому. В Немецком спортивном университете Кельна (Deutsche Sporthochschule Köln, DSHS) в 2015 году совместно с DFB решили сделать специальную магистерскую программу Master of Arts in Spielanalyse, готовящую именно спортивных (с фокусом на футбол) аналитиков. Раз в 2 года профессор Даниэль Меммерт набирает 20 человек с опытом работы в спорте и вместе с приглашенными экспертами учит их работать с видео и данными. По окончанию студенты пишут магистерскую работу (учат также работать с научными источниками и писать статьи) уже либо внутри клуба, либо внутри университетской исследовательской группы. В 2023 году начался 5-ый набор, и я решил, что смогу совмещать обучение с полноценной работой, тем более, что это уже моя третья магистратура, да и многие предметы мне знакомы из рабочего опыта. Учеба наполовину заочная - за 2 года нужно приезжать 10 раз по 3-4 дня в Кельн на занятия, но делать домашки можно и дома.
Курс состоит из 6 модулей (относительно вольный и корявый перевод с немецкого):
Диагностика производительности в спорте - основы / классификация анализа игры
Методы научного исследования
Идентификация талантов и анализ игрока в отдельности
Использование и применение ПО / баз данных для аналитики
Качественный и количественный анализ игры в юношеском и взрослом спорте высоких достижений
Анализ игры и тренировок онлайн и вживую
Для поступления нужны:
Знания немецкого на уровне C1, подтвержденные сертификатом
Знания английского (не проверяются), так как процентов 20 лекций на английском + большинство исследований только на английском
Степень бакалавра
Хотя бы 1 год опыта работы в футбольной аналитике (но подойдет даже опыт в любительском футболе, если человек делал полноценный игровой анализ с видео)
Рекомендации от коллег (это по желанию, но важный критерий отсева)
CV и мотивационное письмо
Стоимость учебы:
Учеба платная - 7800 евро за 2 года (1950 за семестр).
По желанию можно оплачивать стандартный семестровый сбор в 330 евро за пользование университетскими плюшками (бесплатный проезд по Кельну, статус студента, дающий массу скидок).
Если не живешь в Кельне, то можно жить в гостинице при университете по адекватной цене - 40 евро за ночь.
Так как я не живу в Кельне, то добавляется еще и проезд из Берлина и обратно (около 100 евро за поездку),
В итоге за 2 года выходит примерно 12000 евро.
С одной стороны, это не дешево - учеба в немецких университетах в большинстве случаев бесплатная и требует только оплаты семестрового сбора. С другой стороны, смотря с чем сравнивать - когда-то до ухода в футбол я всерьез думал об MBA, стоимость которого в приличной бизнес-школе начинается от 50000 евро (если нет стипендий). Получить тренерскую лицензию Pro в Германии стоит 19000 евро, но до нее нужно сначала дойти и потратить еще около 5000-7000 евро на предыдущие лицензии в лучшем случае. В общем, 12000 евро, растянутые на 2 года, не испугали, хотя и не порадовали.
Учеба началась еще в середине ноября. Нас позвали в Кельн на 3 дня, где частично читали лекции по первым двум модулям. Всего в группе 23 человека - 21 немец, я и один тренер из Польши. Половина студентов - свежие бакалавры, работающие в молодежных командах клубов 1, 2 и 3 Бундеслиги тренерами или аналитиками, есть скауты Аугсбурга и Шальке, есть коллеги из других провайдеров данных. Из самых интересных (и возрастных) коллег - 47-летний аналитик женского Вольфсбурга, самой доминирующей команды Германии последнего десятилетия. Расскажу про каждый из дней первой недели и сразу же перейду ко второй, с которой возвращаюсь сейчас домой.
Неделя 1, 21 ноября 2023
Мы начали со вступительной лекции от руководителя программы Даниэля Меммерта о текущем состоянии индустрии футбольной аналитики в целом, истории футбольной аналитики в Германии, а также самой программе в целом. Самое интересное в ней было посмотреть, как менялся анализ от начала нулевых (анализ на кассетах / DVD-дисках, вручную проставленные ивенты в на коленке сделанном софте и верхнеуровневые статистики) до текущего момента (отделы аналитиков, пайплайны данных и модели машинного обучения).
Затем к нам на 2 часа присоединился Адриано Баккони - бывший главный скаут Интера и сборной Италии, работавший в ней на ЧМ-2006, один из основателей Infornt Sport&Media - компании-провайдера аналитических данных для Серии А. Он показал приложение с различной статистикой, доступ к которому во время матча есть у всех итальянских клубов. Мне показалось оно достаточно сырым (не говоря про ужасный UI), но судя по всему, те клубы, у которых нет своего отдела разработки, им активно пользуются.
Последняя лекция в тот день была от Мануэля Бассека - пост-дока и сотрудника кафедры Даниэля Меммерта. Он рассказывал про метрики и тесты, используемые в медицинском и спортивном анализе. После этого мы разошлись на пару часов, и вечером собрались снова уже в неформальной обстановке на ужин. Там мы поближе познакомились как с преподавателями, так и между собой, а еще тогда же вручили дипломы выпускниками прошлого набора.
Неделя 1, 22 ноября 2023
Утром мы встретились с Себастьяном Зелиховски - бывшим техническим директором Герты и шеф-скаутом Франкфурта, сейчас работающим консультантом. C ним мы говорили об использовании инновацией в клубах, отдельно узнали побольше про EintrachtTech - большой IT-отдел, занимающийся внедрением данных не только для первой команды и академий, но и глобально внутри всех подразделений клуба. В основном мы делились опытом и мнениями, куда поведет дальше использование данных и сошлись на том, что использование данных уже неизбежно и будет все глубже и глубже проникать в клубы, но главная причина и тормоз их использования - старшее поколение менеджмента с нежеланием принимать новое и большим эго. Как решать эту проблему, кроме как пытаться находить индивидуальные подходы через интересы определенного человека в управлении - не очень понятно.
Затем мы снова слушали лекцию от Мануэля Бассека, теперь уже о научных методах. Здесь мне особо нечего рассказать, поскольку это достаточно общие вещи, не имеющие прямое отношение к футбольной практике. С другой стороны, очень полезно понимать, как нужно проводить эксперименты для исследований, как нужно работать с данными и как работать с литературой. Только если ты это не слушаешь уже в четвертом университете.
И под конец дня мы встретились с Томасом Бройхом - бывшим футболистом Боруссии Менхенгладбах, Кельна и сиднейского Брисбэйна, ТВ-экспертом на ZDF, а теперь руководителем отдела методологии в берлинской Герте. В клубе он задает философию, по которой стремятся играть как молодежные, так и основная команда. Конечно, это делается совместно со всеми тренерами, в том числе и с главным, хотя в случае первой команды возможны расхождения или же наоборот, первая команда может задавать тренды, используемые в будущем в клубе. На примере всех молодежных команд он показывал игровые принципы, а также то, чем они вдохновляются (как ни странно, это Брайтон и Манчестер Сити).
После лекции мы разделились на группы и поехали на матч сборной Германии U21 - в тот вечер в Эссене они играли с Польшей. У каждой группы было задание - отследить определенного игрока, позицию и то, что он делает в разных фазах игры. Нам достался Натаниэль Браун - левый защитник из Нюрнберга, перешедший в это трансферное окно в Айнтрахт.
Неделя 1, 23 ноября 2023
Утром мы должны были собраться вместе, сделать видеонарезку и презентовать то, что увидели. У каждой группы было 5 минут на презентацию и 15 минут на обсуждение. Для меня лично самой большой сложностью в живом анализе оказалось отсутствие ноутбука - мы делали пометки вживую, и потом уже утром отсматривали моменты, которые хотели включить в нарезку.
После этого мы провели пару со Штефаном Ноппом - если вы смотрели документалку All of Nothing о сборной Германии на ЧМ-2022, то возможно, запомнили аналитика из штаба Ханси Флика. Штефан работает в DFB уже 14 лет со времен работы над своей диссертацией. С ним мы говорили о Leistung (по-русски переводится как производительность, но лучше всего подходит англицизм Performance), о том, что это такое (с разных точек зрения - физика, психология, дата-аналитика), как это измерить и почему в измерении всегда будет субъективность.
За следующие 2 месяца мы должны были сделать небольшие домашки - так как лекции относились к первым двум модулям, то и домашки были соответствующие: прочитать несколько научных работ и ответить на вопросы про их использование на практике, придумать рейтинговую систему оценки результатов медицинских тестов, и также написать expose минимум на 3000 слов на тему своей будущей магистерской работы - по сути, это часть с обзором литературы и выбором методов. В целом, домашка делается за выходные, если есть четкая идея работы.
В ту же поездку я продлил свою тренерскую лицензию, посетив дополнительный курс по мотивации внутри клуба во Грюнберге - там я учился на тренера, и так как были удобные свободные даты, решил поехать туда. А за день до этого заехал в DFB-Akademie во Франкфурте - встретиться еще раз со Штефаном и другими бывшими коллегами, но это уже было по основной работе в Sportec'e. В последний раз я был в DFB, когда академия была еще неоткрыта, и удалось впервые увидеть главное место немецкого футбола.
Помимо массы технологических инноваций и множества полей - как открытых, так и закрытых, внутри кампуса есть даже комнаты для игроков сборной, где они могут жить во время сборов, если сборы запланированы во Франкфурте.
Сейчас же я возвращаюсь со второй недели домой в Берлин. Приходится делать это на один день раньше конца учебы, поэтому про третий день напишу в следующем посте.
Неделя 2, 5 февраля 2024
Мы начали с презентации Йоханнеса Риггера - главы аналитического отдела в Боруссии Менхенгладбах. Их отдел состоит из трех видеоаналитиков (один ответственен за соперника и тактику, второй за стандарты, третий - студент, помогает первым двум), одного дата-саентиста (и параллельно дата-инженера), а также одного дата-аналитика. Подготовка к игре проходит так: осматривается 4-5 игр соперника, нарезается 15-минутное видео, которое обсуждается с тренерами и затем несколько раз видоизменяется. Каждому из игроков также готовится 1,5-2 минутная нарезка и отсылается как на телефон, так и дается на отдельном айпаде перед игрой уже в раздевалке. Также игроками готовятся небольшие выжимки с данными о соперниках, но совсем небольшие, чтобы не перегружать. В лайве видеоаналитики готовят нарезки перед перерывом, подкрепляют их данными с дэшбордов и дают небольшую выжимку тренеру в первые несколько минут после перерыва. Уже после игры уже через 2 часа проводится послематчевый анализ вместе с видео и данными.
Помимо самого матча, команда аналитиков ответственна за съемку и ее техническую составляющую, сбор и коллекцию данных (вместе с их инфраструктурой), подготовкой отчетов по физике и нагрузками, а также доставке данных тренерскому штабу по запросу.
Следующая презентация была от Дениз Мартин - лектору по Sports Performance Analysis в Atlantic Technological University, Дублин. Она рассказывала про формирование профессии Performance Analyst, необходимые навыки для того, чтобы считаться профессионалом и сам процесс формирования сообщества аналитиков - даже сейчас не везде внутри футбольной индустрии есть четкое разделение задач и профилей сотрудников внутри клуба. Очень часто один человек делает разную работу, ведь обязанности не закреплены, и в этом плане футбол сильно отстает от традиционного бизнеса. Поэтому такие исследователи, как Дениз, формируют в сознании индустрии разделение обязанностей и помогают людям понять, какое место в клубе им подходит лучше всего.
Последние 2 презентации были посвящены разбору домашек и умению писать академическое письмо - их в этом посте я тоже пропущу.
Неделя 2, 6 февраля 2024
Начну с конца дня - 2 лекции были о: совсем базовой статистике (описательных статистиках, распределениях и случайных величинах) и также различных bias'ах как в обычной жизни, так и в процессе написания научных работ.
А вот начинали мы день с презентации от аналитика Шальке Фабио Кассалнуово. У них очень похожий процесс, как и в Гладбахе, за исключением лишь того, что большую часть IT-работы выполняется на аутсорсе. Например, у них есть приложение, внутри которого собраны данные по европейским и латиноамериканским лигам, взятые из данных Sportec'a, Wyscout'a, Skillcorner'a и Transfermarkt'a. В итоге внутри клуба есть масса дэшбордов, где перформанс игрока сводится к нескольким индексам, составленным из еще большей кучи индивидуальных данных и статистик, собранных и ивент- и позиционных данных. Собственно, одним из наших заданий было взять 55 метрик в целом используемых в клубе, и для каждой позиции сгруппировать метрики в разные индексы, используя z-score, а также решив, где лучше брать абсолютные / относительные / p90 значения.
В целом, для меня пока что многие вещи, рассказанные за эти 2 недели, либо повторяются, либо не новы. Но это только первые и базовые предметы, дальше будет гораздо больше заданий, связанных с видеоанализом и более продвинутым анализом данных. Плюс вышеупомянутый нетворкинг - видя людей чаще, гораздо проще найти нужную связь с определенным человеком, или же получить совсем неожиданное, но необходимое знакомство.