13 мин.

Саберметрика. Часть 4. Базовые принципы. Побочные факторы, учитывающиеся при оценке игроков

Продолжаем продвижение по базовым принципам саберметрики. Допустим, мы всё-таки смогли оценить двоих отдельных игроков в ранах (что нам ещё предстоить научиться делать, но не суть, принципы я уже объяснил). Теперь допустим, что оба игрока - позиционные, и мы определили, что игрок А своими хиттерскими и защитными статистиками заработал команде 20 ранов, а игрок В своими хиттерскими и защитными статистиками заработал команде 25 ранов. Всё, оценка закончена и игрок В ценнее на 5 ранов? Не так быстро. Голая статистика даже после перевода в раны не является точным мерилом перфоманса игрока, потому что на её формирование влияют многие побочные факторы, которые нельзя не учитывать при оценке игроков с целью корректировки ценности. Об этих факторах мы и поговорим.

Часть 1. Введение

Часть 2. Краткая история

Часть 3. Базовые принципы. Run expectancy. Win expectancy. Linear weights

* * * * *

Первое и самое очевидное, с чего нужно начать корректировку ценности - это историческое время, в которое игрок играет. Простой пример - Бэйб Рут в 1920 году выбил 54 хоум-рана, Роджер Марис в 1961 году выбил 61 хоум-ран, Барри Бондс в 2001 году выбил 73 хоум-рана. Кто лучше выбивал хоум-раны? Оставив за скобками то, что Бондс к тому времени уже был раздут стероидами, как человечек из эмблемы "Michelin", обратимся к простым арифметичным вычислениям. В 2001 году, в самом сердце "Эры Стероидов", 30 команд MLB выбили 5458 хоум-ранов, в среднем 182 хоум-рана на команду. Бондс выбил 73 хоум-рана, что равно 40,1% от среднекомандного количества хоум-ранов. В 1961 году 18 команд MLB выбили 2730 хоум-ранов, в среднем 151,7 хоум-рана на команду. Марис выбил 61 хоум-ран, что равно 40,2% от среднекомандного количества хоум-ранов. В 1920 году 16 команд MLB выбили 630 хоум-ранов, в среднем 39,4 хоум-рана на команду. Рут выбил 54 хоум-рана, что равно 137,1% от среднекомандного количества хоум-ранов (более того, только одна команда, кроме Янкиз, где блистал Рут, выбила в сумме больше хоум-ранов, чем сам Рут - Филлис выбили 64 хоум-рана).

Пример этот, как и вычисления, которыми я его проиллюстрировал, весьма грубые, и даже немного притянуты за уши (ни в коем случае нельзя такими процентами сравнивать игроков по различным причинам), но основная цель этого примера была не в том, чтобы сравнить знаковые сезоны Бондса, Мариса и Рута, а в том, чтобы наглядно объяснить разницу между различными эпохами в истории бейсбола. Хиттер, стабильно выбивающий 15 хоум-ранов за сезон, сейчас вполне обычное дело (не лопух какой-то, конечно, но и не звезда), тогда как в эпоху "Дедбола" его носили бы на руках, как одного из величайших слаггеров современности. Питчер, стабильно имеющий сейчас ERA в районе 3.00, считается одним из лучших, тогда как во время Первой Мировой ниже были даже некоторые среднекомандные показатели ERA. И так далее, и тому подобное. Поэтому всё, что случилось вне рамок одного сезона, можно сравнивать исключительно с усреднёнными коэффициентами.

* * * * *

Вторым фактором, который нужно учитывать при оценке игроков, является лига, в которой они играют. Опять же очень простой и грубый пример - Дайсуке Мацузака за 8 лет в NPB имел среднюю ERA 2.95, а за 7 лет в MLB имеет среднюю ERA 4.52. Ещё более яркими примерами важности учёта силы лиги являются различные уровни майнор лиг - ERA 3.00 на уровне А нельзя приравнивать к ERA 3.00 на уровне АА, и уж точно нельзя приравнивать к ERA 3.00 на уровне MLB.

Более того, даже разные лиги на одном и том же уровне зачастую конкретно различаются по голой статистике - например, статистика Pacific Coast League кардинально отличается от статистики International League, несмотря на то, что обе эти лиги находятся на одном уровне ААА. И хоть там есть конкретная причина этой разницы - большое количество экстремально хиттерских стадионов в PCL, тогда как в IL стадионы обычные, - уровни лиг могут меняться и вне зависимости от объективных и нерушимых факторов. Например, в одной из лиг одного уровня в один момент собрались 10 топовых питчерских проспектов, а в другой ни одного. Очевидно, что средние питчерские показатели будут лучше в той лиге, где есть эти проспекты, а в другой лиге будут лучше хиттерские. Но в следующем сезоне всю эту десятку переводят на уровень выше, а с низшего уровня поднимаются обычные питчеры, тогда как в другую лигу поднимаются 10 новых топовых питчерских проспектов. Само собой, перекос пойдёт в другую сторону. Ну и так дальше. Поэтому оценивать игроков без учёта силы лиги, в которой они играют, невозможно.

* * * * *

Третьим фактором, о котором мы поговорим, являются (как вы уже, наверное, поняли из прошлого абзаца и сравнения PCL с IL) стадионы и погодные факторы. Как мы отлично знаем, двух одинаковых стадионов в бейсболе наверняка нет (во всяком случае, из более-менее известных боллпарков мне такие случаи неизвестны), а уж двух одинаковых стадионов с одинаковыми погодными условиями нет точно. Поэтому каждый стадион вкупе с погодой в городе, где он расположен, имеет свои характеристики, которые либо помогают бэттерам лучше отбивать (а питчерам, соответственно, мешают лучше бросать), либо помогают питчерам лучше бросать (а хиттерам, соответственно, мешают лучше отбивать), либо являются в целом нейтральными для обеих сторон. Если бы игроки играли на различных стадионах примерно одинаковое время, этими факторами можно было бы пренебречь, но, как мы понимаем, каждая команда половину игр проводит на своём домашнем стадионе и намного больше других пользуется всеми его плюсами и страдает от всех его недостатков.

Хорошим примером экстремального во всех отношениях стадиона является "Корс Филд" в Денвере, домашний стадион Колорадо Рокис. Он возвышается над уровнем моря почти на милю, и в сухом и разрежённом воздухе на такой высоте мячи летят выше и дальше, чем в обычных условиях. Когда его проектировали в начале 90-х, это принималось во внимание, поэтому ограждение поля поставили подальше, но грубо просчитались. Мячи вылетали за пределы поля ненамного хуже, но увеличенный аутфилд привёл ещё и к тому, что чаще стали проходить обычные хиты - аутфилдеры ведь не могут покрывать больше пространства, чем им дано природой. В итоге "Корс Филд" стал просто сумасшедше хиттерским стадионом, и четвёрка слаггеров, игравших за Рокис после открытия нового стадиона - Ларри Уокер, Андрес Галаррага, Данте Бишетт и Винни Кастийя - получили прозвище "Блэйк-Стрит Бомберс" (Блэйк-Стрит - улица, на которой расположен "Корс Филд") за сумасшедшие показатели на своём стадионе. В итоге перед сезоном 2002 года в Колорадо сконструировали большой хьюмидор (в оригинале это небольшая коробка для хранения сигар, в которой поддерживается одинаковая влажность), в котором хранят мячи. Введение хьюмидора немного нормализировало статистики "Корс Филда", но всё равно он до сих пор является самым хиттерским стадионом в MLB, причём с неслабым отрывом - на 15% более хиттерским, чем средний стадион, тогда как второе место занимает стадион Техас Рэйнджерс, который только на 6% более хиттерский, чем средний стадион.

Но стадионы отличаются между собой не только общими тенденциями, т.е., хиттерский он, питчерский или нейтральный. Каждый из стадионов имеет различные "предпочтения" - у одного стены далеко и он допускает меньше хоум-ранов, зато допускает больше триплов ("Петко Парк" в Сан-Диего), у другого большая зелёная стена, которая порой превращает хоум-ран в сингл, а аут в хоум-ран ("Фенуэй Парк" в Бостоне), у третьего под крышей балки, при попадании мяча в которые применяются специальные правила ("Тропикана Филд" в Сент-Питерсберге (Рэйс)), над четвёртым постоянно дуют различные ветры и его "специализация" меняется изо дня в день ("Ригли Филд" в Чикаго (Кабс)) и т.д. и т.п. Поэтому при определении так называемых парк факторов (берётся статистика игроков на этих парках за несколько сезонов подряд и усредняется) определяется не только общий парк фактор, а и парк факторы для всех видов хитов, всех типов отбитых мячей (граундбол, флайбол, лайндрайв) и даже страйкаутов с уоками. Да-да, на страйкауты и уоки стадион тоже имеет незначительное влияние, которое, скорее всего, связано с психологией питчеров - например, на том же "Корс Филде" питчеры боятся атаковать зону и бросать по её верху, поэтому там меньше страйкаутов и больше уоков, а на условном питчерском стадионе ("Петко Парк" или там "Сэйфко Филд") всё наоборот. Полную таблицу парк факторов можно глянуть тут (100 - средний показатель, 101 - стадион на 1% более "хиттерский", чем средний, 99 - стадион на 1% более "питчерский", чем средний).

Но и это ещё не всё. Возьмём для примера тот же "Фенуэй Парк" (фото) и стадион исторических врагов Бостона из Нью-Йорка "Янки Стэдиум". На "Фенуэе" есть "Грин Монстр", который очень сильно повышает вероятность даблов и немного повышает вероятность хоум-ранов, но только для правшей, которым удобнее отбивать туда мяч. Левши же на "Фенуэй Парке" чувствуют себя куда хуже, так как они чаще отбивают мяч в большой правый филд, называемый часто "вторым центрфилдом". На "Янки Стэдиум" всё наоборот - близко расположенная стена правого филда помогает левшам выбивать больше хоум-ранов, а большой левый филд усложняет хиттинг правшей. Соответственно, на "Фенуэе" плохо бросать левшам, а на "Янки Стэдиум" - правшам. Поэтому часть вышеприведённой таблицы парк факторов с видами хитов разделяется ещё и на правшей/левшей. Её можно увидеть тут (легенда та же).

Все вышеприведённые факторы - время, лига и стадион - учитываются в многих статистиках, в которых есть приставки "+" или "-" (OPS+, ERA-, wRC+, FIP- и т.д.). Эти статистики являются усреднёнными, и с их помощью очень хорошо грубо сравнивать игроков из различных эпох, лиг и стадионов. Они тоже далеко не идеальны, о чём мы поговорим позже, когда будем их рассматривать, но тем не менее.

* * * * *

Следующий фактор, который обязательно нужен учитываться при комплексной оценке игрока - позиция, на которой игрок играет. Ни для кого не секрет, что кэтчер - самая сложная позиция на поле, где могут нормально играть единицы, а вот на первой базе после небольшого обучения сможет сыграть практически любой игрок, который нормально играет на другой позиции. Поэтому и выходит, что, например, великолепные защитники на позиции шортстопа, которые сохраняют много ранов своей защитой (вроде Андрелтона Симмонса или Хосе Иглесиаса) не обязательно должны быть хорошими хиттерами, вполне покатит и довольно средняя игра в атаке. А вот первому бейсмену для того, чтобы оправдать своё существование на поле, нужно выбивать кучу хоум-ранов или хотя бы кучу других хитов, иначе он бесполезен.

Идея "защитного спектра" была высказана Биллом Джеймсом ещё в 80-х, и он высчитал сложность позиций в таком порядке (от самой лёгкой до самой сложной) - DH-1B-LF-RF-3B-CF-2B-SS-C. И это, в принципе, очевидно даже при применении небольшой логики и знания истории. Те, кто уже не может нормально играть шортстопа, превращаются либо во вторых бейсменов, либо в третьих бейсменов; те, кто уже не может нормально играть центрфилдера, перемещаются в угол аутфилда; те, кто уже не может нормально играть кэтчера, третьего бейсмена или углового аутфилдера, переходят на первую базу; те, кто уже не может нормально играть нигде, становятся назначенными хиттерами. И вполне очевидно, что у среднего центрфилдера, который перешёл на позицию углового аутфилдера, станет более хорошая защитная статистика и, как следствие, можно подумать, что он как игрок стал сильнее (при условно равной его ценности как хиттера). Но это не так, ведь центрфилдер важнее углового аутфилдера, и это просто необходимо учитывать. Как быть?

Том Танго для этого разработал примерные ценности каждой позиции, которые начисляются автоматом каждому игроку позиции. Вот эти значения (в ранах, исходя из 600 выходов на биту):

  • С: +12,5

  • SS: +7,5

  • 2В: +2,5

  • 3B: +2,5

  • CF: +2,5

  • LF: -7,5

  • RF: -7,5

  • 1B: -12,5

  • DH: -17,5

Рассмотрим это на простом примере. В текущее межсезонье Твинс объявили, что их звёздный кэтчер Джо Мауэр теперь будет исключительно первым бэйсменом. Позиционная ценность кэтчера: +12,5 ранов за 600 выходов на биту, позиционная ценность первого бейсмена: -12,5 ранов за 600 выходов на биту. Значит, Мауэр только за то, что сменил позицию, получил к своей ценности минус 25 ранов за 600 выходов на биту. Конечно, у Твинс были свои причины на то, чтобы сделать такое передвижение - Мауэр слишком часто травмируется, и перевод на первую базу может помочь ему быть здоровее в будущем, да и первые бейсмены играют больше матчей за сезон, чем кэтчеры, так что хиттингом он какую-то часть этих потерянных ранов отобьёт, но смысл вы поняли.

Ещё один небольшой пример. Однажды, когда я в одной из статей назвал Наполи лучшим защитным первым бейсменом MLB прошлого сезона, меня спросили - как так может быть, если у него средний показатель защиты, который вычисляет Fangraphs - минус 0,6? На это я предложил задавшему вопрос отсортировать всех первых бейсменов в 2013 году по этому показателю и убедиться в том, что Наполи действительно лучший защитный первый бейсмен. Но человек спросил снова - как так получается, что у всех показатель минусовый? На это я ответил просто и понятно - любой первый бейсмен изначально слабый защитник, если сравнивать его с игроками других позиций, поэтому и значения у всех минусовые. Это немного грубоватое объяснение, "на пальцах", но теперь, зная, что в таких показателях учитывается корректировка за счёт позиции, вы понимаете, почему они минусовые.

Как я уже сказал, такая корректировка идёт только для защитных статистик (хиттерские тоже можно при желании скорректировать подобным образом, но это очень сложный процесс. А основные хиттерские статистики не зависят от позиции), так что при сравнении чисто хиттерских статистик нужно просто держать в уме важность позиций, исходя из позиционного спектра и понимать, что если два игрока имеют одинаковый показатель неусреднённой защитной метрики (например, UZR или DRS), а игрок А лучше в хиттинге, чем игрок В, это ещё не значит, что игрок А более ценен для команды, чем игрок В.

* * * * *

Последнее, что нужно учитывать при оценке игрока, это его возраст. Все знают, что чем моложе игрок, тем у него лучше физика, но и опыт не нужно сбрасывать со счетов. Саберметрики давно вычислили графики роста и падения самых различных скиллов игрока. Хиттеры, например, становятся в целом всё сильнее и сильнее до тридцатого года жизни, после чего начинается постепенное падение их продуктивности. У питчеров немного по другому - вместо "параболы" хиттеров, их график состоит из нескольких "плато", на которые они переходят резко (это связано с различными факторами - резкое улучшение может быть обусловлено изучением нового качественного питча или смены механики броска, а резкое падение может быть обусловлено, например, травмой и серьёзным падением скорости фастбола), но удерживаются на каждом несколько лет. Для филдинга и бейсраннинга пик идёт в самой молодости (никогда не устану напоминать, что Мигель Кабрера, который сейчас и на первой базе слабый защитник, в молодости играл шортстопа), после чего идёт постепенное снижение качества (что и понятно - защита и бейсраннинг наиболее зависимы от чистой физики). Плюс к этому различные скиллы этих категорий тоже ведут себя по-разному - у хиттеров, например, с возрастом ухудшается контакт, зато улучшается умение распознавать те питчи, на которые нужно свинговать, у питчеров с возрастом ухудшается скорость фастбола, но улучшается контроль, и так далее.

Статистик, которые учитывают возраст, нет, да они и не нужны. Возраст в саберметрике бесполезен при сравнении качества сезонов условного 33-летнего игрока и условного 22-летнего игрока, но бесценен для прогнозирования того, как потенциально будет играть игрок в следующих сезонах. Поэтому возраст и графики качества различных позиций всегда нужно учитывать при анализе транзакций (почему условно 7-летний контракт 30-летнему игроку хуже, чем 10-летний контракт 22-летнему игроку и т.д.), а также при оценках проспектов (условно - игрок, выбивающий 20 хоум-ранов в 20 лет на уровне ААА, чаще всего будет более хорошим проспектом, чем игрок, выбивающий 20 хоум-ранов в 20 лет на уровне А).