10 мин.

Саберметрика. Часть 7. Теории и мифы. DIPS

Прежде чем цикл перейдёт в ту фазу, которая, наверное, больше всего интересует читателей - разъяснение различных статистик - считаю, что нужно познакомить читателей с несколькими вещами, которые, пусть и не являются базовыми принципами саберметрики, но уже стали весьма важными её компонентами. Если объединить их в одну группу (что я и сделал), то их можно назвать теориями, которые опровергают древние мифы. Некоторые с натяжкой являются теориями, некоторые опровергают не такие уж и закоренелые мифы, но тем не менее, что-то общее у них есть.

Первая из таких теорий - теория DIPS. Расшифровывается DIPS как "Defence Independent Pitching Statistics", т.е., точнее было бы отбросить последнее слово и оставить только DIP, но теория разрабатывалась вместе со статистиками, и поэтому аббревиатура всегда используется вместе с "S". Мы, правда, о статистиках поговорим позже, когда этому придёт время, так что статья может показаться вам не слишком полной, но не переживайте - так оно и было задумано.

Часть 1. Введение

Часть 2. Краткая история

Часть 3. Базовые принципы. Run expectancy. Win expectancy. Linear weights

Часть 4. Базовые принципы. Побочные факторы, учитывающиеся при оценке игроков

Часть 5. Базовые принципы. Выборка. Сплиты и платуны

Часть 6. Базовые принципы. Регрессия. Прогностические системы

* * * * *

Когда в январе 2001 года чикагский студент Роберт МакКрекен по кличке "Ворос" опубликовал свою новаторскую статью в Baseball Prospectus, он начал её словами "Мне говорят, что я сошёл с ума". Главный вывод статьи, которая совершила прорыв в саберметрике, был коротким, но на первый взгляд казался полностью неправдоподобным: "Умение предотвращать хиты при выбитых в поле мячах одинаково или практически одинаково для всех питчеров". То есть, другими словами - будь ты хоть Педро Мартинес, будь ты хоть Арон Селе, если ты позволил бэттеру отбить мяч в поле, у вас практически одинаковые шансы выдать хит или сделать аут. "Третьими" словами - у питчера нет никакого контроля над ситуацией после того, как бита встретится с мячом и тот останется в поле, поэтому игру питчера следует оценивать исключительно по тем показателям, которые не зависят от действий защитников. Такие заключения 14 лет назад действительно выглядели как полная ересь - как так, ведь топовые питчеры выдают слабый контакт, который филдерам легче превратить в аут, а слабые питчеры выдают лайнер за лайнером, за которыми попробуй угнаться?

Хотя на самом деле такая реакция консервативной общественности была достаточно странной, ведь главный традиционный питчерский показатель, ERA, кроме всего прочего, был введён для того, чтобы разграничить раны, которые выдал питчер из-за своего плохого перфоманса, и раны, которые ему "помогла" выдать защита. То, что ERA делает это примитивно и однобоко (зачастую ошибки весьма субъективное мнение скорера, не говоря уже о том, что после ошибки скорер часто должен восстанавливать иннинг как ему кажется, он бы развился без ошибки, и т.д.) - вопрос десятый, главное, что делает. И тем не менее, DIPS была встречена в штыки даже некоторыми членами развивающегося саберсообщества. Не слишком помогло и то, что МакКрекен в своей статье только расписывал итоги исследования, о принципах которого рассказал только поверхностно.

Тем не менее, все аналитики поспешили проверить заключения МакКрекена, выбирая любые возможные углы, которые бы позволили подтвердить или опровергнуть эти тезисы. В конце концов оказалось, что МакКрекен не прав на все 100%, но общая его идея подтвердилась и была дополнена по принципу "с миру по нитке". Через два года МакКрекен получил должность в аналитическом отделе Бостон Ред Сокс, ещё через 2 года был уволен (не смог найти что-то новое касательно DIPS), и сейчас работает аналитиком в соккере, но тем не менее, теория DIPS, дополненная мелкими нюансами, плотно укоренилась в важной нише саберметрики.

* * * * *

Итак, что является "столбом" DIPS? Питчеры могут контролировать только три показателя, которые как раз и являются независимыми от защиты - страйкауты, уоки и хоум-раны. Конечно, иной раз третий страйк уходит от кэтчера и раннер добирается до первой базы, а хоум-ран защитник может "украсть", но это бывает так редко, что этим можно пренебречь. Также через некоторое время после статьи МакКрекена ресёрчеры обнаружили, что умение инициировать инфилд папфлаи тоже является независимым от защиты, и является реальным, но в основных статистиках DIPS оно не учитывается (хотя учитывается в WAR по версии Fangraphs, где инфилд папауты считают наравне со страйкаутами). Всё, что происходит на поле помимо этих трёх исходов выхода на биту, входит в статистику, называемую BABIP (Batting Average on Balls In Play), которая показывает, какой процент мячей, выбитых в поле, стали хитами (подробнее о BABIP и её применении - вместе с другими DIPS-статистиками), и которая как раз и является показателем, который питчеры не могут контролировать.

Почему так получается? "На пальцах" эта концепция настолько проста, что даже удивительно, что она пришла в голову обычному студенту, а не кому-то из "зубров" саберметрики, которых в начале 2000-х уже насчитывалось не так и мало. Ресёрчеры Том Танго, Эрик Аллен и Арвин Су после публикации результатов МакКрекена пошли даже дальше - они провели сложную серию расчётов, дабы определить хотя бы приблизительную долю каждой из переменных величин, которая может повлиять на участь мяча, отбитого в поле, и эти результаты я приведу после описания каждой из этих величин.

Во-первых, любой, кто когда-нибудь смотрел бейсбол, отлично знает, что любой, даже самый быстрый лайнер может прилететь прямо в руки филдеру, а любой слабый дрибблер, десять раз отбившись от газона, может просочиться в дырку между шортстопом и третьим бейсменом (для иллюстрации (спасибо сайту Fangraphs) вот вам две гифки с участием Дастина Педройи, где сначала явный хит становится аутом, а потом явный аут становится хитом). Это чистое везение/невезение. Танго сотоварищи определили, что влияние такого чистого везения на участь мяча, отбитого в поле, составляет 44%.

Во-вторых, нельзя не учитывать качество защиты, которая окружает питчера. Ошибки, как я уже говорил (и как повторюсь ещё не один раз в этом цикле) - часто бывают субъективным решением скорера, и, тем не менее, их пытались отмежевать от оценки работы питчера ещё тогда, когда многие саберметрики даже не появились на этот свет. К тому же, ошибки, даже если бы в их определении не было человеческого фактора - это не единственное влияние защиты на работу питчера, есть просто мячи, которые плохой защитник не может поймать/сыграть, а хороший может. Для наглядности давайте посмотрим на сравнение сыгранных (зелёные точки) и несыгранных (красные точки) мячей в 2014 Андрелтона Симмонса и Дерека Джитера:

В аутфилде это видно даже нагляднее - вот подобные чарты Джеки Брэдли в 2014 и Шин-Су Чу в 2013, когда он играл центрфилдера:

Как думаете, у какого питчера будет больше выданных хитов - у того, который при прочих равных имеет за своей спиной Симмонса или JBJ, или у того, который имеет за своей спиной Джитера или Чу? Думаю, ответ тоже очевиден, и ошибки тут попросту ни при чём. Танго сотоварищи отвели защитникам долю влияния на участь мяча, отбитого в поле, 17%.

В-третьих, конечно же, на участь мяча, отбитого в поле, влияет стадион и его особенности. На "Фенуэй Парке" есть "Грин Монстр", превращающий лёгкие флайболы в даблы, на "Корс Филд" - разрежённый воздух, позволяющий мячам лететь дальше, обманывая филдеров, на "Петко Парк" есть огроменный аутфилд, затрудняющий аутфилдерам ловлю мячей, на "О.ко Колизее" есть большая зона фаула, помогающая ловить больше фаул папфлаев, и т.д., и т.п. Всё это, по исследованию Танго сотоварищи, влияет на участь мячей, отбитых в поле, на 11%.

* * * * *

Если вы внимательно читаете и не имеете проблем с математикой, вам понятно, что 44%+17%+11% не равно 100%. Действительно, остаётся ещё 28%, за которые, по мнению исследования Танго, Аллена и Су, ответственным является питчер. Тут недоверчивому читателю полагается воскликнуть: "И какого лешего я тут читаю о теории, по которой питчер не контролирует участь мячей, отбитых в поле, когда через пару абзацев становится известно, что он таки контролирует? И что, если только на 28%? А если цифры ресёрчеров не точные, и питчер на самом деле влияет больше?"

Но дело в том, что даже знание того, что питчер влияет на участь отбитых в поле мячей только на 28%, а не на 100% (за исключением ошибок, как в ERA) - это уже большой прорыв в понимании оценки перфоманса питчера. Огромный. Плюс, что намного важнее, эти 28% следует понимать немного не так категорично, как обычную цифру. Да, есть особенности, которые помогают питчерам уменьшать вероятность хитов при отбитых в поле мячах, но это определяется профилем игрока. Питчеры, которые инициируют лёгкий контакт, лимитируют BABIP из-за того, что чем легче отбит мяч, тем легче его сыграть - это наклболлеры, за счёт непредсказуемости питча, а также "finesse"-левши (питчеры, у которых слабый фастбол, но сильные контроль, комманд и брейкинг болы - Джейми Мойер, Марк Бёрли и т.д.). Экстремальные флайбол-питчеры лимитируют BABIP чисто из-за того, что флайболы реже превращаются в хиты (не-хоум-раны), чем граундболы, а также из-за того, что, как правило, они умеют инициировать большое количество инфилд папфлаев, которые хитами практически вообще не становятся.

И тем не менее, хоть питчеры за счёт своего репертуара хоть как-то и могут влиять на участь отбитых в поле мячей, это мало коррелируется с их качеством. Экстремальным флайболлером может быть Джош Беккетт в период своего расцвета, а может быть Крис Янг. Finesse-левшой может быть как Том Глэвин, так и Крис Капуано. Карьерный BABIP Клиффа Ли - .298, карьерный BABIP Джейми Райта - .302. Карьерный BABIP Нолана Райана .265, карьерный BABIP некоего Герма Вехмайера - .262. И так далее.

Ещё одной серьёзной проблемой в традиционной оценке питчера (т.е., по количеству выданных ранов) является то, что этот самый BABIP является страшно непредсказуемой статистикой из года в год даже для одного и того же питчера в одной и той же команде. BABIP Педро Мартинеса в 1999 году составил .325, BABIP Педро Мартинеса в 2000 году составил .237 (а потом .310, а потом .274). BABIP Ю Дарвиша в 2013 году составил .264, BABIP Ю Дарвиша в 2014 году составил .334. Кит Вулнер и Дэйн Перри в своей статье для книги "Baseball Between The Numbers: Why Everything You Know About The Game is Wrong" определили корреляцию некоторых питчерских показателей из года в год, и пришли к таким цифрам (корреляция "0" = нет корреляции, корреляция "1" = идеальная корреляция): BABIP - .272, хоум-раны по отношению к противостоявшим им бэттерам - .470, уоки по отношению к противостоявшим им бэттерам - .676, страйкауты по отношению к противостоявшим им бэттерам - .790, процент граундболов - .807 (процент граундболов учитывается во многих прогностических DIPS-статистиках, о которых, повторюсь, позже). То есть, предсказать BABIP очень малореально, даже имея серьёзную базу данных, тогда как хоум-раны и, особенно уоки со страйкаутами - очень даже реально.

* * * * *

Вот вам и вся суть теории DIPS - более сильные питчеры выдают меньше ранов не за счёт того, что у них есть мифическое умение лимитировать хиты, а из-за реальных умений, которые они могут контролировать - умение инициировать свинги "вхолостую" (страйкауты), умение контролировать зону страйка (лимитирование уоков) и умение бросать мяч туда, куда нужно (избегание "горячих" зон бэттера, а значит, и хоум-ранов). И пусть Ворос МакКрекен изначально не был прав в своих заключениях на все 100%, но, тем не менее, он заслуженно встал в один ряд с великими саберметриками за свой переворот в понимании и оценке глобальной части игры.