Саберметрика. Часть 5. Базовые принципы. Выборка. Сплиты и платуны
В бейсболе многие менеджерские решения применяются на основании статистики. На выбор лайнапа перед игрой, а также на выход пинч-хиттеров/реливеров по ходу игры влияет не только то, насколько хорош хиттер или питчер, а и то, с какой стороны он отбивает или какой рукой бросает, насколько он хорошо отбивает/бросает в последнее время и насколько хорошо отбивает против конкретного питчера или бросает против конкретного питчера. К сожалению, очень часто статистика, которую используют менеджеры, является непоказательной, и менеджеры не только не получают желанного преимущества, а и дарят преимущество сопернику. А ведь для того, чтобы в таких случаях принять правильное решение, нужно просто знать несколько принципов саберметрики, о которых мы поговорим в очередной статье про саберметрику.
Часть 3. Базовые принципы. Run expectancy. Win expectancy. Linear weights
Часть 4. Базовые принципы. Побочные факторы, учитывающиеся при оценке игроков
* * * * *
Как и любая теория, основанная на статистике, саберметрика обязана подчиняться базовым принципам статистики, и часто базовые принципы статистики априори становятся базовыми принципами саберметрики. Одним из таких базовых принципов статистики, который часто игнорируется в бейсболе, является статистическая выборка. За примером такого игнора далеко ходить не нужно - в 6 игре Мировых Серий 2013 года Сент-Луис Кардиналс и их менеджер Майк Матени были настолько напуганы Дэвидом Ортисом, который выбил 11 хитов и выработал 4 уока в 20 выходах на биту за первые пять игр Мировых Серий (вдобавок к этому одним из его аутов был почти грэнд-слэм, который у него украл Белтран в первой игре), что попросту начали выдавать ему намеренные и практически намеренные уоки. В итоге за пять выходов на биту Ортис четырежды прошёл на базу без препятствий со стороны питчеров Кардиналс, и дважды сумел добраться до дома. И хоть в единственном случае, когда питчер Кардиналс противостоял Ортису, он выбил мяч в аут, Матени даже не попытался признать ошибочность своих действий, вознося хвалы Биг Папи, который после игры получил приз MVP Мировых Серий.
Матени попросту не понимает правило "малая выборка нерепрезентативна", хотя держу пари, что основы статистики ему где-то преподавали. А это правило весьма простое для понимания, и логика очевидна. Давайте возьмём условного новичка, который впервые сыграл в MLB, и который выбил сингл и дабл в 5 выходах на биту. Его статистика на всех сайтах будет такой: AVG .400, OBP .400, SLG .600. Другой информации об игроке у нас нет (например, он кубинец, которого только подписали и сразу же выпустили в MLB без майноров - условный Сеспедес или Абреу. На кубинскую статистику полагаться не приходится, так что она практически бесполезна), а нам очень хочется составить мнение об игроке как хиттере. Так вот, имея статистику .400/.400/.600, мы можем заключить, что это есть уровень игрока? Нет, ответите вы, и будете правы. А почему нет? Потому что это только одна игра, скажете вы, и снова будете правы. А если он в следующей игре снова отобьёт аналогично, тогда уже можно будет считать его .400/.400/.600 хиттером? Нет, маловато как-то. И три игры маловато, и четыре. Это и есть грубое объяснение понятия "малая выборка", которая "нерепрезентативна".
Когда же выборка станет репрезентативной и по статистике уже можно будет судить об истинном уровне игрока? Вообще чем большее количество данных нам доступно, тем статистики становятся более точными, это тоже универсальное правило статистики (помните пример с подбрасыванием монетки? Если монету подбросить один раз, то будет 100% орёл или 100% решка, но если подбросить миллион раз, то выпадание орла и решки будет почти 50%/50%), но саберметрикам для своих расчётов такого заявления было маловато, поэтому Расселл А. Карлтон aka Pizza Cutter, в данный момент работающий на Baseball Prospectus, вычислил для каждой важной рейтинговой статистики время стабилизации.
Вот эти результаты:
Хиттеры (PA - выходы на биту; AB - выходы на биту без учёта уоков и HBP; BIP - мяч в игре (для BABIP без учёта хоум-ранов); FB - флайболы):
Страйкауты - 60 PA
Уоки - 120 PA
Хит-бай-питчи - 240 PA
Синглы - 290 PA
Экстрабазовые хиты - 1610 PA
Хоум-раны - 170 PA
AVG - 910 AB
OBP - 460 PA
SLG - 320 AB
ISO - 160 AB
Граундболы - 80 BIP
Флайболы - 80 BIP
Лайндрайвы - 600 BIP
Хоум-раны/флайболы - 50 FB
BABIP - 820 BIP
Питчеры (BF - бэттеры, которым питчер противостоял; AB - выходы на биту без учёта уоков и HBP; BIP - мяч в игре (для BABIP без учёта хоум-ранов); FB - флайболы):
Страйкауты - 70 BF
Уоки - 170 BF
Хит-бай-питчи - 640 BF
Синглы - 670 BF
Экстрабазовые хиты - 1450 BF
Хоум-раны - 1320 BF
AVG - 630 BF
OBP - 540 BF
SLG - 550 AB
ISO - 630 AB
Граундболы - 70 BIP
Флайболы - 70 BIP
Лайндрайвы - 650 BIP
Хоум-раны/флайболы - 400 FB
BABIP - 2000 BIP
Как видим, статистики хиттеров стабилизируются намного быстрее, чем статистики питчеров. Это отлично объясняет, например, тот факт, что статистика реливеров в разные сезоны может кардинально отличаться, потому что за один сезон они попросту не противостоят стольким бэттерам, чтобы их статистики стабилизировались и показали истинный уровень питчера. Для хиттеров же одного полного года в стартовом составе уже вполне достаточно, чтобы понять истинный уровень игрока, да и у стартёров, которые провели полный сезон, статистики чаще всего успевают стабилизироваться.
* * * * *
Вернёмся к нашему примеру с Ортисом и Матени, который был так напуган его 5-игровыми статистиками, что решил пропускать его на базу просто так. Учитывая цифры, полученные Карлтоном при его расчётах, уже очевидно, что Матени сглупил, так как всё это не более чем рэндомная "горячая полоса" хиттера. И для понимания этого необязательно быть знакомым с вычислениями Карлтона, достаточно включить логику. А ещё можно взглянуть хотя бы на статистику того же Ортиса парой недель ранее, во время ALCS против Детройт Тайгерс - если в 6 играх Мировых Серий, включая все уоки Матени в последней игре, линия Ортиса была .688/.760/1.188, то в 6 играх ALCS линия Ортиса была .091/.200/.227. Что, за два дня, прошедшие между концом ALCS и началом Мировых Серий, у Ортиса что-то изменилось? Он стал совершенно другим хиттером? Против Сент-Луиса он был предельно собранным, а против Детройта - рассеянным? Против Сент-Луиса он был великим клатч-хиттером, тянущим команду на своих плечах, а против Детройта - отбросом, который сумел только два хита отбить (да, я в курсе, что одним из этих хитов был грэнд-слэм в важнейший момент серии, но: 1). Хантер запросто мог его поймать; 2). это не был единственный момент, когда от хита Ортиса зависело многое, но в других случаях он его выбить не смог)? Да нет же - и тогда, и тогда он был всё тем же Дэвидом Ортисом, легендарным DH-ем Ред Сокс, чей хиттинг, кажется, с возрастом практически не ухудшается, но тем не менее, не являющимся вторым пришествием Барри Бондса на его стероидном пике.
Погодите, скажете вы - "горячая полоса" у Ортиса была? Была. Значит, Матени всё-таки поступил правильно, учитывая это, ведь горячая полоса должна продолжаться? Нет, не так. Том Танго в своей великолепной книге "The Book" подробно рассмотрел вопрос "горячих" и "холодных" полос у хиттеров, взяв для расчётов самые "горячие" и "холодные" полосы по 5 игр (к слову, как раз столько, сколько у Ортиса было перед 6 игрой Мировых Серий) четырёх сезонов подряд, и исследовал, как отбивали хиттеры в игре №6, а также в период игр №№6-10 относительно качества этих хиттеров. Как в одном, так и в другом случае, статистика игроков практически не отличалась от среднекарьерной статистики игрока, то есть, после 5 очень хорошо или очень плохо проведённых игр никаких прогнозов на игру №6 или на игры №№6-10 дать нельзя, нужно ожидать от хиттера, что он будет тем же хиттером, каким и был на этом этапе своей карьеры. Для проверки Танго прокрутил такую же схему с 7-игровыми "горячими" и "холодными" полосами и играми №№8-10, и получил те же результаты - никакой зависимости от предыдущих игр. После этого Танго взял по десятку самых-самых "горячих" и "холодных" 7-игровых полос за эти четыре года и взглянул на результаты в играх №№7-10. И снова никакой зависимости от предыдущих игр.
Поэтому Матени обязан был относиться к Ортису как к Ортису, а не как к бейсбольному богу, и вполне возможно, исход Мировых Серий был бы абсолютно другим. Впрочем, в этом Матени не одинок - на основании слишком коротких "горячих" и "холодных" полос менеджеры постоянно тасуют лайнапы, усаживают на лавку более сильных игроков, выпуская более слабых резервистов, опускают тех, кто в "холодной" полосе ниже в лайнапе, поднимая тех, кто в "горячей" полосе и т.д., и тем самым идут против реальной статистики, используя как доказательство статистику мнимую. Далеко за ещё одним примером ходить не нужно - оппонент Матени в Мировых Сериях Джон Фаррелл усадил на лавку Джеррода Салталамаккью и Уилла Миддлбрукса потому, что у них была "холодная" полоса. И если у Миддлбрукса был более качественный запасной, новичок Зандер Богартс, то запасной кэтчер Дэвид Росс явно уступал по качеству Салталамаккье.
P.S. Нельзя не упомянуть, что Танго так же рассматривал в таком разрезе не только хиттеров, а и питчеров, и вот там зависимость есть, но и то только у тех, кто бросал хорошо. Там он рассматривал 4 игры подряд, и заключил, что если питчер играет очень хорошо в 4 играх подряд, то можно ожидать, что игру №5 он проведёт лучше, чем обычно. А вот наоборот зависимости нет - если питчер четырежды подряд бросает плохо, то в игре №5 он отбросает стандартно для себя. Но питчерские "горячие" и "холодные" полосы в бейсболе и близко не так резонансны, как хиттерские, и менеджерских решений на таком основании принимается намного меньше (стартёров, например, в любом случае каждый пятый день выпускают, а у реливеров чаще всего есть свои определённые роли).
* * * * *
Сплиты и платунные противостояния используются менеджерами MLB ещё чаще, чем различные решения, исходя из "горячих" и "холодных" полос игроков. Если у команды нет, скажем, хорошего шортстопа, а есть средний шортстоп-правша и средний шортстоп-левша, то зачастую менеджеры пытаются сделать из двух посредственных игроков одного хорошего, выпуская правшу против левшей, а левшу против правшей. Из недавнего примера весьма характерен пример Ред Сокс в 2013 году, которые из хорошо отбивающего левшей Джонни Гомса и хорошо отбивающего правшей Дэниэла Навы (оба на фото) сделали третьего лучшего "левого филдера" в MLB (первые две команды - Энджелс с Траутом и Рокис с КарГо). Тактика эта активно использовалась ещё в 70-е Эрлом Уивером в Балтиморе, да и никто её, собственно, не отрицает - в том же "The Book" авторы вычислили средний платунный перевес, который составляет 19 пунктов wOBA в обе стороны (о самой статистике будем говорить позже, но это существенная разница).
Впрочем, то, что команды активно используют платунный перевес, не значит, что они делают всё правильно. В истоках платунных перевесов стоит "специализация" отдельных видов питчей. Ту-симеры и слайдеры имеют большой платунный перевес, то есть, очень эффективны против игроков, которые отбивают с той же стороны, с которой бросают питчеры, но при этом они плохи против хиттеров, отбивающих с противоположной стороны. Фо-симеры и синкеры имеют небольшой платунный перевес, так что приблизительно одинаково эффективны, каттеры никакого платунного перевеса не несут, так что они одинаково эффективны. А вот чейнджапы, сплиттеры и кёрвболы имеют обратный платунный перевес, то есть, они более эффективны против бэттеров, которые отбивают с противоположной стороны. Поэтому, например, питчеры, у которых есть только фастбол и слайдер, чаще всего становятся реливерами, так как им сложно противостоять бэттерам, которые отбивают с противоположной стороны (уж противник-то постарается выставить против такого стартового питчера как можно большее количество таких бэттеров), а для того, чтобы быть хорошим стартёром, нужно обязательно иметь третий питч с обратным платунным перевесом, будь то чейнджап, сплиттер или кёрвбол.
Так вот, исходя из этого, иногда стандартный платунный перевес не только не помогает команде, а и вредит. Так, Джо Мэддон не раз выставлял против левши Торонто Рики Ромеро лайнап, полный левшей. Почему? Да потому что гордостью и лучшим питчем Ромеро был чейнджап, которым он выбивал правшей на раз-два, а вот левшам его отбивать было намного легче. Точно так же частенько поступают с правшой Тампы Хелликсоном, тоже знаменитым своим чейнджапом. Но, к сожалению, это очень редкие примеры, тогда как это должно быть намного более частым явлением.
Также нельзя не отметить то, что хоть средний платунный перевес и весьма значительный, не всегда его использование является верным, даже если не принимать в счёт предыдущий абзац. Во-первых, для каждого хиттера и питчера он разнится, во-вторых, колебания его у питчеров более важны, чем у хиттеров (как раз зачастую из-за различных репертуаров питчеров), в-третьих, для пинч-хиттеров нужны очень серьёзные сплиты, чтобы нивелировать пинч-хиттерский пенальти (доказано, что пинч-хиттеры и DH-и отбивают ниже своего качества, что связано, скорее всего, с тем, что сложно "включаться" в игру после долгого сидения на скамейке). Поэтому для того, чтобы правильно пользоваться платунным перевесом, нужно правильно понимать все эти тонкости и правильно пользоваться сплитами игроков. Правда, это тоже не так просто - если питчерские сплиты стабилизируются довольно быстро (правшам нужно 750 PA против левшей-хиттеров, а левшам - 400 PA против левшей-хиттеров. Почему именно против левшей? Потому что правшей намного больше и там выборка априори будет достаточной, если достигнуть этих цифр против левшей), чтобы можно было использовать эти данные, будучи в них уверенными, то хиттерские сплиты стабилизируются намного дольше (правшам нужно около 2200 PA против левшей-питчеров, а левшам - 1000 PA против них же), и в итоге правильно использовать хиттерские сплиты можно только в применении к ветеранам.
Но если платунные первесы "лево-право" менеджеры MLB весьма часто используют, пусть и не всегда правильно, то другой вид платунного перевеса они не используют практически никогда. Речь идёт о платунном перевесе исходя из специализации бэттеров и питчеров. Ни для кого не секрет, что есть граундбол хиттеры и флайбол хиттеры, равно как и граундбол питчеры и флайбол питчеры. В книге "The Book" авторы подробным образом разобрали этот вариант платунного перевеса, и нашли стойкую зависимость - граундбол питчеры очень хорошо справляются с граундбол хиттерами, а флайбол питчеры с флайбол хиттерами. Этот платунный перевес не так просто создать, так как большинство хиттеров и питчеров являются нейтральными в этом плане (в отличие от "лево-право", где каждый либо правша, либо левша), но тем не менее, результаты вычисления очень показательны и не заслуживают полного игнора. Хотя игнор, возможно, и не полный - в последнее время начали появляться статьи, доказывающие то, что Окленд применяет этот вариант платунного перевеса, выпуская против граундболлеров максимальное количество флайбол хиттеров, и это приносит им успех. Впрочем, кто бы сомневался, что именно Атлетикс будут получать выгоду от недооценённых в бейсбольном сообществе мелочей? Разве что Рэйс ещё могли бы, но они сейчас сконцентрированы на питч-фрэйминге и максимальном количестве стандартных платунных перевесов "лево-право".
Чтобы не возникало недомолвок, в двух словах о других потенциальных платунных перевесах. Танго сотоварищи рассмотрели также варианты с высоким/низким соотношением страйкаутов к уокам, с высоким/низким процентом контакта, а также с сильными/слабыми игроками. Ни один из этих вариантов не показал никакой корреляции, которая бы позволила как-то использовать подобный платунный перевес в игре.
* * * * *
Последнее, о чём просто необходим написать в рамках этой статьи - противостояние определённого питчера с определённым хиттером. Исходя из того, что у каждого питчера зачастую долгое время имеется определённый набор питчей, существует мнение, что статистика конкретного хиттера против конкретного питчера имеет какой-то вес, и на этом основании многие менеджеры принимают решения. Например, Джо Торре часто ставил против Педро Мартинеса своего запасного инфилдера Энрике Уилсона, который вроде бы хорошо отбивал именно против Педро, да и в ТВ-трансляциях очень часто в важный момент встречи показывают титры с тем, как хиттер отбивает против питчера, а комментаторы наперебой это обсуждают, критикуя или восхваляя менеджера за такое решение. Это вроде бы сразу можно отмести из-за того, о чём мы говорили в начале статьи - малой выборки, - но вдруг в этом всё-таки что-то есть, ведь не всегда можно списывать такое на SSS (Small Sample Size - малая выборка по-английски), если берётся частная статистика, а не общая?
Опять обращаемся к "The Book", в которой этот вариант подробно рассматривается. Танго взял базу данных 1999-2002 года, выбрал все пары хиттер-питчер, у которых с 1999 по 2001 было минимум 17 противостояний (ну чтобы не рассматривать уж совсем мизерный SSS из пары противостояний), выбрал 30 пар, где бэттер больше всего "убивал" питчера и 30 пар, где питчер больше всего "убивал" хиттера, и посмотрел исход этих противостояний в 2002 году. В итоге и та, и другая группа в 2002 году показала практически идентичные показатели, хотя в 1999-2001 году эти группы были на противоположных сторонах большого пула пар питчер-хиттер.
Чтобы убить в вас всю веру в такие вещи, приведу эти данные полностью, потому что их идентичность впечатляет. 30 хиттеров, которые больше всего "убивали" определённых питчеров в 1999-2001 годах, против тех же самых питчеров в 2002 году показали такие результаты: 361 PA, 50 1В, 22 2В, 1 3В, 9 HR, 38 BB, 7 HBP, 41 SO, .349 wOBA. 30 хиттеров, которых больше всего "убивали" определённые питчеры в 1999-2001 годах, против тех же самых питчеров в 2002 году показали такие результаты: 361 PA, 58 1В, 21 2В, 2 3В, 8 HR, 30 BB, 2 HBP, 69 SO, .343 wOBA.
Но что если взять не перфоманс бэттера против строго определённых питчеров, а перфоманс бэттера против групп очень похожих питчеров (например, правшей-синкерболлеров или левшей с хорошим контролем, но слабым фастболом и т.д.)? Может, тогда, увеличив выборку, получится получить какую-то зависимость, которую можно использовать в игре? Увы, тоже не вариант. Танго/Лихтман/Долфин рассмотрели и различные подобные варианты, но результат оставался тем же - никаких выводов на будущее из того, как раньше бэттер противостоял отдельному питчеру или группе похожих по типу питчеров, сделать невозможно. Статистическая выборка играет свою роль даже в таких конкретизированных донельзя вещах - в любом случае намного важнее то, как бэттер и питчер играли в своей карьере, чем то, как они играли друг против друга. Разве что если они неизвестно как доведут статистическую выборку своих противостояний хотя бы до нескольких сотен выходов на биту.
да и не думаю я ,что у сент-луса бараны и незнают банальную Саберметрика (я про ОТРТИЗА)
КАнечно я излагаю как фэн луиса, но и автор нам вещает, в "розовых бостонских очках"
В последнем абзаце пишешь, что не так важно, как определенный хиттер играл, например, с правшой-синкерболлером. То есть,если флайбол-хиттер хорошо играл против граундболлера, это все равно неважно. Противоречие, нет?
1. По показателю с официального сайта MLB GO/AO(отношение числа граундаутов к числу эйр аутов) можно судить о специализации питчера?
2. Граундбол питчер на Коорз Филд у гостей - это сильное преимущество для Колорадо?
Почему Траут такой огромный контракт подписал? Просто я думал, что при арбитраже дадут ему, после 3го года примерно 10 млн в год на 3 года, а ему сразу большой контракт, 144 на 5 лет.
И почему у Поузи такой странный контракт 167 на 9 после MVP сезона?
Были ли попытки по иному посмотреть на стартовую ротацию?
Н-р, играть в 4 питчера, или вместо №5 выпускать толпу реливеров. Или вообще убрать понятие стартера и играть кучей специалистов, меняя их каждый иннинг .
Слышал, что в 20ые играли без реливеров. А сколько тогда человек в ротации было? Были ли времена (или одельные питчеры), которые играли не 30, а 100 игр за сезон?
Спасибо =)
У Сент-Луиса не бараны, даже совсем не бараны, а вот Матени - баран. А именно он решение и принимал. И это, собственно, характерно для подавляющего большинства менеджеров, которые, имея данные статистиков, всё равно во многих случаях делают так, как им захотелось. Фаррелл - не исключение, даже в статье упомянут пример с усаживанием на лавку Солти.
Платунный перевес флайболлеров-хиттеров против граундбол-питчеров доказан и имеет место быть. Это даже интуитивно понятно тем, кто никогда не читал о исследованиях Танго. Думаю, тот, кто смотрит часто бейсбольные трансляции на инглише, неоднократно слышал фразу "catchers don’t catch high sinkers", потому что для флайбол хиттера практически нет лучше питча, чем высокий синкер. Ну а любой синкерболлер часто промахивается и бросает высоко.
Но это так, я немного отвлёкся. Основное противоречие в фразе последнего абзаца про правшей-синкерболлеров. Поясняю. Во всём абзаце шёл разговор о небольших группах очень похожих питчеров в 5-6 человек, а не всю группу правшей-синкерболлеров. Потому что есть правши-синкерболлеры, которые другим питчем используют слайдер; есть использующие чейнджап; есть использующие и то, и то; есть чистые синкерболлеры; у одних синкер 90-мильный, у других 95-мильный; у одних контроль хороший, у других - нет; одни синкер используют в 70% случаев, другие - в 50% случаев; ну и т.д. и т.п. Например, Танго приводил пример с Джейми Мойером и Марком Бёрли в одной группе. Тот, кто видел Мойера и Бёрли, знает, что это фактически одинаковые питчеры во всех аспектах, а не только в том, что они левши с контролем. Так и тут.
И потом - флайболлер в целом будет отбивать лучше против всех синкерболлеров, чем против несинкерболлеров, но это не значит, что определённых синкерболлеров он будет "убивать" всегда и постоянно. Немного разные вещи всё-таки. На пальцах - нужно ставить флайболлера против синкерболлера, исходя из этого платунного перевеса, но нельзя не ставить флайболлера против синкерболлера, исходя из того, что он выбил конкретно у этого синкерболлера, скажем, 1 хит в 15 выходах на биту за пару предыдущих лет. А ведь нынешние менеджеры скорее поступят по другому варианту, чем по первому.