Кто на свете всех быстрее, всех шустрее и мощнее
В прошлом году после Гран-при Европы в Валенсии британский Autosport дал небольшую, но очень познавательную заметку за авторством Гэри Андерсона, в которой бывший технический директор «Джордана» и «Стюарта» провел анализ характеристик болидов, уделяя основное внимание различиям между моторами…
Ну, вы помните, как раз примерно в то время начались жалобы из стана «Рено» по поводу того, что некоторые команды используют разрешенные для повышения надежности модификации движков не совсем по назначению. Чем история закончилась, мы помним – «Рено» разморозили, позволив догнать своих конкурентов. Однако анализ содержал не только упоминание о 30 лошадиных силах, которых не хватает французскому агрегату по сравнению с «Феррари», но и сравнение по таким параметрам, как механическое сцепление с трассой и лобовое сопротивление.
Сегодня мне вспомнилась та работа, и я решила с вашей помощью проделать что-то подобное на примере данных с Гран-при Бахрейна. Чем мы хуже Андерсона?! Шутка… И все же упражнение, на мой взгляд, полезное: попробовать проанализировать эти данные стоит именно сейчас, до того, как все болиды преобразятся в Барселоне, а потом вернуться к ним в попытке заметить прогресс или регресс участников.
Итак, давайте вспомним основные положения, которые использовал в своем анализе Андерсон. За базу для анализа он взял показатели скорости болидов (максимальное значение внутри команды) на четырех базовых отметках во время квалификации: Intermediate 1, Intermediate 2 – это промежуточные отсечки на финише первых двух секторов, прямая старт-финиш и speed-trap, точка, по которой засекается максимальная скорость на трассе. В зависимости от того, где расположена та или иная отметка, можно было сравнить болиды по различным комбинациям параметров.
Например, финишная черта расположена в Валенсии недалеко от медленного поворота, который гонщики проходят на второй передаче. Здесь можно судить о механическом сцеплении и мощности моторов. По максимальной скорости на speed-trap в конце длинной прямой перед 12-м поворотом, а также по Intermediate 2 делались выводы снова о мощности в сочетании с коэффициентом лобового сопротивления…
Давайте посмотрим, что получится у нас на основе Гран-при Бахрейна. Должна признаться, я ожидала более ярких результатов, но, как и в протоколах этого года, плотность данных местами поражает.
Начнем со скорости на финише первого сектора. В Бахрейне Intermediate 1 находится перед пятым поворотом, вскоре после медленного виража, проходимого на второй передаче. В общем, думаю, можно взять эти данные для сравнения сочетания мощность мотора / механическое сцепление, по аналогии с финишем в Валенсии. Нам, естественно, нужно внести в анализ небольшие изменения в связи с тем, что в 2009-м по сравнению с прошлым годом используется KERS. Но в Бахрейне масса длинных прямолинейных участков, на которых данная система эффективна (и мы увидим один из них ниже), и между четвертым и пятым поворотами ею, пожалуй, не пользуются.
Итак, Intermediate 1 1. «Макларен» – 242,1 2. «Ред Булл» – 241,7 3. «Рено» – 241,6 4. «Феррари» – 241,0 5. «Браун» – 240,5 6. «Форс-Индия» – 240,2 7. «Торо Россо» – 239,6 8. «Тойота» – 239,3 9. «БМВ-Заубер» – 238,8 10. «Уильямс» – 238,8
Здесь как раз тот случай, когда разброс результатов невелик и почти в два раза сократился по сравнению с предыдущим годом (что, скорее всего, стоит отнести на совесть сликов). Имеет смысл сравнивать болиды с одинаковыми двигателями, что даст примерно равные показатели механического сцепления в парах, использующих «Тойоту» и «Рено», а также у «Брауна» с «Форс-Индией». Последняя связка отстает от «Макларена», как и «Торо Россо» от «Феррари», что можно идентифицировать как незначительное превосходство «серебряных» и «алых» над своими клиентами.
Прямого аналога максимальной скорости на Intermediate 2 в анализе Андерсона нет. Эта отметка расположена между 12-м и 13-м поворотами, после связки довольно быстрых виражей, что говорит об эффективности прохождения подобных участков со сменами направлений. Здесь также сомнительно использование KERS, да и результаты, похоже, это подтверждают:
Intermediate 2 1. «Ред Булл» – 271,3 2. «Тойота» – 271,2 3. «Феррари» – 270,4 4. «Торо Россо» – 270,0 5. «Рено» – 269,7 6. «Макларен» – 268,3 7. «Браун» – 267,7 8. «БМВ-Заубер» – 267,1 9. «Форс-Индия» – 267,0 10. «Уильямс» – 266,0
При сравнении «Брауна» и «Ред Булл» за прошедшие четыре этапа уже упоминалось превосходство первого в медленных и среднескоростных поворотах и предпочтение последнему на скоростных аэродинамических трассах. Похоже, в этой же категории и «Тойота». Если закрыть глаза на «Браун», «Уильямс» и думать о «Торо Россо», как о «Ред Булле», то, кажется, довольно похоже на реальную расстановку сил в пелотоне по состоянию на Гран-при Бахрейна…
Следующая отметка – финишная черта. Ее аналог в анализе Андерсона – вторая промежуточная отсечка, по которой технический эксперт Autosport оценивал чистую мощность двигателей и сделал в прошлом году вывод о том, что «Рено» в сравнении с «Феррари» и «Мерседесом» не хватает 30 лошадиных сил.
Разница в лошадках именно здесь бросается в глаза и, естественно, объясняется наличием KERS на отдельных болидах. Ну а чтобы эффект был совсем очевиден, вспомним, что в Бахрейне «буст» использовали полным составом четыре команды: «Макларен», «Феррари», «Рено» и «БМВ-Заубер».
Финиш 1. «Феррари» – 294,9 2. «Макларен» – 294,7 3. «Рено» – 294,1 4. «Форс-Индия» – 294,0 5. «БМВ-Заубер» – 292,6 6. «Браун» – 284,8 7. «Торо Россо» – 283,3 8. «Ред Булл» – 283,2 9. «Тойота» – 283,3 10. «Уильямс» – 281,3
Кстати, если в данной таблице брать не максимальную скорость внутри команды, а усредненную по обоим пилотом, то слишком шустрого Адриана Сутиля, отвечающего за четвертое место «Форс-Индии», утянет на пятое Джанкарло Физикелла, и первые четыре позиции оккупируют команды с KERS. Об индийской конюшне и ее выбивающемся из статистики результате речь еще пойдет ниже, а пока можно говорить о том, что на финише эффект новой кнопочки равен 10-11 км/ч. Заметьте, пилоты получают «полный заряд» только после пересечения линии финиша, и тот факт, что еще до нее они явно используют KERS, говорит о том, что им приходится экономить на протяжении круга, оставлять немножко до выхода из последнего поворота, чтобы наиболее эффективно использовать на прямой, в конце которой достигается максимальная скорость.
Если же вернуться к оценке чистой мощности, то, сравнивая команды в своих категориях (с KERS и без него), можно сделать вывод, что «Мерседес», «Феррари», «Рено» и «Тойота» теперь на одном уровне, да, в общем, и «БМВ» несильно отстает. Главное – французы подтянулись…
Ну и, наконец, последняя отметка – speed-trap, расположенная в конце стартовой прямой, перед зоной торможения первого поворота. Здесь кроме мощности двигателя свой вклад вносит коэффициент лобового сопротивления болидов:
Максимальная скорость 1. «Форс-Индия» – 313,4 2. «Торо Россо» – 312,9 3. «Рено» – 310,1 2. «Макларен» – 310,0 1. «Феррари» – 309,8 5. «БМВ-Заубер» – 309,7 6. «Браун» – 307,6 8. «Ред Булл» – 306,3 9. «Уильямс» – 304,8 10. «Тойота» – 304,3
«Форс-Индия», да и «Торо Россо», неслабо так разогнались на этом участке, и это говорит о том, что в настройках команды (здесь именно оба пилота, несмотря на то, что мы брали лучшее значение) сделали упор на максимальную скорость, жертвуя прижимной силой. Ставка не оправдалась – обе команды покинули квалификацию еще в первом сегменте.
В остальном разница между KERS-командами и теми, кто с этой системой пока не заморачивался, сохранилась, но значительно сократилась. До 2-3 км/ч. Кстати, если проследить квалификационные подвиги Ника Хайдфельда и Роберта Кубицы в первых трех Гран-при, как раз когда немец использовал «буст», а поляк – нет, у них на отметке максимальной скорости постоянно присутствовала именно разница в 3 км/ч, а Бахрейн они прошли довольно ровно. Так что, думаю, можно откорректировать данные в последней таблице, отняв от результатов «Рено», «Макларена», «Феррари» и «БМВ» эффект KERS и выпустив, таким образом, вперед команду «Браун». Ну и плотность с третьего по десятое место получится снова очень впечатляющая, впрочем, сравнимая с прошлогодними показателями. Что также объяснимо, ведь при разработке новых правил, избавляясь от прижимной силы, Рабочая группа по обгонам старалась сохранить неизменным коэффициент лобового сопротивления.
P.S. Для меня это первое упражнение такого рода, поэтому найденные вами ошибки / неточности / дополнения давайте вместе обсудим…
1. Почему нормальное распределение в этом случае не считается со смещением? В практических целях можем «шум» в виде 160 отбрасывать. Откуда уверенность, что это распределение не будет удовлетворять критерию Пирсона?
2. Почему использование медианного значения в этом исследовании подразумевает обязательность нормального распределения?
Для того, чтобы сделать правильные выводы, нужно сначала определиться, правильный ли у нас посыл. Вот zbone справедливо считает, что у нас мало данных (а других нет, кстати). Я первым делом посчитала среднее по команде, но потом удостоверилась, что в статье Автоспорта присутствовали именно максимальные значения. Кстати, изменения невелики из-за плотности результатов...
El Macho, в статье сравниваются три показателя: 1) мощность двигателей (если отнять эффект KERS) – по максимальной скорости на финише; 2) мощность + механическое сцепление – максимальная скорость на Intermediate 1; 3) мощность + аэро, в частности коэфф лобового сопротивления – максимальная скорость на всей трассе.
Если мы решим, что модель, несмотря на упрощения, удовлетворительная для наших целей (то, что я хотела в первую очередь обсудить), то выводы из текста:
1) «Макларен» и «Феррари» имеют небольшое превосходство над своими клиентами по части механического сцепления
2) KERS дает прибавку в скорости 10-11 км/ч в какой-то точке при разгоне, однако к концу прямой разница практически нивелируется и составляет всего 3 км/ч. Отсюда – сложности с обгонами: машинам с KERS легко защищаться – их невозможно догнать, но они не могут завершить слип-стрим в конце прямой из-за слишком маленькой разницы в скорости. Это то, что мы действительно видим на экране.
3) Моторы практически равны по мощности, под подозрение в небольшом отставании попадают «БМВ» и «Тойота».
4) «Форс-Индия» и «Торо Россо» выбрали на Гран-при Бахрейна прижимную силу ниже, чем у соперников, о чем говорит их скорость в конце прямой старт-финиш. Такой компромисс в настройках, однако, неверен для данной трассы, обе эти команды были в пятерке худших машин в квалификации, хотя «Ред Булл» (не считая заблокированого Уэббера) был среди сильнейших.
Не из текста:
5) Падение ускорения болидов с KERS на прямой старт-финиш можно приписать большему коэф лобового сопротивления, то есть они пытаются компенсировать недостаток прижимной силы (из-за отсутствия двойных диффузоров или их промежуточных еще не до конца эффективных вариантов). На недостаток прижимной силы жалуются все эти команды, так что тут наверное, вывод можно считать подтвержденным.
Господа простите не буду вникать просто лень.
P.S. Думаю Балех начал понимать что ему надо идти учиться в тех вуз. Готов ли он?
Нормальные распределения являются частным случаем. А выделяются они и читаются в учебном процессе только потому, что они описываются параметрическими гипотезами, и для них можно записать интеграл вероятности, критерии и пр. пр. Практически весь курс технического университета по статанализу состоит исключительно из описаний параметрических гипотез и нормальных распределений, для простоты изложения. Например, клсассический Г.Б. Ходасевич, ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ НА ЭВМ. В современной статистике, набор таких стат. гипотез называется ANOVA (analysis of variance). Применяются эти методы только из-за простоты расчетов. Проблема корректности этих методов в очень узкой области известна с 30-х годов.
Сейчас для анализа применяется непараметрическая статистика. Ресэмплинг, или пермутационный тест (permutation tests). Он является статистически корректным, а объем расчетов при нынешних возможностях компьютеров не играет роли.
Описание его несложное, но, проблема в том, что в учебных курсах, по крайней мере не мехматов вузов, он не читается.
Поэтому я бы предложил именно пермутационный тест.
Про пермутационный тест. Если коротко, то, по моему, в данном случае придется попарно команды (вернее, болиды) сравнивать.
Поэтому объем вычислений будет приличный.
Поэтому такие качественные задачи классификации лучше решать через SOM Кохонена. Т.е. задача кластеризации данных. В последней статистике есть, только визуализация безобразная. Самое главное, сеть самообучаемая, все сделает быстро.
Если бы эти данные были нормально распределены, напрмер, стрельба по мишени, то правильное (на мой взгляд) применение ANOVA имело бы следующий вид: берем выборки по болидам, исключаем неполное количество кругов, выбираем подходящее нормальное распределение (довольно сложная задача, в СТАТИСТИКЕ их штук 8), затем вычисляем моменты (при одинаковых параметрах распределения), затем сравниваем мат ожидания.
Вообще это не так уж и тривиально, по некоторым намекам ВАК, в большой части диссертаций статистическая обработка данных выполнена некорректно.
------
Слабый аргумент. Многие явления бесспорно наилучшим образом описываются Гауссом с ненулевым мат ожиданием. Но вы же не будете отрицать этот факт исходя только из того, что среди этих явлений у многих чисто из физических соображение не могут наблюдаться отрицательные величины. То, что творится далеко в хвостах не так важно, главное как хорошо описывается основная масса событий.
То, что вы написали, известная проблема в применении статистики.
Проф. А.И. Орлов по этому поводу написал:
«К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения. Напомним, что таких ограничений два.
Во-первых, это нормальность распределения количественного признака в обеих сравниваемых группах. Многочисленные исследования свидетельствуют о том, что нормальное рспределение встречается далеко не часто. Приведенные описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений соответствующих случайных величин.
Во-вторых, равенство генеральных дисперсий в этих группах. Это условие также называется условием однородности дисперсий, или условием гомоскедастичности, буквально равнораспределённости (не путать с равномерным распределением!). Мы рекомендуем читателям следующие издания, в которых доступно рассмотрены как теория критерия Стьюдента, так и последствия нарушения этих ограничений:
1. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. Пер. с англ. - М.: Изд-во Прогресс, - 1976, (стр. 206 – 216, стр. 265–270).
2. Р. Шторм. Теория вероятностей. Математическая статистика. Статистический контроль качества. Пер. с нем. – М.: Мир, 1970, (стр. 169-171)
3. К. А. Браунли. Статистическая теория и методология в науке и технике. Пер. с англ. Наука, - 1977, (стр. 272 – 282).
4. М. Кендалл, А. Стьюарт. Статистические выводы и связи. Пер. с англ. Наука, - 1973, (стр. 190 – 203).
5. Г. Шеффе. Дисперсионный анализ. М.: Наука, 1980, (стр. 376-417).
Отметим, что наиболее доступное изложение обсуждаемых проблем, с примерами, дано в книге К.А. Браунли [3]. »
Приятного чтения!