К вопросу о распределениях

К вопросу о распределениях
Atom
1/16/2012
Church


Недавно встретил фразу "задача трейдера - ловить хвосты нормального распределения". Это некорректно, потому что на рынке не нормальное распределение.

Прикладываю 2 картинки, первая - распределение на fRTS, вторая - распределение случайной переменной, параметризированной статистиками fRTS (число испытаний, средняя и стандартное отклонение).

Под "тяжелыми хвостами имеется в виду пологий спуск, который виден на графике fRTS. На нормальном распределении такого нет: мы видим, что хвосты быстро сходят к нулю, и за пределами нескольких стандартных отклонений наблюдений вообще не встречается. При случайном блуждении (которое, по традиции, ассоциируют с нормальным распределением) среднее расстояние, которое рынок пройдет в направлении нашей позиции равно среднему расстоянию, которое он пройдет против нее, где бы мы ее ни открыли. Но за счет тяжелых хвостов у нас есть существенная вероятность поймать движение существенно большее, чем стоп.

Благодарите тех богов, которым молитесь, что на рынке НЕнормальное распределение.
Rplot02.png 31 KB (292) ndist.png 27 KB (240)


dvoris

Avatar
Date: 3/12/2012
Reply


Грамотный подход :)
Как думаете под какой тип распределения подходит распределение на fRTS? Лапласа, Levy skew alpha-stable?
Thanks:

Church

Avatar
Date: 3/12/2012
Reply


На мой взгляд, это либо Коши, либо (что гораздо интереснее) смесь нескольких нормальных.
Thanks:

dvoris

Avatar
Date: 3/17/2012
Reply


Quote:
При случайном блуждении (которое, по традиции, ассоциируют с нормальным распределением) среднее расстояние, которое рынок пройдет в направлении нашей позиции равно среднему
расстоянию, которое он пройдет против нее, где бы мы ее ни открыли. Но за счет тяжелых хвостов у нас есть существенная вероятность поймать движение существенно большее, чем стоп.


Так как заинтересовало вышенаписанное и люблю всё проверять в цифрах своими руками, то провёл следующую работу.
Взял история fRTS с 2007 года, таймфрейм час, рассчитал логнормированные приращения ln(close/open).

2008-ой год (впрочем, не он один) внёс "супер-тяжелые хвосты", когда цена за один час менялась на 5-8-12%. Поэтому решил скомпрессовать хвосты в пределах 5 стандартных отклонений (порог оказался 4.5%). Если этого не сделать, то какое-либо распределение "натянуть" на наши данные будет проблематично.

Получилась следующая картина:
1

Красная линия - модельное распределение Коши, с оптимизированными параметрами.
Нужно сказать, что программа пыталась подбирать и оптимизировать под наши данные более 2 десятков разных типов распределений.

Степень достоверности определялась по трем разным критериям. По всем трем распределение Коши оказалось наиболее точным (причем с большим отрывом):
2
Нормальное распределение, как видим, вообще отдыхает.

По вероятностям ещё помозгую и, возможно, напишу.
Thanks:

Church

Avatar
Date: 3/17/2012
Reply


Такой еще момент - известно, что волатильность имеет свойство кластеризоваться, т.е. для рынка характерны периоды большой волатильности (когда несколько наблюдений подряд попадают в хвосты) и малой (когда в центр). Возможное следствие - рынок не совсем корректно моделировать одним распределением, поэтому mixture models становятся интересными. Например, подход Горчакова основан на этом.
Thanks:

vlad1024

Avatar
Date: 3/20/2012
Reply


оно гораздо ближе к лапласовскому, особенно если брать небольшие таймфреймы, это связано с тем что если исходить из no arbitrage, то функция price-impact должна быть экспоненциальной, или в данном случаи если мы расматриваем приращения (по сути price-impact в обе стороны) - лапласовской. Помимо этого у коши есть такая особенность, что у него область значений от (-inf, +inf) поэтому у него нет ни мат ожидания, ни дисперсии, что конечно приминительно к реальным рынкам не сильно реалистично.
Следующий момент, это наличие так называемой "кластеризации" волатильности, в этом достаточно тривиально убедится если построить взаимное распределение (Day_High_i - Day_Low_i, Day_High_i+1 - Day_Low_i+1). На этом строятся различные модели стохастической волатильности, в которых дисперсия считается отдельной функцией зависящий от времени. В простейшем случаи это GARCH в которых просто берется авторегрессивность процесса дисперсии. Возможны более сложные варианты.
Но главное помнить, что несмотря на то что исходный процесс отклоняется от нормального на нем все равно нельзя заработать при направленной торговле(опционы - другой вопрос). Самый широкий класс таких процессов - мартингаловский. И при этом они способны объяснить любое одномерное распределение процесса или стохастическую волатильность.
Если вспомнить теорему о репрезентации мартингала. То это будет случайное блуждание с неоднородной интенсивностью торгов. Из-за того что меняется интенсивность на случайном блуждании все равное - не возможно заработать (по крайней мере направленно).
Thanks:

Church

Avatar
Date: 3/22/2012
Reply


Спасибо за комментарий. Вопросы:
1. Что вы имеете в виду под функцией price-impact?
2. Почему предположение об области значений (-inf, +inf) с экспоненциально убывающими вероятностями нереалистично? Легко представить маловероятное событие, которые уронит рынок до 0 (атомная война?), или взвинтит его во много раз (атомная война, в которой мы остались одни?). Отсутствие матожидания и дисперсии это просто следствие. Зато есть медиана.
3. Я, может быть, соглашусь, что на направленной торговле нельзя работать только на основании данных о распределении. Но, используя дополнительные факторы, можно получить смещенную условную вероятность.
Thanks:

vlad1024

Avatar
Date: 3/22/2012
Reply


Church
Спасибо за комментарий. Вопросы:
1. Что вы имеете в виду под функцией price-impact?
2. Почему предположение об области значений (-inf, +inf) с экспоненциально убывающими вероятностями нереалистично? Легко представить маловероятное событие, которые уронит рынок до 0 (атомная война?), или взвинтит его во много раз (атомная война, в которой мы остались одни?). Отсутствие матожидания и дисперсии это просто следствие. Зато есть медиана.
3. Я, может быть, соглашусь, что на направленной торговле нельзя работать только на основании данных о распределении. Но, используя дополнительные факторы, можно получить смещенную условную вероятность.


1. примерно вот это - http://arxiv.org/pdf/0903.2428v1.pdf
2. я там скорее хотел сказать, что отсутствие мат. ожидания и дисперсии не слишком хорошее свойство для распределения, и в распределении коши, слишком большой вес хвостов по сравнению с реальными данными. Распределение лапласа в этом смысле, гораздо "лучше".
Thanks:

Bazil

Avatar
Date: 4/2/2012
Reply


Зачем гадать и подгонять полученное распределение под известные мат. модели? Тип всех рыночных распределений это Паррето-Леви, и оно характеризуется нестационарностью, что по всей видимости и имел в виду vlad1024.
Thanks:


Attach files by dragging & dropping, , or pasting from the clipboard.

loading
clippy