Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 156

 
И кстати, космические проценты в долгосроке зарабатываются на 5 минутках, при соотвествующем увеличении сделок, так что..... всё сходится....
 
Alexey Burnakov:


2) ну да... а вот этот Шарп 2-3 как посчитан? Как в фондах считают, точнее КАК определяют, что это реальная оценка Шарпа на реальной торговле? 


В том то и дело что на моделях, Шарп это отношение ретурна к риску, есть много вариаций что считать за ретурн, например тупо процент прироста или регрессию динамики проростов и тп, а риск это CKO или максимальная просадка и тп. отличия не фундаментальные, но если бы 2-3 были бы реальностью все бы были миллиардерами, на реальной торговле по ряду причин он выходит в разы меньше, даже когда этим занимаются команда PhD. Но многое там связано с емкостью, если многие модели торговать на 100К$ или даже до 10M$ ситуация была бы куда приятнее, но это даже не окупит вложения и зарплаты с бонусами сотрудников.

 
J.B:

В том то и дело что на моделях, Шарп это отношение ретурна к риску, есть много вариаций что считать за ретурн, например тупо процент прироста или регрессию динамики проростов и тп, а риск это CKO или максимальная просадка и тп. отличия не фундаментальные, но если бы 2-3 были бы реальностью все бы были миллиардерами, на реальной торговле по ряду причин он выходит в разы меньше, даже когда этим занимаются команда PhD. Но многое там связано с емкостью, если многие модели торговать на 100К$ или даже до 10M$ ситуация была бы куда приятнее, но это даже не окупит вложения и зарплаты с бонусами сотрудников.

PhD это не показатель. Переобучать будут не хуже Ms и Bs. Отсюда и резкое падение метрик на реале.
 
Alexey Burnakov:

Ну, ок.

Положим, я не классифицирую прирост на вверх/вниз, а строю регрессионную модель.  Поэтому R^2 или иная метрика детерминированности (например, робастная метрика абсолютных отклонений) вполне подходит.

 По поводу взаимной информации - голословно или есть веские доказательства, что метрика работает ненадежно? Я сомневаюсь.

Update: я проводил множество исследования на синтетических и реальных данных с применением взаимной информации. Если зависимость стационарна, метрика работает хорошо везде. Если зависимость на грани шума, метрика может показать нулевую зависимость. Но в целом не вижу причин, почему в многомерных нелинейных системах она работает хуже, чем, например, F1. Можно тут почитать: https://habrahabr.ru/company/aligntechnology/blog/303750/

 

Но когда я все же делал классификацию инкремента ценового движения, я получил примерно такую картинку (для 5 валютных пар вместе всятых, то есть, одна модель на всех):

 

 


То есть как минимум медана значений точности на 50 отложенных выборках в районе 57% на максимуме. Для отдельных валютных пар добиваюсь медианной точности выше 60%. Это только на данных временного ряда.

Сорри, нет времени давать веские доказательства, рыночные данные не стационарны и зависимости не линейны, смоделируете к примеру 10 мерный фрактальный шум в 2д типа такого: красный один класс зеленый другой только в 10д

 

Как Вы видите он не гаусов зависимостей много есть «островки» всякие и тп. Ну вот и посчитайте какова эффективность использования взаимной информации или r^2 при добавлении и убирании одной мерности как падает классификация. R^2 вообще линеен, в случае когда разделяющая гиперповерхность сложной топологии и много островков всё печально. Тут классическими статистическими критериями не обойтись, можете сами проверить. А если 100д или 1000д такой каши?

 
J.B:

Сорри, нет времени давать веские доказательства, рыночные данные не стационарны и зависимости не линейны, смоделируете к примеру 10 мерный фрактальный шум в 2д типа такого: красный один класс зеленый другой только в 10д

 

Как Вы видите он не гаусов зависимостей много есть «островки» всякие и тп. Ну вот и посчитайте какова эффективность использования взаимной информации или r^2 при добавлении и убирании одной мерности как падает классификация. R^2 вообще линеен, в случае когда разделяющая гиперповерхность сложной топологии и много островков всё печально. Тут классическими статистическими критериями не обойтись, можете сами проверить. А если 100д или 1000д такой каши?

Это не доказательно...

 

Вы не можете меня понять. Я говорю, не классифицирую я, а строю регрессионную модель. Причем здесь классификация... Я не провожу никаких гиперплоскостей. Я делаю условное моделирование медианного значения целевки и меряю его качество анализом остатков. Как всегда это и делается.

 

Если же говорить про классификацию, то требования к нормальности чего либо не обязательно, например, если вероятность чего либо близка к нулю. Нелинейность и многомерность это как раз сфера применения взаимной информации. Думаю, вы не вполне разбираетесь в этом вопросе...

 
Дмитрий:

10%  - это загрузка депозита.

Если у вас депозит 1000 долларов, вы загружаете его на 10% - открываете сделку на 100 долларов.

А теперь, ВНИМАНИЕ, в зависимости от плеча, предоставляемого брокером/кухней вы можете покупать разные лоты - на 10 000 долларов (1:100), на 5 000 долларов (1:50), 20 000 (1:200).

 

П.С. ёкерныйбабай........ 


Не ругайтесь в светлой теме...

 

Посчитаем.

Первый пример. у меня 500 долларов. микролот стоит 1000 долларов. Открываю одну сделку микролотом (потому что покупки больших сумм уже не умещяются в заложенный предел риска) и таким образом использую плечо 1:2. Так как дилер дает мне максимальное плечо 1:100, то для покупки 1000 долларов / 100 я нагружаю депозит на 2%. 

Второй пример. Если я открываю 5 сделок, при том же уровне капитала, я загружаю депозит на 10%, и использую плечо 1:10 (0.01 * 100000 * 5 / 500).

То есть от макс.предоставляемого плеча зависит только процент загрузки депо и дает возможность открыться на всю котлету. Реально задействованное плечо на мое усмотрение. Но минимум это 1:2 при моих инвестициях. 

Все ясно теперь? 

 
Alexey Burnakov:

Не ругайтесь в светлой теме...

 

Посчитаем.

Первый пример. у меня 500 долларов. микролот стоит 1000 долларов. Открываю одну сделку микролотом (потому что покупки больших сумм уже не умещяются в заложенный предел риска) и таким образом использую плечо 1:2. Так как дилер дает мне максимальное плечо 1:100, то для покупки 1000 долларов / 100 я нагружаю депозит на 2%. 

Если я открываю 5 сделок, при том же уровне капитала, я загружаю депозит на 10%, и использую плечо 1:10 (0.01 * 100000 * 5 / 500).

Все ясно теперь?

Вы используете одно и то же плечо, которое вам предоставляет кухня. Варьируете вы не плечи (оно задано - константа), а размер используемого капитала при заданном плече.

Еще раз - какое плечо дает вам кухня для вашего типа счета?  1:100?

 
Дмитрий:

Вы используете одно и то же плечо, которое вам предоставляет кухня. Варьируете вы не плечи (оно задано - константа), а размер используемого капитала при заданном плече.

Еще раз - какое плечо дает вам кухня для вашего типа счета?  1:100?


Максимальное плечо - да, 1:100. Но я его не использую. Еще раз повторяю.

 
Alexey Burnakov:

Это не доказательно...

 

Вы не можете меня понять. Я говорю, не классифицирую я, а строю регрессионную модель. Причем здесь классификация... Я не провожу никаких гиперплоскостей. Я делаю условное моделирование медианного значения целевки и меряю его качество анализом остатков. Как всегда это и делается.

 

Если же говорить про классификацию, то требования к нормальности чего либо не обязательно, например, если вероятность чего либо близка к нулю. Нелинейность и многомерность это как раз сфера применения взаимной информации. Думаю, вы не вполне разбираетесь в этом вопросе...

Ну как же не классификация, возьмем к примеру 1000 факторов, глубокую нейросетку с ну например 100 выходами которые выдают вероятности движений данного инструмента вверх\вниз, на разные горизонты времени. Это что регрессия? Регрессия это когда цена предсказывается.

 

Вам удобнее пользоваться взаимной информацией, а нам попросту перебрать факторы и посчитать на сколько процентов каждый влияет на конечный прогноз, ДЛЯ КОНКРЕТНОЙ МОДЕЛИ, которая уже похлеще. googleNet по навороченности. Регрессия нам не нужна, похрену сколько конкретно будет стоить какой то актив, это усложняет модель и не имеет смысла, главное что N секунд он будет двигаться в нужном направлении с данной вероятностью.

 
Alexey Burnakov:

Максимальное плечо - да, 1:100. Но я его не использую. Еще раз повторяю.

Ладно, если вы не понимаете элементарных вещей, то спорить толку нет.

Короче говоря, что бы привести свои проценты к процентам хэдж-фондов вам надо поделить их примерно на 10. 

Причина обращения: