Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 622

 
Yuriy Asaulenko:

Оч даже сильно.) У меня интрадей.

Если брать на сутки и более, ни стакан, ни лента вообще не нужны. Для 10 сделок в день без этого уже никак.

Как это делать на Форе ума не приложу.)

НИКАК, Юрий. Ибо функции плотности вероятности таковы, что работать на Форексе надо с объемами выборки более 10.000. Фактически - на дневках. Распределение, которое образуется приращениями - устойчиво и бесконечно делимо. Поэтому многие, увидев фрактальность рынка, бросаются торговать на минутах и уходят с рынка беднее церковной мыши.

А на дневках - да, много сделок не будет, хотя Ваша метОда - абсолютно верная, сегодня в этом окончательно убедился (понимаете, о чем я говорю? - поэтому и рассказывать подробно о ней не буду - сами уж как-нибудь)

 
Alexander_K2:

НИКАК, Юрий. Ибо функции плотности вероятности таковы, что работать на Форексе надо с объемами выборки более 10.000. Фактически - на дневках. Распределение, которое образуется приращениями - устойчиво и бесконечно делимо. Поэтому многие, увидев фрактальность рынка, бросаются торговать на минутах и уходят с рынка беднее церковной мыши.

А на дневках - да, много сделок не будет, хотя Ваша метОда - абсолютно верная, сегодня в этом окончательно убедился (понимаете, о чем я говорю? - поэтому и рассказывать подробно о ней не буду - сами уж как-нибудь)

Я, так краткосрочку(дневки и более) считаю тупиковым вариантом. И даже тому есть плохо сформулированное обоснование.)

Только минуты, и только интрадей перемежающийся скальпингом.

Это для биржи. По поводу Форекс ниче внятного сказать не могу. Но люди успешно пипсуют, вроде. И, насколько мне известно, большинство рабочих стратегий скальпинг или близкие методы,  и на бирже, и на Форекс.

 
Yuriy Asaulenko:
Интересно, почему не Питон? М.б. тот-же R? Ни фига не понимаю.

Не стану говорить за Михаила, он сам в состоянии аргументировать свой выбор, но могу предположить наверно потому что python и R интерпретирующие высокоуровневые языки, они как матлаб или "математика" скорее интерфейс к набору библиотек, как командная строка, чем собственно языки, для ознакомления это очень круто, но в продакшине когда нужно бороться с эксклюзивными алгоритмами, нет шансов, это как на самокате победить формулу 1

 
СанСаныч Фоменко:

Действительно. Раз уж такая тяга к знаниям, берешь рейтинг и из топа изучаешь то, что вроде походит.

К "ТОПу" нужно относиться с пониманием, кто его в основном формирует, одно дело количество студенческих публикаций на гитхабе и статей начинающих ученых, другое дело на чем кодят алгоритмы машинного обучения серьёзные инвестиционные канторы(банки хедж-фонды и тп.), выборка "ТОПа" смещена в сторону первых, так как вторые не очень афишируют что и как делают, разве что по верхам или даже что бы отвлечь и завести в элегантный тупик.

 
toxic:

Не стану говорить за Михаила, он сам в состоянии аргументировать свой выбор, но могу предположить наверно потому что python и R интерпретирующие высокоуровневые языки, они как матлаб или "математика" скорее интерфейс к набору библиотек, как командная строка, чем собственно языки, для ознакомления это очень круто, но в продакшине когда нужно бороться с эксклюзивными алгоритмами, нет шансов, это как на самокате победить формулу 1

Я уже подзабыл, кажется речь о Jave шла? Так Java тоже как-бы интерпретируемый язык, - компилируется не в машинные коды и работающий на JVM. 

Питон, аналогично Java, тоже компилируется и, аналогично, работает на виртуальной машине. У Питона преимущество в том, что он как-бы язык сценариев, все библиотеки уже на скомпилированном С++. А в Питоне ценны именно обширные библиотеки, а не он сам по себе. R тоже язык сценариев, а вся основная работа делается пакетами на скомпилированном С++.

Вообще, Java достаточно медленный. На Формулу 1 совсем не тянет.) Не знаю что он на него запал.) По мне, так если стратегия не скальпинг-пипсовка, то и побеждать никого не надо, быстродействие вообще роли не играет.

Что касается Михаила, то это его выбор. Мы как-бы языки обсуждаем.)

ЗЫ Где-то видел сравнение быстродействия алгоритмов МО для разных языков. Java и Питон где-то рядом.

 
Maxim Dmitrievsky:

а теперь можно в виде каких-нибудь ссылок или пояснений? :) могу для форекса сделать, позырить

и где широчайше применяется, интересуют конкретные результаты а не предположения

все что я в инете нашел про торговлю коинт. инструментами - все сделал


Искать надо VAR, VECM, пакет vars, в нем, как всегда, ссылки. Границы входа по SETAR

Прицепил, а так гугл в помощь - литературы и конкретных применений ....

Если преодолеете спред, то может быть поделитесь. Без спреда такая красота, просто глаз не отвести.

Файлы:
 
СанСаныч Фоменко:

Искать надо VAR, VECM, пакет vars, в нем, как всегда, ссылки. Границы входа по SETAR

Прицепил, а так гугл в помощь - литературы и конкретных применений ....

Если преодолеете спред, то может быть поделитесь. Без спреда такая красота, просто глаз не отвести.


спасибо, посмотрю. Что-то странное - спред для парного трейдинга, вроде бы, никогда не был проблемой

ААА.. это авторегрессия+множестенная регрессия.. типа того.. интересно, можно самому замутить. Позже вникну.

 
Yuriy Asaulenko:

Я, так краткосрочку(дневки и более) считаю тупиковым вариантом. И даже тому есть плохо сформулированное обоснование.)

Только минуты, и только интрадей перемежающийся скальпингом.

Это для биржи. По поводу Форекс ниче внятного сказать не могу. Но люди успешно пипсуют, вроде. И, насколько мне известно, большинство рабочих стратегий скальпинг или близкие методы,  и на бирже, и на Форекс.

Еще раз посмотрите на распределение приращений для пары USDJPY:

Правый график - "память". Она исчезает только при приращениях >=17 pips. А доверительный интервал для +-17 pips равен порядка 99.5% этого распределения или 28.900 тиков. Вот при этом объеме и надо торговать. Все остальное - лишь частные случаи этого гигантского распределения и однозначно ведут к поражению.

 
Alexander_K2:
Еще раз посмотрите на распределение приращений для пары USDJPY:

Правый график - "память". Она исчезает только при приращениях >=17 pips. А доверительный интервал для +-17 pips равен порядка 99.5% этого распределения или 28.900 тиков. Вот при этом объеме и надо торговать. Все остальное - лишь частные случаи этого гигантского распределения и однозначно ведут к поражению.

Имхо, надо пойти в Вашу ветку. Иначе она скоро займет весь форум.)) Соберусь ответить, напишу там. Пока не въехал в тему.
 
toxic:

Не стану говорить за Михаила, он сам в состоянии аргументировать свой выбор, но могу предположить наверно потому что python и R интерпретирующие высокоуровневые языки, они как матлаб или "математика" скорее интерфейс к набору библиотек, как командная строка, чем собственно языки, для ознакомления это очень круто, но в продакшине когда нужно бороться с эксклюзивными алгоритмами, нет шансов, это как на самокате победить формулу 1


toxic:

К "ТОПу" нужно относиться с пониманием, кто его в основном формирует, одно дело количество студенческих публикаций на гитхабе и статей начинающих ученых, другое дело на чем кодят алгоритмы машинного обучения серьёзные инвестиционные канторы(банки хедж-фонды и тп.), выборка "ТОПа" смещена в сторону первых, так как вторые не очень афишируют что и как делают, разве что по верхам или даже что бы отвлечь и завести в элегантный тупик.


Всегда надо зрить в корень, как нас учили классики.

А скорость работы R - большой вопрос.

На поверхности интерпретатор. Шикарная вещь при исследовании. По моему опыту отладчик вообще не нужен. Но скорость, вроде,  желает лучшего. Но это только видимость - будем зреть в корень.

Нюансы по скорости.

1. Если взять любой вычислительно емкий пакет  R, то на R написано только обращение к библиотекам, в качестве которых используются библиотеки Фортрана и С. Выбор делался по максимуму скорости и сомнительно, что это можно превзойти.

2. Далее, дли тех, кто переходит с С. R  - это матричный язык, в котором отсутствует понятие "скаляр". А за векторными и матричными операциями стоит библиотека Интел. Кроме того сам код на R из-за этого очень емкий.

3. Загрузка всех ядер и процессоров компа - это норма с соответствующим инструментарием. 

4. Разработанное на R прекрасно работает по схеме "сервер-клиент".

5. На R можно написать очень устойчивую программу, которая способна отрабатывать любые исключительные состояния. Понятие na штатное с соответствующими инструментами. 

6. R и Cpp прекрасно уживаются, взаимодействие прекрасно документировано - так что если уж сподобились написать большую программу на R (что очень сложно, так как в нем полно готового кода), то всегда можно все или узкие части переписать на Cpp 

Причина обращения: