Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3227

 
fxsaber #:


Похоже, график оптимизации может показывать, насколько тяжело идет процесс поиска. Поэтому привожу.


Зачем эти графики? 

Ну, предположим, найдете на ИСТОРИИ некоторые закономерности и научитесь генерировать похожие.

Зачем?

Нам нужны такие повторяющиеся куски графиков, ПОСЛЕ которых ЗАКОНОМЕРНО следует вполне определенный участок. Именно ПОСЛЕ, В БУДУЩЕМ. Всю экономическую науку можно поделить на две части: анализ и предсказание. Но из анализа НЕ следует предсказание, так как все финансовые данные НЕ стационарны.

Поэтому модели МО. 

Любая модель МО умеет находить закономерности, похожие участки на исторических данных. Принципиальным в МО является то, что этим закономерностям - ПАТТЕРНАМ ставят в соответствие БУДУЩЕЕ значение учителя. Только в МО возможен такой подход - БУДУЩЕЕ. 

Кстати, в GARCH ищут математическую закономерность и предсказывают будущее, надеясь, что найденная закономерность не изменится.

 
Renat Fatkhullin #:
3) ежедневно они будут автоматически прогоняться на истории с 2023.01.01 до текущего дня на 4 главных курсах валют

Одна модель вряд ли будет хорошо работать на разных валютах, скорее нужно под каждую валюту свою модель.

 
СанСаныч Фоменко #:

Зачем эти графики?

Они показывают OOS на 20 сетах, взятых рядом с разными пиками целевой функции. Это значит, что если есть 19 ложных (подгонка) пиков и один положительный (закономерность), то мы его увидим сразу. И плевать будет на все остальные результаты.

Ну, предположим, найдете на ИСТОРИИ некоторые закономерности и научитесь генерировать похожие.

Зачем?

Ответил на этот вопрос здесь.

Нам нужны такие повторяющиеся куски графиков, ПОСЛЕ которых ЗАКОНОМЕРНО следует вполне определенный участок. Именно ПОСЛЕ, В БУДУЩЕМ. Всю экономическую науку можно поделить на две части: анализ и предсказание. Но из анализа НЕ следует предсказание, так как все финансовые данные НЕ стационарны.

Без обид, но я просто не понимаю попытки сугубо теоретика повлиять на решения матерого практика. Даже на нулевом этапе выбора исходных данных (котировок) расхожусь с вами принципиально.


Исследователи МО, как правило, используют гипотезу, что в исходном ряду есть закономерность, которую можно торговать в плюс. Это гипотеза, ничем не подтвержденная.

И тут выдаю ряд, в котором на 99.9% имеется закономерность. Ожидаю, что самые передовые методы генерации не должны ее совсем сломать.

Если с помощью GARCH сможете создать такую генерацию - честь и хвала.

 
fxsaber #:

Они показывают OOS на 20 сетах, взятых рядом с разными пиками целевой функции. Это значит, что если есть 19 ложных (подгонка) пиков и один положительный (закономерность), то мы его увидим сразу. И плевать будет на все остальные результаты.

Ответил на этот вопрос здесь.

Без обид, но я просто не понимаю попытки сугубо теоретика повлиять на решения матерого практика. Даже на нулевом этапе выбора исходных данных (котировок) расхожусь с вами принципиально.


Исследователи МО, как правило, используют гипотезу, что в исходном ряду есть закономерность, которую можно торговать в плюс. Это гипотеза, ничем не подтвержденная.

И тут выдаю ряд, в котором на 99.9% имеется закономерность. Ожидаю, что самые передовые методы генерации не должны ее совсем сломать.

Если с помощью GARCH сможете создать такую генерацию - честь и хвала.

Не надо обобщать Ваше не знание подтверждения.

именно поэтому Вы не отвечаете по существу: МО ищет закономерности, которые предсказывают будущее, а не просто закономерности. 

 

Теоретический вопрос.


Условие.

  1. Кто-то придумал очень простую ТС.
  2. Осознал, что нужно сделать с котировками, чтобы на любом Sample после оптимизации ТС лучшие проходы великолепно себя показывали на OOS.
  3. Сгенерировал случайную последовательность котировок и добавил в нее результат п.2.

Итого имеется некая история, на которой точно есть закономерность. Эта история может быть любой требуемой длины.


Вопрос.

Супер-продвинутая (когда-нибудь в будущем созданная) методика МО с безграничными вычислительными возможностями найдет ТС (данные из п.3), как в п.1. или со свойствами, как в п.2?

 
Моя находит даже там, где ее нет 😀 но под тики не заточена 

Ускоряю некоторые ф-ии, но пока о тиках можно только мечтать 

Например, может ваша показать оос на барах? Моя показывает. Непонятно что с чем сравнивать, от подхода зависит.

Генеративную сетку попробую на тиках позже, подзабыл уже питорч, надо освежить в памяти. Все должно найтись, я просто быстрые методы семплинга из распределений попробовал. Они в общем-то Марковские и не предназначены для воспроизведения серийных закономерностей. Я исхитрился и добавил новых измерений просто, чтобы генерить серии кусками сразу, а не по одному семплу. Но что-то не работает.
 
fxsaber #:

Теоретический вопрос.


Условие.

  1. Кто-то придумал очень простую ТС.
  2. Осознал, что нужно сделать с котировками, чтобы на любом Sample после оптимизации ТС лучшие проходы великолепно себя показывали на OOS.
  3. Сгенерировал случайную последовательность котировок и добавил в нее результат п.2.

Итого имеется некая история, на которой точно есть закономерность. Эта история может быть любой требуемой длины.


Вопрос.

Супер-продвинутая (когда-нибудь в будущем созданная) методика МО с безграничными вычислительными возможностями найдет ТС (данные из п.3), как в п.1. или со свойствами, как в п.2?

Конкретно вашу стратегию не найдет. 100 фичей можно разделить миллионами разных способов. Зависит от формулы по которой выбирается лучший сплит. Тут, вроде бы, кто-то генерил кучу разных деревьев и отбирал из них по ООS.
Случайный лес тоже генерит много деревьев (каждому дереву дает несколько случайных фич) и потом усредняет результат всех деревьев. Если закономерности есть в большинстве фич, то результат будет хорошим и стабильным. Если во всех фичах одна общая закономерность.
Если всего 1-3 хорошие фичи, то они усреднятся с деревьями, в которые попали только шумовые фичи, и результат будет шумовым. В трейдинге же, все фичи можно считать шумовыми.

Если у вас из 6 млн тиков, всего 1000 трейдов (активированных каким то вашим условием,), то это 0,017% от всех данных. МО такого никогда не найдет, найдет что-то общее и попытается торговать на 50% тиков, можно ужесточить условия и торговать 1% (только на самых лучших листьях), но у вас и того меньше.
По сути, каждый лист - это отдельная стратегия, вроде вашей. Но дерево может быть поделено на 100 листьев или 1000 или 10000... И торгует все эти 10000 стратегий одновременно (точнее те, которые выберете, можно например только листья в которых вероятность выигрыша 90% или даже 99% на трейне, но на ООS такой чистый (возможно переобученный) лист ничего не гарантирует).
 
Forester #:
Если у вас из 6 млн тиков, всего 1000 трейдов (активированных каким то вашим условием,), то это 0,017% от всех данных. МО такого никогда не найдет, найдет что-то общее и попытается торговать на 50% тиков, можно ужесточить условия и торговать 1% (только на самых лучших листьях), но у вас и того меньше.

1000 трейдов за полгода - это очень активная торговля. Если это мало, то что же тогда ищете на МО, когда подаете на вход многие года? Распределение длительности приводил.

Честно говоря, очень редко видел больше сделок. И не существенное - раза в два только. Но там на грани стабильности.

 
fxsaber #:

Вопрос.

Супер-продвинутая (когда-нибудь в будущем созданная) методика МО с безграничными вычислительными возможностями найдет ТС (данные из п.3), как в п.1. или со свойствами, как в п.2?

Вопрос весьма странный...
Если есть безграничны вычислительные возможности то можно делать все что угодно,  даже сейчас
 
mytarmailS #:
Вопрос весьма странный...
Если есть безграничны вычислительные возможности то можно делать все что угодно,  даже сейчас

А если логически рассудить?

Если есть безграничные вычислительные возможности, тогда все деньги перетекут в эти вычислительные кошельки.

Да кто ж им даст, если другие вычислительные возможности хотят отнять их у первых.

Подумай на досуге. Полезно применять логику.))

Причина обращения: