Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3185

 
fxsaber #:

Потому что это никакого отношения не имеет к цВР. mp3 и jpg даже при очень низком битрейте узнаваемы нейронкой. Но вот альфа в виде скальпинга теряется даже при сохранении "битрейта".

Это все цифры и преобразования что значит это не имеет отношения к  цВР ?  это просто цифры...

Это то же самое что говорить что картинка с собачками не имеет ничего общего с картинкой с котиками.. потому что котики не собачки..

И что таое битрейт?

 
Forester #:

Значит тест Монте-Карло пройден получается. Если на реалных есть прибыль, а на перемешанных нет.

Если это тест рассматривать, как явный признак отличия реального ряда от рандомизированного - да, на 100% проходит.

Мое "монте-карлить" - это создать много скальпируемых историй. И на них выявить уязвимости ТС. Сейчас тупо не хватает длины истории для таких проверок. Поэтому нужны адекватные генерации.


Задумка генерации показалась даже красивой, не видел подобного. Но оказалось, что для моих целей не подходит.

А вот тест Монте-Карло, действительно, проходит на ура. Но это побочка, мало что значащая.

 
mytarmailS #:

Это все цифры и преобразования что значит это не имеет отношения к  цВР ?  это просто цифры...

Ответьте себе на вопрос, какая полезная характеристика сохраняется/теряется. Со своим преобразованием ответил на такой вопрос.

И что таое битрейт?

Ширина потока информации (в сетевом контексте).

 
fxsaber #:

Стал менять размеры (в пределах разумного для скальпинга) мин. колена ЗЗ и смотреть сумму колен.

А какой диапазон разумен для скальпинга? От... до?

У меня на барах от 0,00200 для EURUSD, что-то начинает зарабатываться. Нo боюсь, что там подгонка, которыю вы выше описали. Т.е. лучшие варианты на ООС, которые портятся просто смещением окна для обучения на 2-10% (т.е. 2-10% строк другие, в итоге деревья по другому строятся и ООС совсем другой, вплоть до убыточных).

 
fxsaber #:

ЗЫ В общем, если есть интерес попробовать найти различия между двумя рядами, могут их предоставить.

Скорее интересен реальный обучающий датасет для ваших данных (фичи и целевая). Посмотреть, сколько я своим подходом смог бы на скальпинге заработать.

 
fxsaber #:

Ответьте себе на вопрос, какая полезная характеристика сохраняется/теряется. Со своим преобразованием ответил на такой вопрос.

Если я правильно понял ваше преобразование 

то вы берете приращения, далее на рандомно выбираете индекс приращения и либо оставляете как есть либо переворачиваете (х/-1)


Возмем какой то абстактный ряд с какой то явной структурой (закономерностью)

применим ваше преобразование

Никакой структуры не сохранилось, это просто рандом из рандома..

Я бы вообще это симуляцией не считал бы..



вот код

par(mar=c(2,2,2,2),mfrow=c(3,2))

r <- rep( c(1:10,10:1) ,3)
r |> plot(t="l",main = "начальный ряд с какой то закономерностью")

rd <- c(0,diff(r))

for(i in 1:5) {
  sa <- sample(1:length(rd),size = length(rd)/2)
  rd[sa] <- rd[sa]/-1
  rd |> cumsum() |> plot(t="l", main = "ваше преобразование")
}
 
Forester #:

Скорее интересен реальный обучающий датасет для ваших данных (фичи и целевая). Посмотреть, сколько я своим подходом смог бы на скальпинге заработать.

Брокера для исторических данных выбирать по наибольшей потенциальной прибыли. Например, потенциалка у EURUSD_Broker1 выше, чем у EURUSD_Broker2. Тогда берете EURUSD_Broker1.

Скальпируются и мажоры и кроссы. Но далеко не все. Просто на каждом пообучать и посмотреть результаты. Так и делаю, грубо говоря.

 
mytarmailS #:

Если я правильно понял ваше преобразование 

то вы берете приращения, далее на рандомно выбираете индекс приращения и либо оставляете как есть либо переворачиваете (х/-1)

Вы абсолютно правильно поняли мое преобразование.

Возмем какой то абстактный ряд с какой то явной структурой (закономерностью)

Преобразование настолько простое, что и без графиков понятно, что можно получить, что угодно, вплоть до монотонно возрастающей цены.
 
fxsaber #:

Вы абсолютно правильно поняли мое преобразование.

Преобразование настолько простое, что и без графиков понятно, что можно получить, что угодно, вплоть до монотонно возрастающей цены.

ну тогда это нельзя считать симуляцией,

также вы должны понимать что вы разрушыли все тренды которые были, 

как и саму структуру цВР

 
mytarmailS #:

ну тогда это нельзя считать симуляцией,

также вы должны понимать что вы разрушыли все тренды которые были, 

как и саму структуру цВР

Уверен, что разрушил гораздо меньше, чем альтернативные решения. Однако, и этого хватило.

Что же касается структуры, то данный метод основывается на законе больших чисел, на которых держится структура. Он именно для случаев, когда исходных данных десятки миллионов.


Не хочу нахваливать себя, но сильно сомневаюсь, что где-либо в паблике есть подобная работа с тиками и таким мощными инвариантами: время, спред, абсолютное приращение (как следствие - толстые хвосты, нестационарность, корреляции и т.д.). Т.е. неизменными остается сотня миллионов исходных данных. Ни в какое сравнение со "100" стат. характеристиками моделей.


Несмотря на такие уникальные особенности рандомизации сразу был найден тест, который безошибочно отвечает на вопрос, с чем имеем дело: рандомизация или реальность.


Здесь не с чем спорить или о чем-то дискутировать. Продемонстрировано не просто отличие СБ от реальности, а еле уловимое отличие исходного ряда от рандомизации. Ценность в контрпримере.

Причина обращения: