Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1382

 
Yuriy Asaulenko:

Для моей задачи 20 достаточно. В общем случае, возможно нужно и больше. От конкретики зависит.

Имхо, нельзя поставить log - это нелинейное преобразование. Польза, в общем случае, оч сомнительна.

Лог нужен так как цена изменяется не как кумулятивная сумма приращений, а как произведение, на подобии сложного процента, хотя в случае валют, где изменения очень малы, это не суть.

 
Yuriy Asaulenko:

Для моей задачи 20 достаточно. В общем случае, возможно нужно и больше. От конкретики зависит.

Имхо, нельзя поставить log - это нелинейное преобразование. Польза, в общем случае, оч сомнительна.

В общем случае, я пропускаю входной ряд через сигмоид или tanh, таким образом, чтобы основные цены были на "линейном" участке, и нелинейностью ограничивались лишь выбросы.

вроде как НС сама пропустит их через сигмоиду? )) или это что-то дополнительное дает

 
Maxim Dmitrievsky:

вроде как НС сама пропустит их через сигмоиду? )) или это что-то дополнительное дает

Но не на входе.) Дает ограничение выбросов во входном ряду, мы не перегружаем нейроны по входу НС.

 
Yuriy Asaulenko:

Но не на входе.) Дает ограничение выбросов во входном ряду, мы не перегружаем нейроны по входу НС.

можно через арктангенс еще пропустить.. преобразование Фишера

типа делает распределение более нормальным... но что там от данных останется это уже не ко мне вопросы ))

 
Maxim Dmitrievsky:

можно через арктангенс пропустить.. преобразование Фишера

типа делает распределение более нормальным... но что там от данных останется это уже не ко мне вопросы ))

Можно как угодно, лишь бы на выходе центральная часть в основном диапазоне линейной была.

Все данные будут на месте, кроме выбросов, кот будут немного задавлены. Абсолютно нормальная метода при обработке сигналов.

ЗЫ Иначе, какой нибудь шип на истории забьет вам все нейроны, и будет забивать пока не выйдет из видимости. НС у вас просто в отказ или несознанку уйдет. )

 
Грааль:

Лог нужен так как цена изменяется не как кумулятивная сумма приращений, а как произведение, на подобии сложного процента, хотя в случае валют, где изменения очень малы, это не суть.

Я полагаю, что при более-менее стабильном рынке M(dC/C) =~const. 

 

Я применяю не деление (P[i] / P[0])., а вычитание (P[i] - P[0]), т.е. не относительное изменение цены, а абсолютное. Предварительно убираю выбросы (1% по кличеству от самых больших и самых малых значений).

Деление дает какие то преимущества? Сейчас использую лес, которому нормировка и масштабирование не требуются.

 
elibrarius:

Я применяю не деление (P[i] / P[0])., а вычитание (P[i] - P[0]), т.е. не относительное изменение цены, а абсолютное. Предварительно убираю выбросы (1% по кличеству от самых больших и самых малых значений).

Деление дает какие то преимущества? Сейчас использую лес, которому нормировка и масштабирование не требуются.

Распространено мнение, что разность логарифмов цен (то же самое - логарифм их отношения) по распределению ближе к нормальному, чем просто разность. По этой же причине для вывода формулы Блэка-Шоулза цена моделируется геометрическим броуновским движением.

 
elibrarius:

Я применяю не деление (P[i] / P[0])., а вычитание (P[i] - P[0]), т.е. не относительное изменение цены, а абсолютное. Предварительно убираю выбросы (1% по кличеству от самых больших и самых малых значений).

Деление дает какие то преимущества? Сейчас использую лес, которому нормировка и масштабирование не требуются.

Вы делаете сдвиг,  но не масштабирование
 
Yuriy Asaulenko:
Вы делаете сдвиг,  но не масштабирование
Да. Масштабирование деревьям/лесам и не требуется.


Т.е. преимуществ в делении над вычитанием особых нет. Кроме случая логарифмирования, которое сделает данные более похожими к нормальному распределению, как сказал Алексей Николаев. Т.е. изменится плотность между точками, но не порядок.  Но и в этом случае не вижу преимуществ - дерево будет делать сплит не по одному уровню, а по другому - т.е. подстроится под любое распределение. Т.к. дерево по сути - простая запоминалка.

Причина обращения: