Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 501

 
СанСаныч Фоменко:

Вы ничего не поняли из моего поста. Вообще ничего.


А ветку жаль из-за Вашего присутствия.


ага, вы тогда  товарищами определитесь по цеху, которые утверждают что леса умеют экстраполировать :))

 
toxic:

На самом деле вопрос поднят интересный.

В случае регресии y = f(x) лес действительно не умеет “экстраполировать”, за пределы где нет обучающих точек, а MLP умеет, хотя он это делает тоже не акти, в стиле полиномиальной регрессии максимум, что “покрасивше” на чарте константы от деревьев.


Но также правы в чем то и Сансаныч с Лехой, так как регрессия y = f(x) – это не то что нам трейдунам надо, так как если x – время от рождества Христова, то такие зависимости нам не интересны, а в пространстве других фичей, точки из будущего по времени не будут обязательно за пределами обучающей выборки из наших индикаторных фич.

Почему лес из деревьев дает константу мне ясно, линейная регрессия тоже очевидно, а вот почему MLP даёт псевдо-полиномиальную регрессию я “не вижу” так же прозрачно. Нужно разобраться...


ну простой пример, если предсказывать цены и обучать леса на неполном интервале цен, то в случае когда нужно предсказать цену вне обучающего интервала то он ее не предскажет. Понятно, что это специфические ситуации и то что обучать нужно правильно и тогда таких проблем можно избежать в большинстве случаев

вот по вашей картинке как раз то о чем я и писал, да

 
toxic:

Колитесь КАК???


Paint ))

 
toxic:

Проблем нет вообще, так как нет в признаках линейного времени, "вне обучающего интервала" только очень редкие выбросы, то чего не должно быть, грёбаные черные лебеди :)


аа, я думал что от интервала целевых зависит.. невнимательно значит думал

 
У Уважаемых участников ветки хочется спросить по этому поводу

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Таблица с котировками для 1000 самых торгуемых акций. Данные за последний год.

fxsaber, 2017.10.04 14:19

"Регулярно делай перебалансировку портфтеля и все будет хорошо" - так говорят очень многие, пока не подсунут в свою считалку СБ (случайное блуждание) вместо исходных ценовых рядов.

Подавляющее большинство после СБ видят ровно такую же картину, как и с реальными данным. Но сделать тот же вывод, сказав фразу про перебалансировку, уже не могут, ведь это СБ. И "будет хорошо" исключено.

Вопрос, как мне видится, ключевой: насколько сильно реальные ценовые данные отличаются от СБ? Если правильно понимаю, чем сильнее отличие, тем больше возможностей выжать профит. И наоборот, вплоть до "нет отличий - нет профита".

 
toxic:

почему MLP даёт псевдо-полиномиальную регрессию я “не вижу” так же прозрачно. Нужно разобраться...

Разберитесь почему 1 нейрон делает линейную регрессию, как это происходит на низком уровне, тогда легко поймете как получаются не линейные варианты в многонейронных и многослойных сетапах. А Random Forest как и Knn и прочие ядерные инструменты, делают только локальную интерполяцию, что может быть экстраполяцией в других проекциях, не суть важно, но RF не строит(потгоняет) функций в широком диапазоне, а многослойный персептрон строит.

 
fxsaber:

Вопрос, как мне видится, ключевой: насколько сильно реальные ценовые данные отличаются от СБ? Если правильно понимаю, чем сильнее отличие, тем больше возможностей выжать профит. И наоборот, вплоть до "нет отличий - нет профита".

Отличаются, но очень чучуть, на глаз не заметить. Кроме того большая часть отличий уже учтена в торговых издержках.

 
fxsaber:
У Уважаемых участников ветки хочется спросить по этому поводу

Вопрос, как мне видится, ключевой: насколько сильно реальные ценовые данные отличаются от СБ? Если правильно понимаю, чем сильнее отличие, тем больше возможностей выжать профит. И наоборот, вплоть до "нет отличий - нет профита".


Отличия состоят  наличие в ценовой ряде относительно большого выбросов и наличие слабо выраженной "сезонности" - часы/торговые сессии, дни недели и пр.

Ну, еще "толстые" хвосты.

 
Дмитрий:

Отличия состоят  наличие в ценовой ряде относительно большого выбросов и наличие слабо выраженной "сезонности" - часы/торговые сессии, дни недели и пр.

Можно склеить несколько СБ с разными интервалами, чтобы получить такой же эффект.

Ну, еще "толстые" хвосты.

Взять "толстохвостый" СБ.

 
fxsaber:

Можно склеить несколько СБ с разными интервалами, чтобы получить такой же эффект.

Взять "толстохвостый" СБ.


Подогнать СБ под признаки ценового ряда можно, но после всех этих преобразований это будет уже не СБ.

А в чем смысл?

Причина обращения: