Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1226

 

Кеша Рутов:

нужно знать СОСТОЯНИЯ РЫНКА, когда вероятен тренд когда флет, на флете работают канальники, сетки и прочее, на тренде машки.

toxic:

Мысль мягко говоря не новая, такое "озарение" приходит в голову примерно через пару месяцев после первого знакомства с торговым терминалом))) Но следует помнить про "no free lunch" и что практика - критерий истинны. 

Сварганить фичи и целевые для тренд-флет детекторов на МО, не совсем тривиальная задача, как кажется на первый взгляд.

 
Martin Cheguevara:


...рямоугольничГе полностью соответствует теГуЖей ситуаЗии на рынГе)

это естественно, ведь смирительная рубашка и должна соответствовать размеру безумия.

 
revers45:

это естественно, ведь смирительная рубашка и должна соответствовать размеру безумия.

У безумия не бывает размера, так же как у хаоса не бывает степеней свободы, рубашка это суть здравого смысла у которого есть размер.

Безумие - способ определения здравым смыслом той черты за которой уже нет никакой необходимости что-либо измерять.

Безумен тот, кто пытается измерить неизмеримое;)

 
toxic:

как делаете препроцессинг, в общих словах? потому что есть много "фишек", в основном это игра с распределениями фичей и меток

 
toxic:

Фишек пруд пруди в общих чертах сложно сказать что либо полезное, а конкретику, ну Вы сами понимаете...

Есть ряд "правил" которые позволяют избежать грубых ошибок при построении признаков с временных рядов, в частности одно из самых нарушаемых это банальное "смешивание" фичей с таргетами, фичи должны быть строго из прошлого, а таргеты из точек строго из будущего, такое разделение должно быть на уровне алгоритма преобразования ряда в датасет, а не как все делают нахерачат всяких индикаторов потом порежут на трейн и тест, куда то что то сдвинут и тд. Резать нужно исходный ряд, потом не пресекающимися скользящими окнами(прошлого и будущего) пробежаться по ряду и получить фичи и таргеты отдельно для лёрна и теста можно ещё для валидации. Можно конечно это и индикаторами делать, если точно знаете что индюк для фичей не смотрит вперёд, а для таргетов не смотрит назад. Есть ряд ещё более тонких ошибок, но пока не буду об этом.

Сами преобразования могут быть разные, от тривиальных(ретурн, вариация, изменение объёма, дельта стакана, распределение сделок и тд.) до всякой экзотики, градиентов горизонтальных уровней проторгованных объёмов, "паттерны" куда же без них))), Десятки специфических кастомных статистик, полученных путём "озарения" или кластеризации, оказавшихся полезными, вроде озвученных выше ув.Инокентием "тренд\флет", а также "порядка\хаоса" и тп. Некоторые статистики считаются для разных временных масштабов, некоторые нет, одни фичи работают для одних инструментов другие нет, нужно уметь фильтровать и отбирать признаки под таргет. Много всего есть, стандартные модели ARMA, GARCH... как фичи, разные спектральные методы, ну разумеется) Средне и долго срочное макро-прогнозирование, как фичи и тд. Пока руки не дошли и некому делать NLP\NLU для анализа текстовых потоков, с соцсетей и тд. Вот тут точно понадобится дип-лёрниг.

ну да, хотелось бы какой-нибудь "магии", типа переставил значения местами и ошибки резко упали везде :)

арма и гарч на вход - нормально, сам делал что-то подобное, но не довел до ума (в частности, линейную зависимость USDX к EURUSD как фичу, нормально работает)

парсить, думаю, ничего не буду.. лень )) если только в МТ5 доделают доступ к календарю. На новостях и без НС ботов делают годных, сам не торговал но видел отчеты, и ДЦ банят что тоже показатель

 
toxic:

"мигию" показывали ув.СанСаныч с внуком Кешей, берете ZZ как таргет и сразу "магия"))) только та реале не стоит её проверять, за такую магию кукл люлей вломит больно и парсить не придётся

точно такая же магия произошла недавно при использовании LDA (линейного дискриминантного анализа) для трансформации фичей, ктож знал что классификатор поверх классификатора показывает красивые картинки только на трейне и тесте, но никак не на валидации )

с PCA почти то же самое.. какой идиот придумал и написал использовать это для прогнозирования временных рядов - не знаю, но многие подхватили. Типа древоподобным нужна такая предобработка ) но нужно было проверить

 
Maxim Dmitrievsky:

с PCA почти то же самое.. какой идиот придумал и написал использовать это для прогнозирования временных рядов - не знаю, но многие подхватили. Типа древоподобным нужна такая предобработка ) но нужно было проверить

PCA не использовал, чисто интуитивно, появилось какое то обоснования вредности его использования для ВР?

 
elibrarius:

PCA не использовал, чисто интуитивно, появилось какое то обоснования вредности его использования для ВР?

получается примерно то же самое на нестационарном рынке что и без него, только еще хуже.. - главные компоненты, выделенные на трейне, на ООС начинают "скакать", в итоге идет переобучение за счет самого PCA

думаю, что актуально для любых методов декомпозиции или наоборот уменьшения размерности. Фичи должны быть строго стандартизированы и нормализованы для него, но и это не спасает..

 
toxic:

Фишек пруд пруди в общих чертах сложно сказать что либо полезное, а конкретику, ну Вы сами понимаете...

Есть ряд "правил" которые позволяют избежать грубых ошибок при построении признаков с временных рядов, в частности одно из самых нарушаемых это банальное "смешивание" фичей с таргетами, фичи должны быть строго из прошлого, а таргеты из точек строго из будущего, такое разделение должно быть на уровне алгоритма преобразования ряда в датасет, а не как все делают нахерачат всяких индикаторов потом порежут на трейн и тест, куда то что то сдвинут и тд. Резать нужно исходный ряд, потом не пресекающимися скользящими окнами(прошлого и будущего) пробежаться по ряду и получить фичи и таргеты отдельно для лёрна и теста можно ещё для валидации. Можно конечно это и индикаторами делать, если точно знаете что индюк для фичей не смотрит вперёд, а для таргетов не смотрит назад. Есть ряд ещё более тонких ошибок, но пока не буду об этом.

Сами преобразования могут быть разные, от тривиальных(ретурн, вариация, изменение объёма, дельта стакана, распределение сделок и тд.) до всякой экзотики, градиентов горизонтальных уровней проторгованных объёмов, "паттерны" куда же без них))), Десятки специфических кастомных статистик, полученных путём "озарения" или кластеризации, оказавшихся полезными, вроде озвученных выше ув.Инокентием "тренд\флет", а также "порядка\хаоса" и тп. Некоторые статистики считаются для разных временных масштабов, некоторые нет, одни фичи работают для одних инструментов другие нет, нужно уметь фильтровать и отбирать признаки под таргет. Много всего есть, стандартные модели ARMA, GARCH... как фичи, разные спектральные методы, ну разумеется) Средне и долго срочное макро-прогнозирование, как фичи и тд. Пока руки не дошли и некому делать NLP\NLU для анализа текстовых потоков, с соцсетей и тд. Вот тут точно понадобится дип-лёрниг.

Когда повторял статьи Владимира Перервенко, то делал доп. эксперимнт - вообще без доп индикаторов (цифровых фильтров для последних статей), т.е. чисто на ценах. Резальтат был всего на пару процентов хуже. Да и то думаю что это просто менее удачное обучение НС (разное пермешивание и нач. инициализация весов, и OHLC были не из статьи, а с моего сервера). НС запросто сделает внутри себя любой индикатор если он ей нужен для предсказаний. Думаю не зачем гадать какой ЦФ с какии то параметрами (ФНЧ/ФВЧ/полосовой или какая нибудь МАшка) полезен для предсказания. НС сама все сделает из OHLC.

А вот про более тонкие ошибки все же интересно узнать...

Жаль что полезная информация по МО для ВР размазана на 1200+ страницах. Вот бы собрать все в одном месте.Если уж не рабочие идеи - то хотя бы тупиковые типа ZZ, PCA и подглядываний вперед/назад

 
toxic:

 Так что "грааль" может быть только в контексте ультра-хфт, точнее был там когда то, когда не было такого мрачного регулирования, или инсайд, который доступен парням которые и без него могут просто бабла напечатать в кризис и купить на них свои облигации))

Ну вот опять...

Не надоело тебе народ пужать своими триллиардами и инсайдами, знаешь есть пословица "шавка лает, а караван идёт", ненужны нам твои обиды на ДЦ где ты оставил свои последние сто баксов, мир не справедлив, тебе не повезло, а мне повезёт, я с сотни сделаю мильён, а если нет так ещё попробую, пока не получится. 


Подружке поплачься или мамке, не мешай нам мечтать о яхтах и островах и шаг за шагом воплощать свои мечты в реальность. Развелось тут блин всяких "гуру" которые даже не знают от куда Воронова скачать и как отличить тренд от флета, сгиньте нечисти, возвращайтесь в ад.