Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2697

 
Aleksey Vyazmikin #:

0)Какой Вы молодец!

1)И много нашли интересного и устойчивого?

2)Решён вопрос с работой решения в терминале?

0) да я такой..)

1) ещё всерйез  не разворачивал это все дело,  
1. есть проблемы с проклятием размерности и комбинаторным взрывом но это решаемо в теории,  в угоду точности.. 
2. Есть проблема с тем что алгоритм поиска медленный,  многое надо писать на С или С++,  а я не мею
3. Даже оптимизированый алгоритм не сможет искать закономерности в большой дате,  нужно искать закономерности локально.. 
         Но в целом если это не работает то не работает ничего.. 

2) Да


Кстати слово "событие"  можно заменить словом - правило 


 
Aleksey Vyazmikin #:

Ну я не сообразительный, в своих фантазиях... Что значит "реальное время"?

вероятность преодоления любой линии ценой (и сработка сигналов индикаторов) зависит от времени суток и дня недели. 

Нужно в NN и DL допихивать цикличное время. Простейший способ - синусоида. Зависимости нелинейны, поэтому она по простому в квадрате с учётом знака. Будет два дополнительных входа которые отвечают за привязки ко времени. Полночь/полдень везде по разному, поэтому лучше заранее высчитывать и давать фазу. Это связь модели с реальным миром и его временем

если их явным образом не подать, то IMHO получится либо тыква, либо вся халабуда будет пытаться их сама получить и вывести.

 
Maxim Kuznetsov #:

вероятность преодоления любой линии ценой (и сработка сигналов индикаторов) зависит от времени суток и дня недели. 

Нужно в NN и DL допихивать цикличное время. Простейший способ - синусоида. Зависимости нелинейны, поэтому она по простому в квадрате с учётом знака. Будет два дополнительных входа которые отвечают за привязки ко времени. Полночь/полдень везде по разному, поэтому лучше заранее высчитывать и давать фазу. Это связь модели с реальным миром и его временем

если их явным образом не подать, то IMHO получится либо тыква, либо вся халабуда будет пытаться их сама получить и вывести.

Синус вместе с косинусом надо подавать как 2 фичи. Иначе 0,5 и др будут 2 раза за оборот встречаться, типа 2 одинаковых времени..
А можно просто номер дня и номер часа. Разницы нет. Одинаково хорошо заучиваются.
 
Maxim Kuznetsov #:

реальное время не забудь добавить...а то получится как у всех :-)

а-ля 2 шт: y=abs(sin(x))*sin(x) ; с частотой 1 день и 1 неделя ; сдвиг фазы лучше рассчитать заранее

потому-что вероятности сработки индикаторов и пересечения линий от них зависят

это было кстати про вредный,ненавистный тут Фурье :-)

Плохой способ, лучше через Ван хот энкодинг или радиальные функции, и то мало дает, когда этот признак один из нескольких

ничего не прибавляет и не убавляет

по крайней мере у меня так получалось

а это все потому, что любые признаки осциллирующие и так колеблются по разному в разное время из-за гетероскедастичности (волатильности), поэтому уже учитывают

https://developer.nvidia.com/blog/three-approaches-to-encoding-time-information-as-features-for-ml-models/

Three Approaches to Encoding Time Information as Features for ML Models | NVIDIA Technical Blog
Three Approaches to Encoding Time Information as Features for ML Models | NVIDIA Technical Blog
  • Eryk Lewinson
  • developer.nvidia.com
Imagine you have just started a new data science project. The goal is to build a model predicting Y, the target variable. You have already received some data from the stakeholders/data engineers, did a thorough EDA, and selected some variables you believe are relevant for the problem at hand. Then you finally built your first model. The score...
 
elibrarius #:
Синус вместе с косинусом надо подавать как 2 фичи. Иначе 0,5 и др будут 2 раза за оборот встречаться, типа 2 одинаковых времени..
А можно просто номер дня и номер часа. Разницы нет. Одинаково хорошо заучиваются.

номер дня/номер часа тоже не выглядит хорошо - периодично будет большой "геп" 23-0

тогда, чтобы избежать повторов, уже добавить ещё признак а-ля "до/после полудня" (знак производной синусоиды) и оставить sin^2 тактовать время (и заодно масштабировать сигналы).

или как тёзка советует. На мой взгляд чрезмерно.

(циклы факапят на крупных ТФ, а на мелких день/неделя они просто есть, их нельзя выбросить и не учесть,они "несущая")

 
mytarmailS #:
0) да я такой..)

1) ещё всерйез  не разворачивал это все дело,  
1. есть проблемы с проклятием размерности и комбинаторным взрывом но это решаемо в теории,  в угоду точности.
2. Есть проблема с тем что алгоритм поиска медленный,  многое надо писать на С или С++,  а я не мею
3. Даже оптимизированый алгоритм не сможет искать закономерности в большой дате,  нужно искать закономерности локально.. 
         Но в целом если это не работает то не работает ничего.. 

2) Да


Кстати слово "событие"  можно заменить словом - правило 


Нет на рынках точности.

Есть только вероятность с погрешностью.)

 
Maxim Kuznetsov #:

номер дня/номер часа тоже не выглядит хорошо - периодично будет большой "геп" 23-0

тогда, чтобы избежать повторов, уже добавить ещё признак а-ля "до/после полудня" (знак производной синусоиды) и оставить sin^2 тактовать время (и заодно масштабировать сигналы).

или как тёзка советует. На мой взгляд чрезмерно.

(циклы факапят на крупных ТФ, а на мелких день/неделя они просто есть, их нельзя выбросить и не учесть,они "несущая")

С квадратом от синуса вы 4 раза за оборот по 0,5 получите.
 
elibrarius #:
С квадратом от синуса вы 4 раза за оборот по 0,5 получите.

см.выше (всё), про "с учётом знака" я сказал - sin(x)*abs(sin(x))

 
Maxim Kuznetsov #:

см.выше (всё), про "с учётом знака" я сказал - sin(x)*abs(sin(x))

"отличная" фича)

Постройте график своего изобретения.
 
Uladzimir Izerski #:

Нет на рынках точности.

Есть только вероятность с погрешностью.)

Ты не понял о чем речь...

1. есть проблемы с проклятием размерности и комбинаторным взрывом но это решаемо в теории,  в угоду точности.. 

почитай что такое проклятие размерности и комбинаторный взрыв, вики поможет..

решаемо в угоду точности - это имелось ввиду что можно бороться с вышеперечислеными проблемами но пострадает точность, тоесть это уже будет приближение решения, а не решение

Если еще проще то допустим у тебя есть 10 000 признаков на которые ты смотришь , искать по ним всем закономерности долго, комбинаций много ( проклятие размерности )

Ты можешь уменьшыть размерность(сжать) ети  10 000 признаков до 2-5 признаков  но с потерей точности ,но зато с этим можно работать

Теперь надеюсь понятно о какой точности речь?

Причина обращения: