Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3009

 
mytarmailS #:

гдето секунд 5-15   на 5к выборке

ну имею в виду весь процесс от начала до получения ТС

у меня 2 модели переобучаются несколько раз, поэтому не сильно быстро, но приемлемо

и на выходе не знаю что конкретно они отсеяли 

 
Maxim Dmitrievsky #:

ну имею в виду весь процесс от начала до получения ТС

у меня 2 модели переобучаются несколько раз, поэтому не сильно быстро, но приемлемо

и на выходе не знаю что конкретно они отсеяли 

трейн 5к

валид 60к


тренировка модели - 1-3 секунды

извлечение правил - 5-10 секунд

проверка каждого правила (20-30к правил) на валид 60к     1-2 минуты


конечно все приблизительно и зависит от количества признаков и данных

 
Forester #:

К сожалению этого никто не нашел, иначе был бы не тут а на тропических островах))

Да. Даже 1 дерево или регрессия может найти закономерность, если она есть и не меняется.

Легко. Могу негенерить десятки датасетов. Вот как раз сейчас исследую ТП=50 и СЛ=500. Там и в разметке учителя в среднем 10% ошибки. Если будет 20% то это будет сливная модель.
Так что не в ошибке классификации суть, а в результате сложения всех прибылей и убытков.

Как видите, у верхней модели ошибка 9,1%, а заработать что-то можно при ошибке 8,3%.
На графиках только ООС, получено валкинг-форвардом с переобучением раз в неделю, всего 264 переобучений за 5 лет.
Интересно, что модель отработала в 0 при ошибке классификации 9,1%, а 50/500 = 0,1, т.е. 10% должно быть. Получается что 1%съел спред (минимальный на бар, реальный будет больше).

Тот тест был с реальными объемами с СМЕ для EURUSD: кумулятивные объем, дельту, дивергенцию и конвергенцию по 100 бар. Итого 400 столбцов + 5 еще каких то.
Не меняя никаких настроек модели, просто удалил 405 столбцов с данными СМЕ (остались дельты цен и зигзаги) всего 115 столбцов - получил результаты чуть лучше. Т.е. получается что объемы иногда выбираются в сплиты, но на ООС оказываются шумом. Да и обучение замедляют в 3,5 раза.

Для сравнения оставил вверху графики с объемами, внизу без объемов.

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше, хоть графики и очень похожи.
Это был мой 2-й подход к СМЕ (года 3 назад пробовал) и опять безуспешный.
Получается, что всё учтено в цене.

Кто-то еще пробовал объемы добавлять к обучению? Результаты такие же? Или у вас они дают улучшения?

 
Forester #:

Тот тест был с реальными объемами с СМЕ для EURUSD: кумулятивные объем, дельту, дивергенцию и конвергенцию по 100 бар. Итого 400 столбцов + 5 еще каких то.
Не меняя никаких настроек модели, просто удалил 405 столбцов с данными СМЕ (остались дельты цен и зигзаги) всего 115 столбцов - получил результаты чуть лучше. Т.е. получается что объемы иногда выбираются в сплиты, но на ООС оказываются шумом. Да и обучение замедляют в 3,5 раза.

Для сравнения оставил вверху графики с объемами, внизу без объемов.

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше, хоть графики и очень похожи.
Это был мой 2-й подход к СМЕ (года 3 назад пробовал) и опять безуспешный.
Получается, что всё учтено в цене.

Кто-то еще пробовал объемы добавлять к обучению? Результаты такие же? Или у вас они дают улучшения?

Наш рынок не пробовали, он вроде менее эффективный?

Или фьючерсы на зерновые, там могут быть какие-нибудь сезонные циклы.

 
Rorschach #:
Наш рынок не пробовали, он вроде менее эффективный?
Нет. Спреды не такие интересные.Но может-быть, когда-нибудь... дойду и туда.
 
Forester #:

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше.. 

А они несут, и очень много информации, вот только тупая модель не может это взять

 
mytarmailS #:
А они несут, и очень много информации, вот только тупая модель не может это взять
а какая модель может взять? Вы пробовали? На сколько улучшает в сравнении с просто ценами?
 
Forester #:
а какая модель может взять? 
Боюсь что никакая, только мозг.. 
Без шуток и с высоты своего опыта.. 
 
Forester #:

Тот тест был с реальными объемами с СМЕ для EURUSD: кумулятивные объем, дельту, дивергенцию и конвергенцию по 100 бар. Итого 400 столбцов + 5 еще каких то.
Не меняя никаких настроек модели, просто удалил 405 столбцов с данными СМЕ (остались дельты цен и зигзаги) всего 115 столбцов - получил результаты чуть лучше. Т.е. получается что объемы иногда выбираются в сплиты, но на ООС оказываются шумом. Да и обучение замедляют в 3,5 раза.

Для сравнения оставил вверху графики с объемами, внизу без объемов.

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше, хоть графики и очень похожи.
Это был мой 2-й подход к СМЕ (года 3 назад пробовал) и опять безуспешный.
Получается, что всё учтено в цене.

Кто-то еще пробовал объемы добавлять к обучению? Результаты такие же? Или у вас они дают улучшения?

Вы совершенно не поняли мой пост: не бывает "надежды", или есть цифровая оценка пригодности признака  или ее нет. Причем цифровая оценка пригодности признака в будущем.

 
Maxim Dmitrievsky #:
Учитель это набор признаков и меток, а не то, что вы написали :) вернее, это вообще человек, либо алгоритм, который формирует эти данные 😀

Выбор модели играет значение, нужно выбирать сильную. Но поскольку все сильные модели примерно одинаковых сильных качеств, то выбор между ними уже непринципиален.

Иногда знание правильных определений помогает правильно мыслить.

Смотрю, у Вас неуемное желание плюнуть в мою сторону, а слюну надо беречь, или просто отметиться?

Причина обращения: