У меня 2 модели переобучаются несколько раз, потому что графики и очень похожи - Общее обсуждение

Maxim Dmitrievsky 2023.04.09 14:44 #30081

mytarmailS #:

гдето секунд 5-15 на 5к выборке

ну имею в виду весь процесс от начала до получения ТС

у меня 2 модели переобучаются несколько раз, поэтому не сильно быстро, но приемлемо

и на выходе не знаю что конкретно они отсеяли

[Архив!] FOREX - Тенденции, От теории к практике Система ASCTrend

mytarmailS 2023.04.09 14:51 #30082

Maxim Dmitrievsky #:

ну имею в виду весь процесс от начала до получения ТС

у меня 2 модели переобучаются несколько раз, поэтому не сильно быстро, но приемлемо

и на выходе не знаю что конкретно они отсеяли

трейн 5к

валид 60к

тренировка модели - 1-3 секунды

извлечение правил - 5-10 секунд

проверка каждого правила (20-30к правил) на валид 60к 1-2 минуты

конечно все приблизительно и зависит от количества признаков и данных

Forester 2023.04.09 15:36 #30083

Forester #:

К сожалению этого никто не нашел, иначе был бы не тут а на тропических островах))

Да. Даже 1 дерево или регрессия может найти закономерность, если она есть и не меняется.

Легко. Могу негенерить десятки датасетов. Вот как раз сейчас исследую ТП=50 и СЛ=500. Там и в разметке учителя в среднем 10% ошибки. Если будет 20% то это будет сливная модель.
Так что не в ошибке классификации суть, а в результате сложения всех прибылей и убытков.

Как видите, у верхней модели ошибка 9,1%, а заработать что-то можно при ошибке 8,3%.
На графиках только ООС, получено валкинг-форвардом с переобучением раз в неделю, всего 264 переобучений за 5 лет.
Интересно, что модель отработала в 0 при ошибке классификации 9,1%, а 50/500 = 0,1, т.е. 10% должно быть. Получается что 1%съел спред (минимальный на бар, реальный будет больше).

Тот тест был с реальными объемами с СМЕ для EURUSD: кумулятивные объем, дельту, дивергенцию и конвергенцию по 100 бар. Итого 400 столбцов + 5 еще каких то.
Не меняя никаких настроек модели, просто удалил 405 столбцов с данными СМЕ (остались дельты цен и зигзаги) всего 115 столбцов - получил результаты чуть лучше. Т.е. получается что объемы иногда выбираются в сплиты, но на ООС оказываются шумом. Да и обучение замедляют в 3,5 раза.

Для сравнения оставил вверху графики с объемами, внизу без объемов.

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше, хоть графики и очень похожи.
Это был мой 2-й подход к СМЕ (года 3 назад пробовал) и опять безуспешный.
Получается, что всё учтено в цене.

Кто-то еще пробовал объемы добавлять к обучению? Результаты такие же? Или у вас они дают улучшения?

Торговые стратегии на основе Есть ли закономерность в Вопрос по функции Ichimoku

Rorschach 2023.04.09 15:49 #30084

Forester #:

Тот тест был с реальными объемами с СМЕ для EURUSD: кумулятивные объем, дельту, дивергенцию и конвергенцию по 100 бар. Итого 400 столбцов + 5 еще каких то.
Не меняя никаких настроек модели, просто удалил 405 столбцов с данными СМЕ (остались дельты цен и зигзаги) всего 115 столбцов - получил результаты чуть лучше. Т.е. получается что объемы иногда выбираются в сплиты, но на ООС оказываются шумом. Да и обучение замедляют в 3,5 раза.

Для сравнения оставил вверху графики с объемами, внизу без объемов.

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше, хоть графики и очень похожи.
Это был мой 2-й подход к СМЕ (года 3 назад пробовал) и опять безуспешный.
Получается, что всё учтено в цене.

Кто-то еще пробовал объемы добавлять к обучению? Результаты такие же? Или у вас они дают улучшения?

Наш рынок не пробовали, он вроде менее эффективный?

Или фьючерсы на зерновые, там могут быть какие-нибудь сезонные циклы.

Forester 2023.04.09 15:56 #30085

Rorschach #:
Наш рынок не пробовали, он вроде менее эффективный?

Нет. Спреды не такие интересные.Но может-быть, когда-нибудь... дойду и туда.

mytarmailS 2023.04.09 16:11 #30086

Forester #:

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше..

А они несут, и очень много информации, вот только тупая модель не может это взять

Forester 2023.04.09 16:20 #30087

mytarmailS #:

А они несут, и очень много информации, вот только тупая модель не может это взять

а какая модель может взять? Вы пробовали? На сколько улучшает в сравнении с просто ценами?

mytarmailS 2023.04.09 16:25 #30088

Forester #:
а какая модель может взять?

Боюсь что никакая, только мозг..

Без шуток и с высоты своего опыта..

СанСаныч Фоменко 2023.04.09 17:10 #30089

Forester #:

Тот тест был с реальными объемами с СМЕ для EURUSD: кумулятивные объем, дельту, дивергенцию и конвергенцию по 100 бар. Итого 400 столбцов + 5 еще каких то.
Не меняя никаких настроек модели, просто удалил 405 столбцов с данными СМЕ (остались дельты цен и зигзаги) всего 115 столбцов - получил результаты чуть лучше. Т.е. получается что объемы иногда выбираются в сплиты, но на ООС оказываются шумом. Да и обучение замедляют в 3,5 раза.

Для сравнения оставил вверху графики с объемами, внизу без объемов.

Была надежда, что объемы с СМЕ несут дополнительную информацию/закономерности, которая улучшит обучаемость. Но как видим, модели без объемов чуть лучше, хоть графики и очень похожи.
Это был мой 2-й подход к СМЕ (года 3 назад пробовал) и опять безуспешный.
Получается, что всё учтено в цене.

Кто-то еще пробовал объемы добавлять к обучению? Результаты такие же? Или у вас они дают улучшения?

Вы совершенно не поняли мой пост: не бывает "надежды", или есть цифровая оценка пригодности признака или ее нет. Причем цифровая оценка пригодности признака в будущем.

СанСаныч Фоменко 2023.04.09 17:13 #30090

Maxim Dmitrievsky #:
Учитель это набор признаков и меток, а не то, что вы написали :) вернее, это вообще человек, либо алгоритм, который формирует эти данные 😀

Выбор модели играет значение, нужно выбирать сильную. Но поскольку все сильные модели примерно одинаковых сильных качеств, то выбор между ними уже непринципиален.

Иногда знание правильных определений помогает правильно мыслить.

Смотрю, у Вас неуемное желание плюнуть в мою сторону, а слюну надо беречь, или просто отметиться?

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3009