Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2067

 
Valeriy Yastremskiy:

Про сутки понял, согласен. Вопрос про день недели. Время внутри усредняемого периода, суток, не привязано ко дню недели изначально. Выявить внутринедельную повторяемость с учетом времени суток можно изначально сделав привязку к дню недели. У вас привязка только к времени суток дня месяца.

Можно, конечно, по аналогии с минутами внутри дня сделать (например) с пятиминутками внутри недели, но там же придётся отделять чисто недельную периодичность от унаследованной от суточной а также от новостных эффектов и прочей нестационарности. В общем, не уверен в столь же яркой выраженности недельной сезонности.

 
elibrarius:

1) Корреляцию между чем и чем?

Соседними приращениями.

 
Aleksey Nikolayev:

Можно, конечно, по аналогии с минутами внутри дня сделать (например) с пятиминутками внутри недели, но там же придётся отделять чисто недельную периодичность от унаследованной от суточной а также от новостных эффектов и прочей нестационарности. В общем, не уверен в столь же яркой выраженности недельной сезонности.

Видимо косноязычен. Недельное усреднение не рассматриваю. Как получаете ответ,периодичное событие каждый день в 9 утра, или каждый третий, пятый и десятый день месяца, или каждую среду в 9 утра? 

 
Valeriy Yastremskiy:

Видимо косноязычен. Недельное усреднение не рассматриваю. Как получаете ответ,периодичное событие каждый день в 9 утра, или каждый третий, пятый и десятый день месяца, или каждую среду в 9 утра? 

Вроде бы я вас понял и написал в том духе, что событие повторяющееся каждый день в 9 утра будет также и событием повторяющимся каждую среду в 9 утра. Будет довольно сложно выделить те события, которые имеют ТОЧНО НЕДЕЛЬНЫЙ (но не имеют дневной) период из-за очень яркой суточной периодичности. Конечно, могу ошибаться, но яркой недельной периодичности пока не замечал, поэтому в моём коде и нет возможности её выявить.

 
elibrarius:

Если каких то похожих строк много, значит ситуация часто повторяется. Если вы их выкинете, например 0 класс, и начнете в ральной торговле активировать лист классом 1, то если закономерности не изменятся, то вы опять будете получать много 0, вместо предсказанной 1. И терпеть убытки. Оно вам надо?

МО может прогнозировать только из предположения, что закономерность сохранится и действовать так, как было в прошлом. Удаляя закономерности из обучения, вы получите рандом

Есть стратегии, трендовые стратегии, которые хорошо зарабатывают при точности 40%, но стандартные методы МО не дают их обучать, сваливаю класс "1" в ноль, если точность недостаточная, а мне как раз надо такие вот сплиты отделить и улучшить, поэтому и ищу подобные методы. Иначе Recall очень маленький у 1 получается.

 
Aleksey Nikolayev:

В поиске внутридневных закономерностей мешают внутридневные колебания волатильности. Нужно как-то от них избавляться. Возможные способы:

1) Перенормировка приращений с учётом волатильности времени суток.

2) Переход к новому внутридневному времени, в котором дисперсия растёт равномерно.

3) Использование зигзага. Величины колен не зависят от колебаний волатильности. Времена вершин конечно же зависят от волатильности (они чаще бывают там где она высока), но при переходе к равномерному времени эти скопления пропадают.

это в теории.. а на практике как очки не крути.. )

нормировал на волатильность приращения, выравнивал дисперсию. Шла только потеря инфы.

 
Aleksey Vyazmikin:

Есть стратегии, трендовые стратегии, которые хорошо зарабатывают при точности 40%, но стандартные методы МО не дают их обучать, сваливаю класс "1" в ноль, если точность недостаточная, а мне как раз надо такие вот сплиты отделить и улучшить, поэтому и ищу подобные методы. Иначе Recall очень маленький у 1 получается.

Если трендовая, то ТП большой, а СЛ маленький. Например 500 к 100. Тогда при ошибке 80%,  будет 20% успешных и 80% проигрышных сделок. Баланс при этом будет около нуля. Если будете торговать листья с ошибкой 70%, то уже будете в прибыли. А если 50/50 найдете, то прибыль будет просто огромная.


Что значит сваливают? 70% ошибок оно только кажется, что свалено к 0 классу, на на оставшихся 30% первого класса уже можно зарабатывать.

 
Aleksey Vyazmikin:

Максим, есть подозрение, что модель для C++ не корректно выгружается из CatBoost - можете сравнить с моделью для питона?

У меня не сходятся показатели интерпретации модели в MQL5, где показатели взяты из модели CPP, и показатели из бинарной модели. Дельта в районе 0,15 - что очень много.

питоновская это cpp в обертке. Все работает нормально

в плане, ее можно сохранять как в питон формате так и в cpp. Я сохраняю в cpp и потом конвертирую в mql простыми действиями, т.к. сама модель это несколько массивов.
 
Aleksey Nikolayev:

Вроде бы я вас понял и написал в том духе, что событие повторяющееся каждый день в 9 утра будет также и событием повторяющимся каждую среду в 9 утра. Будет довольно сложно выделить те события, которые имеют ТОЧНО НЕДЕЛЬНЫЙ (но не имеют дневной) период из-за очень яркой суточной периодичности. Конечно, могу ошибаться, но яркой недельной периодичности пока не замечал, поэтому в моём коде и нет возможности её выявить.

Не знаю, логика времени работы вроде должна давать недельные периоды. Если будут найдены дневные закономерности, то из них выявить относительно дней месяца или недели периодичности дело техники.

 
Aleksey Vyazmikin:

Есть стратегии, трендовые стратегии, которые хорошо зарабатывают при точности 40%, но стандартные методы МО не дают их обучать, сваливаю класс "1" в ноль, если точность недостаточная, а мне как раз надо такие вот сплиты отделить и улучшить, поэтому и ищу подобные методы. Иначе Recall очень маленький у 1 получается.

надо писать кастомные лосс ф-ии для этих целей

Причина обращения: