Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 936

 
Dr. Trader:

Понятно. Дерево не смогло научиться качественно фильтровать, так что и результат заметно не улучшился с фильтром, просто сделок поменьше стало. По сути отфильтровалось случайным образом часть хороших и часть плохих сделок, 

Я дерево обучал на 2015 году только для malovhodov.
filter_02 и mnogovhodov_02 обучал на 2016, лучше в тестере сравнить 2016 и 2017 года (2017 - вообще новые данные которых небыло в архиве, вот это самое интересное посмотреть).

Ага, а я думал, что на 2015 году было обучение, тогда дела обстоят так - синий без фильтра, а зеленый с фильтром

Надо сказать, что 2015 год это скорей тренд вверх, 2016 тренд вниз, а 2017 почти боковик на дневках. Т.е. сущности три несколько разные, и я думаю, что глобальные тренды играют свою роль.

И ещё, вход на покупку у меня генерируется от 5 до 9 по предиктору arr_DonProc - поэтому часть дерева автоматом срезана.

А в целом результат не плохой, как думаете?

 
Dr. Trader:

Дальнейшее ветвление у меня приводило к оверфиту. Для лучшей точности тогда уж надо переходить к более сложным моделям - лес или нейронка.

Можно ведь и доветвить до точности в 100% на тренировочных данных, но какой в этом смысл если такое дерево на новых данных будет только сливать. Нужно обучить такую модель, которая сможет на новых данных показать результат почти такой-же как на тренировке.

До 100% можно, причем разными наборами предикторов, но тут явно не использован весь потенциал.

Кстати, я думаю, что надо больше дать информации о прошлом - сейчас её можно получить от Regressor и iDelta, ну и ещё пары предикторов, но нет такой банальности как количество бычьих и медвежьих свечей подряд - их отношение друг к другу - это наверное может быть так же полезно.

 
Aleksey Vyazmikin:

При чём тут вопрос веры? На графике я вижу загогулины - и не понимаю, как их интерпретировать - всё.

Случайный лес рассчитывается на каждом тике. Если результаты собрать по барам, как обычный ценовой поток, то получается такой график. Интерпретация нужна, когда есть формула, а тут просто результат работы леса для наглядности.
 
Roffild:
Случайный лес рассчитывается на каждом тике. Если результаты собрать по барам, как обычный ценовой поток, то получается такой график. Интерпретация нужна, когда есть формула, а тут просто результат работы леса для наглядности.

Тогда я только могу ответить на скрин "Занятная картинка!". Ибо так и не ясно, что хотели показать, всем, если суть ясна только Вам...

 

Процент ошибки леса вычисляется за определённый промежуток времени. А на графике можно видеть расхождения реальности с данными из леса в конкретную минуту (у меня там М5).

Конечно, график из другого леса будет полностью отличиться от моего.

 
Roffild:

Процент ошибки леса вычисляется за определённый промежуток времени. А на графике можно видеть расхождения реальности с данными из леса в конкретную минуту (у меня там М5).

Конечно, график из другого леса будет полностью отличиться от моего.

Теперь понятней, но не ясно, что предсказывается на каждом тике - следующий тик?

Как в реальности будите просчитывать на каждом тике - тут наверное только OpenCL поможет с топовой видеокартой.

 

Я лишь привёл пример своего леса. И я не просил разбираться с результатами моей модели.

Если хотите рекомендации, что конкретно в Вашей модели не так, то вместо странных таблиц покажите уже результат на реальном ценовом графике.

 
Aleksey Vyazmikin:

А в целом результат не плохой, как думаете?

2017 в плюс, это немного радует.


Я ещё одну попытку сделаю. Взял файл mnogovhodov_02, сделал новый таргет:
класс "1" там где arr_Buy = 1
"-1" там где arr_Sell = -1
"0" для остальных случаев

Для вашей стратегии такой таргет кажется более подходящим.

 
Roffild:

Я лишь привёл пример своего леса. И я не просил разбираться с результатами моей модели.

Если хотите рекомендации, что конкретно в Вашей модели не так, то вместо странных таблиц покажите уже результат на реальном ценовом графике.

Пока модели нет, как таковой, в поисках. Таблица показывает, изменение результатов, пока большего не требуется - шевелится, значит живое.

 
Dr. Trader:

2017 в плюс, это немного радует.


Я ещё одну попытку сделаю. Взял файл mnogovhodov_02, сделал новый таргет:
класс "1" там где arr_Buy = 1
"-1" там где arr_Sell = -1
"0" для остальных случаев

Для вашей стратегии такой таргет кажется более подходящим.

А это значит можно строить больше чем на 3 целевых выхода дерево?

Причина обращения: