Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 926

 
forexman77:

Пока точно не могу сказать, так как играл многими параметрами улучшения были примерно на 0.1. Может есть какие методики, которых не знаю, поэтому и спросил.

если ничто не помогает, то проблема в данных, в ласах там больше нечего тюнить
 
Aleksey Vyazmikin:

Конечно можно, только придется частями (сервер глючит), набор Filter - определение где нельзя покупать/продавать, набор MaloVhodov - входы по тренду для приличной прибыли, набор MnogoVhodov - все входы кроме убыточных.

Попробовал для начала malovhodov.

Попытался научить лес прогнозировать arr_Buy из 2015 на основе arr_Vektor_Week, arr_Vektor_Day, итд остальные.

Классы очень дисбалансированы (примеров с классом 0 в 10 раз больше чем класс 1), это добавляет много трудностей.

Это 2015 год, на котором обучалось дерево


y_pred
y_true01
09726886118
1 5529 12256
А это 2016, новые для дерева данные:
y_pred
y_true01
09658190918
162968956

Прогноз в обоих случаях невысокой точности, но точность хотя бы больше 50% и там и там.

Дерево такое:


Там всегда влево TRUE, вправо FALSE. В овалах прогноз, нужно ещё округлить (>=0.5 -> 1; <0.5 -> 0) Попробую mnogovhodov, думаю будет лучше, там классов 0 и 1 более равное количество.

 
Dr. Trader:

Попробовал для начала malovhodov.

Попытался научить лес прогнозировать arr_Buy из 2015 на основе arr_Vektor_Week, arr_Vektor_Day, итд остальные.

Классы очень дисбалансированы (примеров с классом 0 в 10 раз больше чем класс 1), это добавляет много трудностей.

Это 2015 год, на котором обучалось дерево


y_pred
y_true01
09726886118
1 5529 12256

Прогноз в обоих случаях невысокой точности, но точность хотя бы больше 50% и там и там.

Дерево такое:


Там всегда влево TRUE, вправо FALSE. В овалах прогноз, нужно ещё округлить (>=0.5 -> 1; <0.5 -> 0) Попробую mnogovhodov, думаю будет лучше, там классов 0 и 1 более равное количество.

Вау, какое малюсенькое деревце! Я удивлен! Из дерева читаю желание входить на развороте тренда, т.е. покупать фактически на самых низах. По Вашей системе остальные предикторы оказались не информативными?

Что такое цифры в овалах?
 

Свой лес на истинные и фальш метки прогнал.

[[ 2011  2948]
 [  215 11821]]//тест

[[14997     0]
 [    0 35985]]//тренировка

Искомый класс больше половины в другой класс на тесте попал, но на тренировке хорошо разделился)

 
Dr. Trader - напишите пожалуйста список предикторов в дереве, а то скрин урезал их названия.
 
Aleksey Vyazmikin:

Вау, какое малюсенькое деревце! Я удивлен! Из дерева читаю желание входить на развороте тренда, т.е. покупать фактически на самых низах. По Вашей системе остальные предикторы оказались не информативными?

Что такое цифры в овалах?

Часть предикторов отсеялось в процессе подбора параметров дерева и предикторов; часть предиктров дерево само отвергло. Не могу ничего конкретного сказать про информативность в целом, но для данного случая вот эти подошли лучше всего.

Овалы - это прогноз деревом. У меня дерево обучалось в режиме "anova", т.е. даётся не конкретный прогноз 0 или 1, а вероятность. То что больше 0.5 - скорее всего класс 1. То что меньше 0.5 - скорее всего класс 0. И соответсвенно чем ближе к 0 или 1 тем дерево увереннее в прогнозе.

Программно дерево можно описать как-то так :

double prediction;
if(arr_Donproc<3.5)
{
  if(arr_iDeltaH1>=-6.5)
  {
    if(arr_TimeH>=14)
    {
       prediction = 0.29;
    }
    else
    {
       prediction = 0.44;
    }
  }
  else
  {
     prediction = 0.58;
  }
}
else
{
  if(arr_RSI_Open_ < 0.5)
  {
     //...
  }
  else
  {
     //...
  }
}

int predictionClass = 0;
if(prediction >= 0.5) predictionClass=1;

if(predictionClass == 0)
{
  //...
}
else if(predictionClass == 1)
{
  //...
}
 
Aleksey Vyazmikin:
Dr. Trader - напишите пожалуйста список предикторов в дереве, а то скрин урезал их названия.

Точно, не заметил. В rattle можно было как-то легко посмотреть список и правила. У меня rattle сейчас нету, поищу как это альтернативно можно сделать.

 
Dr. Trader:

Часть предикторов отсеялось в процессе подбора параметров дерева и предикторов; часть предиктров дерево само отвергло. Не могу ничего конкретного сказать про информативность в целом, но для данного случая вот эти подошли лучше всего.

Овалы - это прогноз деревом. У меня дерево обучалось в режиме "anova", т.е. даётся не конкретный прогноз 0 или 1, а вероятность. То что больше 0.5 - скорее всего класс 1. То что меньше 0.5 - скорее всего класс 0. И соответсвенно чем ближе к 0 или 1 тем дерево увереннее в прогнозе.

Программно дерево можно описать как-то так :

Я ещё вчера переделал информацию по arr_iDelta в разных вариациях, добавил два дополнительных типа предикторов и сделал расчет более полный для H4,MN1,W1 - думаю это значимые предикторы, поэтому старый аналог удалил добавил новые, к примеру

Кстати, основная часть предикторов считается в скрипте, новые посчитал через советник - результат сошёлся, а значит подглядываний нет.

Спасибо за интерпретацию в виде кода! Если интересно, то данные по склейки фьючерса Si.

Приложу снова файлы, предлагаю экспериментировать именно с ними.

Файлы:
Filter_02.zip  3805 kb
 
MaloVhodov_02
Файлы:
MaloVhodov_02.zip  3774 kb
 
MnogoVhodov_02
Файлы:
MnogoVhodov_02.zip  3804 kb
Причина обращения: