Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 882

 
Vizard_:

Бинаризацией убито много полезной инфы.

C одной стороны да. А с другой есть впечатляющий результат (если он без подглядывания). Алеша помнится говорил, что ошибку ниже 45% получить очень сложно (да и у меня пока что тоже около 45).
 
Aleksey Vyazmikin:

Обычный лес или случайные леса, или оба?

Поставил я Rattle и R (ну и глючит же всё это дело...), и вот не могу понять, как сделать сопоставимые настройки, как на скрине ниже? А то сдандартный Rattle настройки дали результат хуже, чем прога, которой я пользовался до этого.


Обычный лес или случайные леса, или оба?

В rattle прогоните обе модели лесов, которые называются tree и  ada. Откройте вкладку log  и увидите код на R, обращения к используемым пакетам и сможете понять их различия.   

Поставил я Rattle и R (ну и глючит же всё это дело...),

Не понял, что глючит, в последнее время прогнал огромное количество моделей - все нормально

и вот не могу понять, как сделать сопоставимые настройки, как на скрине ниже? А то сдандартный Rattle настройки дали результат хуже, чем прога, которой я пользовался до этого.

Картинка из rattle  у Вас недоделанная. Как минимум надо перейти на соседнюю вкладку evaluate и посмотреть результаты там.

Но самое главное надо исходный файл разбить на две части с разными именами (скорее всего это придется делать на R).

На первом файле строите ВСЕ шесть моделей и смотрите их оценку test, validate.   Потом имя второго файла заносите в поле R Dataset. И на нем получаете снова оценки. Все полученные оценки должны примерно совпадать!

Если у Вас эти оценки НЕ совпадают, причем на втором файле результативность моделей принципиально хуже, то это означает, что Ваши модели переобучены и причиной переобученности является наличие шумовых (не относящихся к целевой переменной) предикторов.


Это и есть момент истины: или у вас имеется набор предикторов, относящихся к конкретной целевой переменной или у Вас нет этого. И никакие модели этого печального обстоятельства исправить не могут. Далее начинается тупая работа по подбору пары "целевая-предикторы", модели вообще не интересны, найдете пару, то модели просто семечки в R, за день наберете десяток и будете делать из них ансамбли.


ПС.

1. Не слушайте форумян, не владеющих R: их результаты не только не возможно повторить, но даже понять.

2. Нет проблем использования R советника: все работает и очень устойчиво.

3. Не забываем, что rattle протоколирует на R все Ваши действия. Этот протокол можно использовать как обычны код на R

 
СанСаныч Фоменко:

ПС.

1. Не слушайте форумян, не владеющих R: их результаты не только не возможно повторить, но даже понять.

2. Нет проблем использования R советника: все работает и очень устойчиво.

3. Не забываем, что rattle протоколирует на R все Ваши действия. Этот протокол можно использовать как обычны код на R

СанСаныч, вот, у меня вопрос. В настоящее время Вы имеете что-либо реально рабочее и приносящее деньги? Достаточно - да или нет.

И если - да, то R здесь с какого бока? А если нет, то тем более - где и причем здесь R?

ЗЫ Ответ можно угадать с вероятностью 0.95.)

 
Yuriy Asaulenko:

СанСаныч, вот, у меня вопрос. В настоящее время Вы имеете что-либо реально рабочее и приносящее деньги? Достаточно - да или нет.

И если - да, то R здесь с какого бока? А если нет, то тем более - где и причем здесь R?

ЗЫ Ответ можно угадать с вероятностью 0.95.)

Имел финансовые проблемы 2 года назад. Решил за год. У советника, решившего эти проблемы, был  блок принятия решения = случайный лес + индикаторы. Не было никаких теоретических гарантий, что будущее будет похоже на прошлое.

Снова появились финансовые проблемы. Заканчиваю новую разработку с блоком принятия решений ТОЛЬКО на R. Детали раскрывать не буди, кроме одной: имеются теоретические обоснования и тесты, подтверждающие теорию, что будущее будет похоже на прошлое. Сроки пока не ясны.

 
СанСаныч Фоменко:

Имел финансовые проблемы 2 года назад. Решил за год. У советника, решившего эти проблемы, был  блок принятия решения = случайный лес + индикаторы. Не было никаких теоретических гарантий, что будущее будет похоже на прошлое.

Снова появились финансовые проблемы. Заканчиваю новую разработку с блоком принятия решений ТОЛЬКО на R. Детали раскрывать не буди, кроме одной: имеются теоретические обоснования и тесты, подтверждающие теорию, что будущее будет похоже на прошлое. Сроки пока не ясны.

Здесь интересно то, что способ взаимодействия с R Вы искали не далее как полгода-год назад - в итоге появилась ДЛЛ. До того такой возможности вообще не было.

Леса тоже появились в Ваших постах с год назад. До этого были АДА и пр.

 
Yuriy Asaulenko:

Здесь интересно то, что способ взаимодействия с R Вы искали не далее как полгода-год назад - в итоге появилась ДЛЛ. До того такой возможности вообще не было.

Леса тоже появились в Ваших постах с год назад. До этого были АДА и пр.

Статью о лесах от 2014 не помните? https://www.mql5.com/ru/articles/1165 Или индикатор от 2012? Зайдите в профиль прежде чем сочинять.

Случайные леса предсказывают тренды
Случайные леса предсказывают тренды
  • 2014.09.29
  • СанСаныч Фоменко
  • www.mql5.com
Изначально целью построения торговой системы является предсказание поведения некоторого рыночного инструмента, например, валютной пары. Цели предсказания могут быть разными, мы же ограничимся предсказанием трендов, а точнее предсказанием роста («лонгов») или падения («шортов») значений котировки валютной пары. Обычно, для решения проблемы...
 
elibrarius:
Статью о лесах от 2014 не помните? https://www.mql5.com/ru/articles/1165

Не, не видел. Я ориентируюсь на ветку МО. Здесь СанСаныч тогда все про АДА говорил. На леса уже потом перекинулся.

Но главное- связь терминала с ТС без этого невозможна. Тема появилась -Формулируем техническое задание на связь MQL4/5 с R  -  2017.01.02 15:59. Закончилась - 2017.11.30 10:16.

Таким образом, ранее 06.2017 никакой системы как-то привязанной к R быть не могло.

 

Лично про СанСаныча ничего не имею, он очень грамотный и сдержанный человек, делающий что-то там свое неведомое, наверное ему нужен R

мне интуитивнее питон, хотя пока не придумал что такого этакого нужно сделать на нем что бы было прямо вау, но продолжаю изучать по тихой, авось пригодится :D

 
Yuriy Asaulenko:


Здесь интересно то, что способ взаимодействия с R Вы искали не далее как полгода-год назад - в итоге появилась ДЛЛ. До того такой возможности вообще не было.

Мною был помещен индикатор на основе R в мае 2012 года, т.е. шесть лет назад. А до этого я перенес в кодобазу ДЛЛ для связи МТ4/R (автор 7bit). Так что возможность использования R из советника МТ4 очень давно.
Год назад я искал исполнителя, который доработает эту древнюю ДЛЛ под 64 бита. Теперь можно использовать R из МТ5.  


Леса тоже появились в Ваших постах с год назад. До этого были АДА и пр. 

Я всегда писал, что больше нравится ada, но для нее чего-то не хватало в caret, который я использовал при разработке и при функционировании. Поэтому реально в советнике использовался пакет randomForest.  

 
Vizard_:

Минеры херовы, прости Господи))) Изначально ты делал на С4.5. В ратле поставил
слабое дерево. Укуреный Максимка вообще пишет о случайном лесе. Кто в лес, кто по дрова)))
На твоих данных, файл Pred_004_Buy деленый пополам, в лоб можно получить 0.85.
Данные лажа и лучше выкинуть. Остальное догоняем самостоятельно. В тишине...

Как в Rattle или другой приблуде к R запустить этот алгоритм, как он там называется? Интересует дальнейшее использование результатов в MT5.

Если 0,85 - это лажа, тогда должен быть результат 100% для этого алгоритма, или есть какие либо весомые аргументы?

Причина обращения: