Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 80

 
Что означает "RF 10/5"
 
mytarmailS:
 Да мы все тут демагоги, только вы д'артаньян, это уже понятно,  хорошо что хоть не троль.... пока..... :)

вот вам как пример http://robostroy.ru/community/article.aspx?id=801

 Вы сразу начнете говорить что это фейк все торги только на истории и.т.п , но я довольно много общался с этим человеком по общению я понял что человек глубокий практик и по рынку у меня не было таких вопросов на которые у него не было ответов..

Человек этот кандидат. тех. наук. , уже достаточно давно (лет 20 назад )защищал диссертацию по "ИИ"  строит роботов тоже больше 20 лет, опыта у него вагон с тележкой

И он утверждает что нельзя рынок спрогнозировать с позиции черного ящика, нужно выделять рабочие признаки, понимать как и почему они работают , максимально фильтровать данные чтоб оставить только то что работает игнорируя шум.

У него в сети около 100 признаков(предикторов),  за каждым признаком стоит  целая библиотека или пакет как хотите

 А теперь сравните какая пропасть по качеству между признаком для получения которого нужно писать целую библиотеку и какой то дурацкой кривулькой имя которой "SMA" , "MACD" ,"RSI" и прочее ... полезной информации в которой 0.00000001% как и писал  Mihail Marchukajtes ,    и это есть факт иначе модели показывали бы именно ту эффективность которую они могут показывать, а это от 90% правильных ответов

 Человек этот рекомендует ознакомиться с "МГУА" и спектральным анализом в частности Фурье

 ========================================================

Дальше каких результатов я "демагог" добился, да на самом деле очень скромных, задумок хороших как мне кажется очень много, мои исследование идут сразу во многих направлениях и есть огромная нехватка в знаниях в различных областях, потому часто прошу помощи у форумчан, но особо помогать никто и не хочет , молв ты сам научись, а тогда ..... только вот если я уже сам все освою то зачем мне тогда это общение, как то без логики по моему.. ну это я отвлекся


вот лучшее на дан. мом. что мне удалось выжать из RF на новых данных это 50% в месяц на протяжении 2-ух месяцев подряд, но все пока очень не стабильно, картинки пробовал закинуть раз 10 но не получаеться  (получилось)


 

 Суть в том в том что не надо себя изначально ограничивать шаблонами типа 30% в год это круто, это не круто, это рамки для разума и творчества

Поздравляю. Вот так и торгуйте 5 лет. Или покажите любые данные реал. статистики за 5 лет.

А по поводу признаков, я не хочу тут разводить диванный анализ, типа, ваши признаки гумно, есть признаки лучше, модели не важны. Ну, покажите, что вы сделали. Я все свои входы тут выкладывал, и их комбинации тоже. Посчитайте их информативность. А так-то зачем воздух колебать? 

 
СанСаныч Фоменко:
Что означает "RF 10/5"

Да это я для себя делал заметку на картинке когда тестировал модель на новых данных, на это не обращайте внимание ....

 это параметр модели 5 деревьев 10 веток в дереве 

 
mytarmailS:

Да это я для себя делал заметку на картинке когда тестировал модель на новых данных, на это не обращайте внимание ....

 это параметр модели 5 деревьев 10 веток в дереве 

Очень все интересно!

Может подкините какие-либо подробности? 

 
mytarmailS:
 

вот лучшее на дан. мом. что мне удалось выжать из RF на новых данных это 50% в месяц на протяжении 2-ух месяцев подряд, но все пока очень не стабильно, картинки пробовал закинуть раз 10 но не получаеться  (получилось)


 

 Суть  в том что не надо себя изначально ограничивать шаблонами типа 30% в год это круто, это не круто, это рамки для разума и творчества

это бэк-тест на данных вне выборки? Правильно я понял?
 
СанСаныч Фоменко:

Очень все интересно!

Может подкините какие-либо подробности? 

что именно вы хотите узнать? 90% того что я знаю я уже выкладывал тут, с картинками, но никому до этого нет дела, у каждого свое понимание рынка - свой путь.  Соответственно каждый воспринимает информацию по своему и далеко не всегда готов слушать другого именно слушать а не слышать
 
Alexey Burnakov:
это бэк-тест на данных вне выборки? Правильно я понял?
да
 
mytarmailS:
да
 развивайте идею. добавляйте больше данных. надо, чтобы пару лет проходила вне выборки. А так, хорошо, молодцы!
 

Похоже на неправильное обучение модели, слишком большой разброс. Модели обычно имеют какие-то случайные процессы при обучении, где логика обучения константно не дефинирована. Такие рандомные моменты приводят к тому что обучив несколько моделей, они хоть и будут давать примерно одинаковые результаты на тренировочных данных, но на фронттесте будут отличия.

Есть несколько источников проблемы и её решений:
1) есть шумовые входы не несущие полезной информации, их надо убрать
2) поменять параметры обучения модели. Для нейронки я решил эту проблему параметром decay(торможение скорости обучения), результаты на фронттесте с этим параметром стали менее разбросанными. Что делать с лесом я не знаю
3) сделать комитет моделей. Обучить много моделей, фронттест делать на всех моделях, брать тот результат куда говорит большинство
4) если делаете кроссвалидацию в процессе обучения - то повторяйте её несколько раз на одних и техже данных, смотрите насколько большой будет разброс результатов, выбирайте модели и предикторы с небольшим разбросом

Это то что пришло сейчас на ум, но это не предел возможных проблем. 

 
Alexey Burnakov:
 развивайте идею. добавляйте больше данных. надо, чтобы пару лет проходила вне выборки. А так, хорошо, молодцы!
есть сер :)
Причина обращения: