Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 127

 
Alexey Burnakov:


 

 Как вы это определили? Вы отследили работу ваших предикторов на тогда неизвестном будущем?

Почему не известном будущем? На истории все известно. Учу на 1-10 куске, на них же по кроссвалидации проверяю. А затем получаю статистику на 11, 12 и т.д. куске и сравниваю с тем, что получил на 1-10 кусках. Т.е. полная аналогия реальной торговли. Я это описывал много на этой ветке.
 
СанСаныч Фоменко:
Почему не известном будущем? На истории все известно. Учу на 1-10 куске, на них же по кроссвалидации проверяю. А затем получаю статистику на 11, 12 и т.д. куске и сравниваю с тем, что получил на 1-10 кусках. Т.е. полная аналогия реальной торговли. Я это описывал много на этой ветке.

Ага, ну, так я и понял.

А сколько разных вариаций модели вы таким способом просматриваете? Бывает ли так, что на 11, 12. и т.д. кусках модель работает хуже, чем на обучающем куске и вы начинаете заново? 

 
Alexey Burnakov:

Ага, ну, так я и понял.

А сколько разных вариаций модели вы таким способом просматриваете? Бывает ли так, что на 11, 12. и т.д. кусках модель работает хуже, чем на обучающем куске и вы начинаете заново? 

Вариация примерно 2-3% при средней 27-28%. Именно вариации как отклонение от средней.

То, о чем Вы пишите - это должно уменьшить ошибку обучения. Я этим не занимался. Для моих предикторов лучше всех GBM, потом ada. Я использую rf. Далее идут SVM и хуже всех nnet. Как видите пользую не самую лучшую модель.  

 
СанСаныч Фоменко:

Вариация примерно 2-3% при средней 27-28%. Именно вариации как отклонение от средней.

То, о чем Вы пишите - это должно уменьшить ошибку обучения. Я этим не занимался. Для моих предикторов лучше всех GBM, потом ada. Я использую rf. Далее идут SVM и хуже всех nnet. Как видите пользую не самую лучшую модель.  

Ну, ок. СанСаныч.

Если у вас все модели примерно одинаково хорошо валидируются, тут и не надо плясок с бубном. 

Я выложил информацию для осмысления. Я этим пользуюсь, тестирую сам себя и уберегаю от ошибок.

Поможет это вам или уже нет - не знаю. 

Думаю, информация не самая бесполезная. 

 
Alexey Burnakov:

Ну, ок. СанСаныч.

Если у вас все модели примерно одинаково хорошо валидируются, тут и не надо плясок с бубном. 

Я выложил информацию для осмысления. Я этим пользуюсь, тестирую сам себя и уберегаю от ошибок.

Поможет это вам или уже нет - не знаю. 

Думаю, информация не самая бесполезная. 

Я с большим интересом отслеживал все Ваши посты.

Удачи. 

 
СанСаныч Фоменко:

Я с большим интересом отслеживал все Ваши посты.

Удачи. 

Спасибо.

 Я однако под впечатлением остался, что вы прогнозируете что-то мало относящееся к торговли. Не может так быть, чтобы ваши модели с такой легкостью получали 60-70% и при этом давали точные сигналы. Мы тут с переобучением воюем, а вы взглянув на данные просто сказали, нет так никакого сигнала. Ваша работа похожа на предсказание Ирисов Фишера. Немного шусы удалил и все стационарно работает. Вы, коллега, не пробовали сложные процессы прогнозировать. Там где шумов много, сразу отказываетесь. А в чем вам выгода, кроме денег заказчиков, вообще не ясно.

Да еще, вы не знаете как ваши предсказания сработали на будущем, хотя и уверенно говорите об этом.
 
Alexey Burnakov:
Спасибо.

 Я однако под впечатлением остался, что вы прогнозируете что-то мало относящееся к торговли. Не может так быть, чтобы ваши модели с такой легкостью получали 60-70% и при этом давали точные сигналы. Мы тут с переобучением воюем, а вы взглянув на данные просто сказали, нет так никакого сигнала. Ваша работа похожа на предсказание Ирисов Фишера. Немного шусы удалил и все стационарно работает. Вы, коллега, не пробовали сложные процессы прогнозировать. Там где шумов много, сразу отказываетесь. А в чем вам выгода, кроме денег заказчиков, вообще не ясно.

Да еще, вы не знаете как ваши предсказания сработали на будущем, хотя и уверенно говорите об этом.

Что такое "сложные процессы" я не понимаю. У меня реальный советник прицеплен в терминале к котиру... Что дают, то и жуем.

Я уже писал, что я использую предсказание в ТС на старшем ТФ,  у которого три окна. Старший ТФ задает направление. Но кроме этого советник имеет достаточно большой набор средств, целью которого является управление риском. Поэтому как влияет процент ошибки предсказания принадлежности очередной свечи к направлению ЗЗ на общий результат я не могу сказать, да это мне и не интересно.

Повторяю свой предыдущий пост. Инструменты из R, в частности машинное обучение, я пытаюсь использовать для решения конкретных  проблем конкретного советника. Не вообще, а конкретного. Вполне вероятно, что в других ТС мои подходы окажутся не работоспособны. 

 

На счет будущего..

Работает с декабря, полет нормальный. В отличии от индикатора, который был на этом месте в советнике, имеется инструмент, про переобученность которого имеются хот какие-то соображения. Ликвидировано запаздывание. Мало? Колоссальный шаг вперед.  Это истина в последней инстанции? Нет, конечно.

 
Alexey Burnakov:

Да.

Один цикл обучения с кроссвалидацией M1 на 10 фолдах, вы правильно понимаете. Для каждой комбинации параметров обучения: на 9-ти фолдах учим, на отложенном проверяем. Так 10 раз. Получаем среднее значение метрики качества на 10 отложенных фолдах. Назовем эту величину m1.

Я делаю похоже, но двигаю не тестовое окно, а тренировочное. В середине у меня всегда будет подвижное окно для тренировки, а данные для теста обрамляют его с обоих сторон. Я считаю что если уж зависимости непостоянны, и некие "преобладающие периоды" постоянно плавают туда-сюда (со слов mytarmailS, я сам в частоты и фурье не умею) - то нет смысла в том чтобы обучиться на крайних (по времени) ситуациях, а тестировать на чём-то посерединке что могло быть апроксимировано моделью из крайних вариантов. Для тренировки беру уже даже гораздо меньше 50% данных, так тоже ок (по крайней мере не хуже)

У меня используется что-то вроде outer loop с этой картинки, но тренирую на синеньком, а тестирую на сереньком. Добиваюсь чтобы какие-бы 30% последовательных данных я не взял для обучения, модель смогла бы прибыльно торговать на остальных данных. Есть теория, что если я смогу обучить модель хорошо торгующую на всём периоде, используя для обучения любых 10% последовательных данных - то и на новых данных всё тоже будет хорошо.

 
Andrey Dik:

Метода следующая (всё нижесказанное одинаково относится как к ML так и классическим ТС).............

 Перечитал по три раза, хоть убейте не понял((

1) По ходу это не есть МО в чистом виде, это как бы улучшение какой то существующей ТС, у которой есть сигналы на вход, и только на этих входах мы и входим и уже эти входы мы анализируем МО верно?

2) Когда есть прибыль мы закрываем сделку.   Когда сделка в убытке мы держим позицию, с какой стати??

3) когда надо покупать, когда надо продавать?

Я  умею потупить, такой уже я) но  реально ничего не понимаю с того что вы написали, может картинкой какой то покажете или блох схемой какой..

 

Наткнулся на бложик и чуть не всплакнул, человек делал практически ту же идею что и я когда то придумал и решил реализовать, и именно под эту идею я и начал учить программирование  где то год назад

https://www.r-bloggers.com/time-series-matching-with-dynamic-time-warping/ 

 А я то думал что моя идея уникальна)))  молодость, наивность... правда DTW я конечно не использовал, так как вообще тогда еще ничего не понимал

Time Series Matching with Dynamic Time Warping
  • systematicinvestor
  • www.r-bloggers.com
THIS IS NOT INVESTMENT ADVICE. The information is provided for informational purposes only. In the Time Series Matching post, I used one to one mapping to the compute distance between the query(cur…
Причина обращения: