Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1120

 
toxic:

Можно спорить, но на рынке вообще не важна верность\не верность, важнее чтобы работало, а у меня обычно чем больше сэмплов тем лучше результат)))

просто если взять тот же лес или xgb - им все равно на каком кол-ве сэмплов переобучаться :) просто модель будет весить гигабайты

а вот рекурсивный перебор фичей с внешней метрикой начал давать плоды даже на маленьких подвыборках, и даже не внешней
 
Vizard_:

Трен = 100к строк. На оставшихся 8к+(тест)применяешь модель. Данные перемешаны.
Метрика логлосс. Рез выложи. Трен =...   тест=...

С тайм серией конечно такое не делается. Но для интереса запихнул в практически дефолтный LightGBM не трогая данные вообще:

Train:  0.6879388421499111 

Test:  0.6915181677127092


Исходники Тестирования, бонусом еще и с CatBoost:

https://yadi.sk/d/55DDn-hViNWP6Q


А у тебя какие результаты?

test_xz.ipynb
test_xz.ipynb
  • disk.yandex.ru
Посмотреть и скачать с Яндекс.Диска
 
Maxim Dmitrievsky:

с метриками зачем заморачиваться, когда для ТС они свои? например, профит фактор замеряй на выборках и все

а внутренние оценки модели получаются вторичные, потому что наименьшая ошибка не означает наибольшую устойчивость на новых данных

просто выбери внешний критерий оценки через производительность торговли на новых данных

но пока у тебя не будет большой  выборки для теста то будешь облизывать болт.. а маленькая выборка для трейна это не критично, тут все норм

Для теста, вообще, должен быть неограниченный простор.

Если кто то хочет проверить качество своих данных, то их нужно выставлять не в виде каких то мутных CSV файлов, а в виде индикаторов.

Можно с шаблоном, хотя целевые можно и не размечать, и так ясно, что должен быть профит.

Вот тогда можно будет обучать любую модель, делать советник и объективно тестить его вместе с исходным индикатором.

Ну это если есть желание что то делать, а если просто поговорить...

 
toxic:

Чем больше шума, тем больше сэмплов, это должно быть понятно на уровне элементарной статистики, а рыночные данные очень шумные, переобучение это другой вопрос, если учить правильно построенным фичам и правильным таргетам то на тесте в десятки-сотни тысяч сэмплов, переобучения на самом деле трудно достичь. Тем и хороши большие датасеты, что их сложно переобучить, ну разумеется если датасаентист или алготрейдер не мазахисты или околорыночники и не смиксовали таргеты с фичами. Очевидный повод для беспокойства — фича коррелирует с таргетом более чем 3-5%, значит наверняка подглядывет, а лучше строить фичи так чтобы не было такой возможности в принципе, это немного усложнит алгоритмы, но избавит от наверно главной ошибки начинающих алготрейдеров.

Вы тут все ругаете околорыночников, я такой, а сами то, видно крутой, рыночный алготрейдер и судя по постам знаете на каком периоде учить, а на каком торговать.

А я не знаю и когда увидел вчера обсуждение, не стал ввязываться, а решил просто попробовать - обучил демо на EURUSD M1 с 8 по 18 октября, сколько было у попавшегося брокера и запустил советника в реалтайм.

И вот он торгует пока в прибыль, а вам, как эксперту, вопрос - когда он начнет сливать, логин - 2096584180, пароль - na3tbvr, Tradize-Demo, только конкретно, не про космические корабли, которые бороздят просторы большого театра(с))


 
toxic:

Обучающая выборка - мизерная, логика работы тестера и оптимизатора не прозрачна(черный ящик)... 

Вывод - 99.999999999% что этот советник рандомный, эквити - случайное геометрическое блуждание со скосом вниз за счет торговых издержек.

В зависимости от частоты сделок могу только ванговать отрицательный SR<-0.5 за год 

1. есть реалтайм торговля, тестер МТ4, нейросеть.

2. ответ 100% не правильный - советник не рендомный.

3. обучен за 8 дней торговых данных, а прогноз на год...?:)


ЗЫ: я же просил конкретно, например - соотношение периода торговли к периоду обучения до 30% и советник послезавтра начнет сливать, или 10% - сегодня, но раз наука молчит...

 
toxic:

Вывод - 99.999999999% что этот советник рандомный, эквити - случайное геометрическое блуждание со скосом вниз за счет торговых издержек.

хм, а это моя картинка, там то чего можно узреть?

;)

 
toxic:

рандомный я Вам говорю

Я бы тоже сказал, что этого не может быть потому, что не может быть никогда. (с) И обучить на 50-ти сделках нереально, но надо еще 30-40 сделок посмотреть (это дня 3-4), чтобы выводы делать. Если их увидим, конечно.

Но, вообще, уже странно это.

 
toxic:

рандомный я Вам говорю

вот его прогон в тестере - и это по вашему рандом?

Файлы:
 
toxic:

Это хоть форвард?

Демонсрировать бэквард просто неприлично, кроме того что бессмысленно, но повторюсь, у меня нет алгоритма тестера и оптимизатора и значимость их для меня соответственно сомнительная, особенно в случае активной торговли. не говоря уже об ХФТ, там вообще скажем так "стандартные методы" не работают.

Я же писал выше, что данных всего с 8 по 19 октября есть - обучение по 18-е и вот второй день уже форвард идет, прямо в реалтайм.

 
toxic:

ничего

хм, а ответ то правильный!

действительно там ничего нет, это бонусный счет на котором панель для ручной торговли с мартингейлом и выставлением безубытка тестировал, ... тестировал по принципу все или ничего - контртренд с усреднением по мартингейлц без стоплосссов ))))

Причина обращения: