Что такое функция потерь, минимизируемая при обучении модели? - Общее обсуждение

mytarmailS 2023.04.26 08:22 #30471

Интересная статья про РЛ. https://habr.com/ru/articles/349800/

Также интересная беседа в кометариях, создателя ЭТОЙ ветки с другим учасником

Aleksey Nikolayev 2023.04.26 09:32 #30472

mytarmailS #:
Интересная статья про РЛ. https://habr.com/ru/articles/349800/

Также интересная беседа в кометариях, создателя ЭТОЙ ветки с другим учасником

Не избыточна ли концепция RL для задач трейдинга? Влияние среды на агента у нас есть, но есть ли влияние агента на среду? Наверно, можно это второе влияние ввести искусственно, но есть ли в этом смысл?

Две (или три) идеи из стать совсем не лишни для нас - это что функция потерь должна отражать именно то, что нам нужно и должна быть гладкой (и монотонной). В нашем случае это должна быть прибыль и она должна зависеть гладко и монотонно от параметров модели.

Гладкости некоего аналога прибыли, наверно, можно как-то достичь (например, чем-то вроде ядерного сглаживания). Но насчёт монотонности сильно сомневаюсь.

Интерполяция, аппроксимация и иже Диверсификация Fibonacci_Ema

СанСаныч Фоменко 2023.04.26 09:50 #30473

Aleksey Nikolayev #:

Не избыточна ли концепция RL для задач трейдинга? Влияние среды на агента у нас есть, но есть ли влияние агента на среду? Наверно, можно это второе влияние ввести искусственно, но есть ли в этом смысл?

Две (или три) идеи из стать совсем не лишни для нас - это что функция потерь должна отражать именно то, что нам нужно и должна быть гладкой (и монотонной). В нашем случае это должна быть прибыль и она должна зависеть гладко и монотонно от параметров модели.

Гладкости некоего аналога прибыли, наверно, можно как-то достичь (например, чем-то вроде ядерного сглаживания). Но насчёт монотонности сильно сомневаюсь.

Базой финансового результата трейдинга является движение цены - нестационарный случайный процесс.

За счет неких ухищрений пытаемся превратить нестационарный случайный процесс в гладкий да еще монотонный? Может широко шагаем? Особенно если учесть, что ошибку классификации менее 20%(!) вне набора обучения добиться крайне сложно. Может для начала поработать над уменьшением ошибки классификации?

Советники: Эксперт на случайных Индикаторы: Экстраполяция цен методом Обсуждение статьи "Сравнительный анализ

СанСаныч Фоменко 2023.04.26 10:08 #30474

Полистал статью.

Какой нам прок о этой статьи?

Для совершенно сомнителен.

И причина в следующем.

Сейчас не могу вспомнить какие-либо публикации по ИИ (МО) которые бы ПРЕДСКАЗЫВАЛИ будущее. Вот учат модель рукописным буквам. Потом пытаются распознать эти рукописные буквы. Но модель В ПРИНЦИПЕ не учат предсказанию того, какая буква будет написана следующей.

В этом вся наша проблема.

Мы же пытаемся с помощью МО (та же работа, что и со свечным комбинациями) найти некие паттерны в предикторах, которые дадут правильной предсказание. Но нет никакой гарантии, что найденные паттерны будут давать правильные предсказания в будущем. "Правильные" паттерны будут давать ошибку, а "неправильные" предсказывать нужное. Причина кроется в самих алгоритмах классификации, которые дают ВЕРОЯТНОСТЬ класса, а не его значение. Мы же используем самую примитивную регуляризацию в 0.5 для деления на классы. А если при обучении вероятность "правильного" паттерна = 0.5000001, то почему такую вероятность принимаем за значение класса?

Чтобы уйти от этого начинаем городить огород, но значения предикторов, среди которых ищем паттерны, сами либо НЕ стационарны, либо псевдо стационарны, имеют отдаленное отношение к цене.!

Bayesian regression - Делал Обсуждение статьи "Случайные леса Интерполяция, аппроксимация и иже

mytarmailS 2023.04.26 10:10 #30475

Aleksey Nikolayev #:

Влияние среды на агента у нас есть, но есть ли влияние агента на среду? Наверно, можно это второе влияние ввести искусственно, но есть ли в этом смысл?

все зависит от поставленой задачи.

Если прогнозировать готовый таргет как это делает подавляющее большиство , то мы никак не влияем на среду , да и самого РЛ там не надо..

А если например задача управления позицией, стопами , тейками ..

Те управление активом это среда , которой мы (агент) как раз таки и упрвляет..

Агент решает поставить ордер или не поставить и

по какой цене ,

и когда снять или переставить ,

а что он будет делать когда текущий убыток по текущей позиции перевалит за n пунктов,

а что он будет делать если получил 5 убытков подряд..

Те понимаете , это совсем другой уровень задачи, с кучей состояний (выходов) , а не примитийный вверх/вниз на классификации

Если еще проще - мы не пожем управлять рынком , но мы можем управлять позицией и риском, ведь можем же!

Aleksey Nikolayev #:

Гладкости некоего аналога прибыли, наверно, можно как-то достичь (например, чем-то вроде ядерного сглаживания). Но насчёт монотонности сильно сомневаюсь.

не сильно понимаю что вкладываеться в "гладкость" и зачам она "гладкость" нужна..

Может тут можно применить многокритеальную оптимизацию для поиска

MT5 - шаг назад??? Советники: Копирование сделок с Можно ли поставить стоп-лосс

Valeriy Yastremskiy 2023.04.26 14:16 #30476

mytarmailS #:

все зависит от поставленой задачи.

Если прогнозировать готовый таргет как это делает подавляющее большиство , то мы никак не влияем на среду , да и самого РЛ там не надо..

А если например задача управления позицией, стопами , тейками ..

Те управление активом это среда , которой мы (агент) как раз таки и упрвляет..

Агент решает поставить ордер или не поставить и

по какой цене ,

и когда снять или переставить ,

а что он будет делать когда текущий убыток по текущей позиции перевалит за n пунктов,

а что он будет делать если получил 5 убытков подряд..

Те понимаете , это совсем другой уровень задачи, с кучей состояний (выходов) , а не примитийный вверх/вниз на классификации

Если еще проще - мы не пожем управлять рынком , но мы можем управлять позицией и риском, ведь можем же!

не сильно понимаю что вкладываеться в "гладкость" и зачам она "гладкость" нужна..

Может тут можно применить многокритеальную оптимизацию для поиска

Можно агента усреднить.

Maxim Dmitrievsky 2023.04.26 14:19 #30477

Valeriy Yastremskiy #:
Можно агента усреднить.

https://www.mql5.com/ru/code/22915

Aleksey Nikolayev 2023.04.26 17:56 #30478

СанСаныч Фоменко #:

Базой финансового результата трейдинга является движение цены - нестационарный случайный процесс.

За счет неких ухищрений пытаемся превратить нестационарный случайный процесс в гладкий да еще монотонный? Может широко шагаем? Особенно если учесть, что ошибку классификации менее 20%(!) вне набора обучения добиться крайне сложно. Может для начала поработать над уменьшением ошибки классификации?

Речь была о свойствах функции потерь, минимизируемой при обучении модели. Точнее говоря, об её идеальном виде.

Aleksey Nikolayev 2023.04.26 17:58 #30479

mytarmailS #:

не сильно понимаю что вкладываеться в "гладкость" и зачам она "гладкость" нужна..

Это же азы оптимизации. Гладкость даёт возможность оптимизировать посредством градиента. В противном случае, остаются только переборные алгоритмы.

mytarmailS 2023.04.26 18:11 #30480

Aleksey Nikolayev #:

Это же азы оптимизации

да это я знаю , но тут совсем недавно говорили про гладкость самой кривой капитала , я особо не вникал в ети разговоры потому и переспрашиваю о чем вы

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3048