Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2843

 
Aleksey Nikolayev #:

Простой отказ от глобального экстремума, очевидно, не даст возможности избежать переобучения (переподгонки, overfitting). Переобучение заключается в слишком большой приспособленности модели к данной конкретной выборке, в ущерб существующей закономерности. Происходит это вследствие крайне высокой гибкости практически всех алгоритмов МО. Поэтому стандартный способ борьбы с ней - введение штрафа за излишнюю гибкость модели в критерий оптимизации (регрессия лассо, как пример). Можно просто директивно ограничить гибкость модели, но по математической сути - это просто более жёсткий штраф.

Это, кстати, хороший пример того, почему должна быть возможность создания кастомных критериев.

Предпочтение глобальному экстремуму в пользу плато - это немного другое. Здесь уже речь не об излишней подгонке к конкретной выборке в ущерб существующей и неизменной зависимости. Здесь речь о том, что вследствие нестационарности цен (о чём вы и писали поначалу) зависимость меняется и нужно искать устойчивые (робастные) значения параметров, которые останутся достаточно хорошими и при небольших изменениях зависимости.

Не надо всё смешивать в одну кучу.

Выбор штанов - пример многокритериальной оптимизации - выбор происходит по длине, размеру, цвету, ткани, цене, бренду и тд) Понятно, что поверхность Парето не строится, а происходит неявное смешивание в голове покупателя всех критериев в один компромиссный. То же самое происходит и с выбором признаков. Важное отличие от штанов в том, что здесь будет полезной явная формализация компромиссного критерия оптимальности, поскольку постоянная опора на интуицию будет приводить к непредсказуемым сбоям.

Приятно видеть пост человека в теме!

 
Andrey Dik #:

если модель рабочая, то у неё существуют настройки, при которых она работает хорошо и на не известных данных. у неё так же скорее всего есть настройки не дающие удовлетворительной работы на oos - такой случай некоторые называют переобученностью. на самом деле не верно выбран критерий оценки. правильные критерии дадут фиолетовую кривую у рабочей модели. задача сводиться к максимизации (глобальный максимум) правильного оценочного критерия. другими словами, если найти глобальный максимум правильного критерия. то получим фиолетовую кривую.

и наоборот, если критерий выбран не правильно, то макимизация такого неправильного критерия даст красную кривую.

и это при условии, что модель рабочая, но видим, на сколько важен критерий оценки.

но если и модель не рабочая, то уже ничего не поможет, ни критерий ни оптимизация.

итак, модель->критерий->оптимизация критерия

различаю два вида критериев, интегральные и производные.

примеры интегральных критериев: баланс, профит фактор и другие. эти критерии делают суммарную оценку не учитывая результаты промежуточных событий процесса (в торговле это сделки). к примеру, два результата с одинаковым итоговым балансом 10000, в одном случае 1000 прибыльных сделок, а в другом случае 999 убыточных и 1 прибыльная. очевидно, что хоть и интегральный критерий одинаковый в обоих случаях но координально отличается путь, которым достигнут результат. поэтому на интегральные критерии часто жалуются, что получено переобучение, рынок не стационарен и прочее не имеющее отношение к реальным причинам неудовлетворительных результатов на oos.

пример производного критерия - среднеквадратичное отклонение от прямой баланса, которая проходит от начальной точки до конечной. подобные критерии, в отличии от интегральных, учитываются промежуточные результаты процесса. это позволяет однозначно описывать требования в критерии. 

интегральные критерии тоже могут иметь право быть, поскольку применими для некоторых типов систем (к примеру, где количество сделок в единицу времени практически константа).

но, и для интегральных и для производных критериев должен быть достигнут глобальный оптимум. выбор критериев определяет робастность системы в будущем.

если у исследователя возникает мысль, что может быть надо искать не глобальный максимум, а что то посередине, то в этом случае нужно тут же пересмотреть критерии оценки модели.

 
У меня вопрос:
Зачем цытировать чей то огромный текст на пол страницы чтобы написать своих два слова???? 
Не пойму этих людей никогда.. 
 
практически всегда интегральные оценки не применимы к сетям из за большой вариабельности сетей. так, применение интегрального критерия Баланс в нейросетях заведомо приведет плохим результам. хоть оптимизируй хоть нет, все равно получишь нет. но, люди по прежнему винят оптимизацию...
 
Andrey Dik #:
практически всегда интегральные оценки не применимы к сетям из за большой вариабельности сетей. так, применение интегрального критерия Баланс в нейросетях заведомо приведет плохим результам. хоть оптимизируй хоть нет, все равно получишь нет. но, люди по прежнему винят оптимизацию...

ИМХО, основой должна быть максимизация прибыли, но с добавкой штрафов за "неприличное поведение" различных сортов. В любом случае, единого мнения здесь нет и быть не может, поэтому важно чтобы платформа предоставляла достаточно широкие возможности для настройки и кастомизации.

 
Aleksey Nikolayev #:

ИМХО, основой должна быть максимизация прибыли, но с добавкой штрафов за "неприличное поведение" различных сортов. В любом случае, единого мнения здесь нет и быть не может, поэтому важно чтобы платформа предоставляла достаточно широкие возможности для настройки и кастомизации.

конечно. это и есть производный критерий. то есть важно не итоговая макс прибыль сама по себе, а то, каким образом достигнута макс прибыль. таким образом это все равно так же поиска глобала и не надо этого стесняться. тогда упрощенно функцию можно записать так:

f = a*B.

где B итоговый баланс, a - критерий оценки достижения максимального баланса.

кстати, есть варианты построения и динамических производных критериев. для примера - использовать максимальное количество сделок достигнутое на текущей итерации оптимизации и пересчитывать критерий оценки.
 
Aleksey Nikolayev #:

ИМХО, основой должна быть максимизация прибыли, но с добавкой штрафов за "неприличное поведение" различных сортов. В любом случае, единого мнения здесь нет и быть не может, поэтому важно чтобы платформа предоставляла достаточно широкие возможности для настройки и кастомизации.

Ещё не помешала бы штатная возможность для оптимизации гиперпараметров (весов для штрафных добавок к критерию, например). Как пример - optuna в питоне.

 
Andrey Dik #:


f = a*B.

Andrey Dik #:


f = a*B.


Кстати о птичках.

Нет на финансовых рынках любых формул со знаком равенства, т.е.

нет формул

у  = х

По которым, если х=2, то и у=2.

Это детерминированное мышление.

Есть формулы:

у ~ х

по которым, если х =2, то у = 2 в канале некоторого доверительно интервала. А для нестационарных рынков даже доверительного интервала нет, потому как дисперсия переменная, и даже не переменная, а чёрти что.

Это стохастическое мышление.

 
СанСаныч Фоменко #:

Кстати о птичках.

Нет на финансовых рынках любых формул со знаком равенства..



робастность системы не зависит от правил финансовой записи формул. или зависит? :О
 
СанСаныч Фоменко #:

Кстати о птичках.

Нет на финансовых рынках любых формул со знаком равенства, т.е.

нет формул

у  = х

По которым, если х=2, то и у=2.

Это детерминированное мышление.

Есть формулы:

у ~ х

по которым, если х =2, то у = 2 в канале некоторого доверительно интервала. А для нестационарных рынков даже доверительного интервала нет, потому как дисперсия переменная, и даже не переменная, а чёрти что.

Это стохастическое мышление.

оппа!

нормуль 

Причина обращения: