Будет ли хорошая стратегия работать на случайно сгенерированных данных? - страница 8

 
Aleksey Vyazmikin #:

Я не утверждал, что это правило. Банальности не будем же обсуждать...

Да, имеете право на такое мнение.

Я не использую в торговле тики, поэтому для меня это вполне хороший вариант.

Для форекса совсем в этом нет смысла. А для биржи - нужно собрать очень много данных с записью стакана, что бы думать вообще о попытке эмитировать его поведение. Опять же, если торговля не использует тики внутри минутного бара, то это лишнее. У меня нет фантазий про тики, сколько бы я их не смотрел. Когда торгуешь руками, появляется чувство ритма, но его запрограммировать не знаю как.

Что не так с оптимизацией? Не понятно. Целью оптимизации тут показать, что стратегии могут работать случайно.

Интересует больше меня вопрос, как определить случайность от не случайности с помощью статистики.

по поводу тиков, используешь ты их или нет, в реальности они формируют бар. Физически реальные бары из них состоят и правильно свои эмулированные бары тоже строить из тиков. Если тики не нужны, их можно просто не сохранять, достаточно минимального сформированного бара.

с оптимизацией всё не так. Оптимизация не показывает работают или могут работать или будут работать стратегии.

 
Maxim Kuznetsov #:

по поводу тиков, используешь ты их или нет, в реальности они формируют бар. Физически реальные бары из них состоят и правильно свои эмулированные бары тоже строить из тиков. Если тики не нужны, их можно просто не сохранять, достаточно минимального сформированного бара.

Не могу согласится с данным утверждением. Это не влияет на правдоподобность баров, а значит нужды нет.

Maxim Kuznetsov #:
с оптимизацией всё не так. Оптимизация не показывает работают или могут работать или будут работать стратегии.

Понятно.

Любят же на форуме беспредметно месить в ступе...

 

К сожалению, обнаружилось, что  выборки для построения моделей были не совсем корректными для GBPUSD и Random_01 - чаще чем раз в час были сняты показатели в среднем.

Поэтому пришлось всё переделать, я обучился на 3х вариантов комбинаций выборок

  1. EURUSD_Random_01
  2. GBPUSD_Random_01
  3. EURUSD_GBPUSD

Использовалось 13 разных поднаборов предикторов, в результате получил такие показатели Accuracy на выборке exam для них при создании модели сseed=0.

Как видно из таблицы, рандомные примеры баров хорошо выделяются предикторами. А вот отделить пары EURUSD и GBPUSD не удаётся столь же хорошо - лучший показатель 0,68. Жёлтым цветом я выделил заинтересовавашие меня наборы - посмотрим значимость первых 25 предикторов в этих моделях.

Для Test_CB_Setup_0_000000006 - Исключили всё, кроме осцилляторов, за исключением ATR и Volume + iVIDyA, iBWMFI, iChaikin

Удивительно, но осцилляторы всё же показали не плохой результат, что говорит, как я думаю, о том, что есть зависимость в развитии последовательностей временных рядов. Особенно важны оказались показатели стандартного отклонения, индикатор "Average Directional Movement Index by Welles Wilder", MACD и "Triple Exponential Moving Averages Oscillator".

Для Test_CB_Setup_0_000000010 - Только предикторы на базе MA

Неожиданно для меня на предикторах от скользящих средних удалось получить неплохой результат. Особенно обращает на себя внимание значимость предикторов на TF H4.

Идеи и мнения приветствуются по результатам эксперимента.

 
Aleksey Vyazmikin #:

К сожалению, обнаружилось, что  выборки для построения моделей были не совсем корректными ...

Поэтому пришлось всё переделать, я обучился на 3х вариантов комбинаций выборок

  1. EURUSD_Random_01
  2. GBPUSD_Random_01
  3. EURUSD_GBPUSD

.......

Идеи и мнения приветствуются по результатам эксперимента.

Мое мнение:

1. случайно сгенерированные данные ничего общего с реальными данными не имеют, поэтому опираться на результаты по этим данным  -  не следует...

2. но применять такие методы для подтверждения факта отсутствия  "подгонки под историю"  -  вполне возможно...

 
Serqey Nikitin #:

Мое мнение:

1. случайно сгенерированные данные ничего общего с реальными данными не имеют, поэтому опираться на результаты по этим данным  -  не следует...

2. но применять такие методы для подтверждения факта отсутствия  "подгонки под историю"  -  вполне возможно...

1. Это не может быть так, многие характеристики схожи, иначе модели не нужно было бы столько предикторов для отделения одного от другого. Напротив, есть особенности, отличающие чарт от случайной генерации. Думаю, как уменьшить эти особенности и усложнить детекцию для модели, это должно означать улучшение правдоподобия.

2. Т.е. полагаете, что нужно исключить те закономерности, которые дают выигрыш на настоящем и сгенерированном чарте?

В машинном обучении есть такое направление, как аугментация данных, которое направлено на генерацию похожих данных для улучшения обучения модели. Т.е. встаёт вопрос правдоподобности генерируемых данных, уменьшения случайности так сказать. Такие временные ряды, в теории, должны быть правдоподобны, а значит достойными для проверки стратегий. Или нет?

Между двумя валютными парами находится так же достаточно много отличий, значит ли это, что хорошая стратегия должна работать только на одном инструменте?

 
Aleksey Vyazmikin #:

1. Это не может быть так, многие характеристики схожи, иначе модели не нужно было бы столько предикторов для отделения одного от другого. Напротив, есть особенности, отличающие чарт от случайной генерации. Думаю, как уменьшить эти особенности и усложнить детекцию для модели, это должно означать улучшение правдоподобия.

2. Т.е. полагаете, что нужно исключить те закономерности, которые дают выигрыш на настоящем и сгенерированном чарте?


Между двумя валютными парами находится так же достаточно много отличий, значит ли это, что хорошая стратегия должна работать только на одном инструменте?

Вы же ищите закономерности?...

На случайных данных выявить закономерности можно, но сомнительно...

Правильное решение - выявлять закономерности на РЕАЛЬНЫХ данных..., а вот проверять их можно как угодно...

 
Serqey Nikitin #:

Вы же ищите закономерности?...

На случайных данных выявить закономерности можно, но сомнительно...

Правильное решение - выявлять закономерности на РЕАЛЬНЫХ данных..., а вот проверять их можно как угодно...

Что для Вас закономерность? Какие у неё критерии для оценки?

К примеру, я использую понятие "смещение вероятности" это когда посчитали метки, допустим, двух классов (к примеру, правильный вход в рынок "1", не правильный вход "0") на большом интервале данных, получили вероятность класса "1" 51%, а потом ищем условие, которое сместит эту вероятность в большую сторону, допустим до 60%. Смещение вероятности тогда считается 60%-51% = 9% вот такое смещение я признаю значимым (вообще от 5% рассматриваю) и если оно наблюдается на протяжении всей истории (с допустимыми отклонениями), то это я склонен назвать кандидатом в закономерность.

 
Maxim Kuznetsov #:
open=close это не правило

А Вы правы оказались, действительно, очень значимый нюанс оказался для моих предикторов - они оказывается словили этот момент и почти всю модель на этой идеи построили.

Извиняюсь, был не прав, надо добавлять гэп с некой вероятностью.

 
Aleksey Vyazmikin #:

А Вы правы оказались, действительно, очень значимый нюанс оказался для моих предикторов - они оказывается словили этот момент и почти всю модель на этой идеи построили.

Извиняюсь, был не прав, надо добавлять гэп с некой вероятностью.

Хотя, построил гистограмму, и получается в районе 90% всё же нет гэпа... тогда не понял уже я, про свои предикторы...

Хотя на второй так не видно... пересчитал - 45% не имеет гэпа с 2006 по 2024 года на EURUSD, значит правы предикторы типа Vol_OHLC_V9_M1_S1

Видели ли Вы раньше подобный метод расчет и построения гистограмм, как процентная - последняя, или мне автором себя считать? :))

 

Новый вариант генерации (02) учитывает геп свечи при её копировании из исторического распределения, а так же теперь учёл часовую волатильность.