В догонку - страница 27

 
Candid >>: часто начинает проходить не только боязнь нечаянно выдать кому-то свой будущий грааль, но и надежда найти его вообще :).

Надежда еще не ушла. Вот как раз в последнее время пытаюсь добить тему о тараканах, пока зачахшую на Необитаемом пару месяцев назад. Воды много утекло, идея существенно изменилась в попытке уйти от неразумной параметризации, которая тебя так пугала. Точнее, исходная-то идея осталась прежней, тривиальной, но появилась ее "обвязка" в виде мультивалютности, а сделать ее технически не так просто - из-за необходимости синхронизации данных. Но, надеюсь, с этими проблемами я справлюсь.

А идея твоя хороша, очень хороша. Надо обмозговать, чтобы задать пару заковыристых вопросов.

 
Candid писал(а) >>

Нет, здесь именно реалтаймовые входы, заданные до всякой параметризации. Именно это и было предметом разногласий. Почитай ещё раз :). Вообще я сейчас просто вернулся к тому, на чём остановился год с гаком назад. Уверяю тебя, ты уже тогда был в курсе моего подхода :) . Кстати, и именно этот вопрос задавал кажется :).

Ну раз два параметра, конечно поверхность будет. А профит просто берётся средний по заданному числу ближайших точек.

Ну хорошо, пусть реалтаймовые входы. Но ты же не от фонаря входил ? Ведь был же какой-то источник принятия решений ? Вот он и задал неявно алгоритм определения точек фазового пространства, по которым далее оценивается разделение его на контексты. Тут все-таки есть еще недопонимание между нами. Я утверждаю, что точки принятия торговых решений должны быть заданы заранее (что у тебя и было сделано последовательностью сделок). А параметризация фазового пространства ищется потом и независимо от этого исходя из требования кластеризации изображающих сделки точек. (Относительно применения НС в этом подходе ты был абсолютно прав - напрашивается само собой, особенно при большем чем 2 числе параметров.) Именно эта программа и реализована. Поздравляю, интересный результат !

Про поверхность не вполне понял. Т.е. ты реально усреднял ее по некоторой локальной области ? У тебя для этого была достаточная плотность сделок ? Что значит ближайших ?

 
Candid писал(а) >>

Вот иллюстрация к "моему" подходу. Берём множество входов, считаем для каждого входа значения неких двух параметров (учитывающих контекст). Получаем двумерное фазовое пространство (ФП). Точнее сечение фазового пространства плоскостью, поскольку добавление новых параметров состояния увеличит его размерность но не потребует пересчёта уже рассчитанных. Это как раз преимущество подхода с фиксированными входами. Теперь на этой плоскости строим грубую оценку зависимости профита от параметров, что в некотором смысле родственно восстановлению плотности верояностей. Получаем сооблазнительную картинку

Здесь синие точки - это входы, они расположены в нулевой плоскости, то есть там где они ныряют под поверхность оценка профита становится положительной. Теперь посмотрим на это дело сверху

Мы совершенно чётко видим области, сулящие нам положительное МО прибыли (то есть области, где точки скрыты поверхностью). В данном двумерном случае мы можем нарисовать их границу буквально вручную. Для больших размерностей фазового пространства без математики обойтись уже не удастся.

Остаётся вопрос - подгонка это или нет? Фиг его знает :). ИМХО, всё зависит от параметров. Вот эти конкретные мне не нравятся, они по моему мнению недостаточно инвариантные. К тому же я не уверен в корректности оценки вероятного профита, она весьма примитивна.

P.S. Если кто не понял - это приманка для подходящих "новичков" :) .

это не подгонка, а статистика которая требует доп.исследований которые могут отбраковать данную параметризацию, или увеличить шансы что она верная.

По сути это определение ширины оптимальной зоны, только для 2х параметров одновременно. Чем шире оптимальная зона (для 2х мерного случая вернее площадь), тем лучше. Но лучше сразу строить зависимость не от профита, а от более комплексного показателя, который учитывает еще и гладкость эквити - например ПФ. Тогда правда нужно вводить еще и дополнительное условие достоверности - учитывать параметры при которых число сделок не менее 100 например.

Далее можно дополнительно исследовать оптимальную зону. Хорошим показателем является последовательное улучшение системы с т.з. доход/риск при ужесточении параметров фильтра. Если взяли за основу оценки ПФ, то он должен увеличиваться, но одновременно уменьшается кол-во сделок. Фактически получается, что происходит последовательная выборка части сделок. Т.е. при слабой фильтрации сделок например 1000, усиливая фильтрацию (изменяя параметр) из них остается все меньше, но ПФ по ним увеличивается. Это является важным статистическим показателем что фильтр рабочий и действительно выделяет контекст. Если параметров более одного, то каждый должен обладать таким свойством. Хотя если они логически единое целое, то необязательно. имха

В конечном итоге выберутся конкретные параметры фильтров, как компромис между высоким ПФ и общей прибылью (фактически кол-вом сделок). Но работоспособность системы можно отслеживать в этом случае и по эквити с менее жестким параметрами фильтрации. Это будет опережающим показателем т.к. сделок будет гораздо больше.

 
Candid >>:

Мы совершенно чётко видим области, сулящие нам положительное МО прибыли (то есть области, где точки скрыты поверхностью). В данном двумерном случае мы можем нарисовать их границу буквально вручную. Для больших размерностей фазового пространства без математики обойтись уже не удастся.

Остаётся вопрос - подгонка это или нет? Фиг его знает :). ИМХО, всё зависит от параметров. Вот эти конкретные мне не нравятся, они по моему мнению недостаточно инвариантные. К тому же я не уверен в корректности оценки вероятного профита, она весьма примитивна.


Это не подгонка. Хотя, фиг его знает, что под подгонкой понимать.


Идея картирования результатов - это хорошая идея, и это инструмент анализа. К сожалению (а может и наоборот) мало распространённый. Следующий шаг, выделение устойчивых областей профита и лосса, и отслеживание этих областей во времени. Если такие области находятся, и они устойчивы как в пространстве (изменения параметров) так и во времени - смело берётся центр области - и алга! ;) Понятно, что на практике есть кое какие тонкости - но общая идея именно такова.

 
Yurixx >>:

Ну хорошо, пусть реалтаймовые входы. Но ты же не от фонаря входил ? Ведь был же какой-то источник принятия решений ? Вот он и задал неявно алгоритм определения точек фазового пространства, по которым далее оценивается разделение его на контексты.

Почему же неявно, вполне явно. Собственно это и есть основная задача алгоритма. Я точно так же, в реалтайме, считаю значения параметров, просто они не имеют никакого отношения к выбору точек входа и выхода. Потом, после определения контекстного фильтра, по этим параметрам можно будет запрещать или разрешать сделку. А вот двигать точки входа и выхода будет нельзя.

Тут все-таки есть еще недопонимание между нами. Я утверждаю, что точки принятия торговых решений должны быть заданы заранее

Да, но ты утверждал что это должны быть идеальные входы. Я всё время пытался тебе объяснить что это и есть самое слабое место твоего видения. По той причине, что сделав свою работу и пытаясь потом найти свои входы и выходы в реалтайме ты попадёшь туда, откуда я начинаю. Я никогда не утверждал что у нас всё наоборот :).

А параметризация фазового пространства ищется потом и независимо от этого исходя из требования кластеризации изображающих сделки точек.

Ты ничего не попутал? Вроде до сих мы параметризовали ценовый ряд и эти-то параметры и образовывали фазовое пространство.

Про поверхность не вполне понял. Т.е. ты реально усреднял ее по некоторой локальной области ? У тебя для этого была достаточная плотность сделок ? Что значит ближайших ?

Хм, как бы ещё сказать. Каждая синяя точка это сделка, у неё в этой фазовой плоскости есть координаты, (Xi, Yi). Для каждой точки фазовой плоскости (X,Y) мы можем рассчитать расстояние до каждой синей точки, например по Евклиду: (X-Xi)^2+(Y-Yi)^2. У каждой синей точки есть профит, положительный или отрицательный. Нас интересуют, скажем, 10 ближайших к X и Y синих точек. Усредняем их профит и получаем координату поверхности Z для каждой точки (X,Y). То есть задаётся не радиус усреднения, а число учитываемых соседей, радиус усреднения может оказаться любым.

Я, кстати, уже сделал вариант взвешенного гауссом суммирования, ещё бы понять, из каких соображений сигму нормировать :). Впрочем, в густозаселённых областях результаты вполне похожи.


P.S. Ещё раз: мои сделки не просто имеют неидеальный профит, ничто не запрещает части из них быть убыточными.

 
Avals >>:

... Но лучше сразу строить зависимость не от профита, а от более комплексного показателя, который учитывает еще и гладкость эквити - например ПФ. Тогда правда нужно вводить еще и дополнительное условие достоверности - учитывать параметры при которых число сделок не менее 100 например.

В принципе я делал, как вариант, усреднение не профита, а знака профита (+1 или -1). Это пожалуй можно считать неким локальным ПФ. Но в общем величина профита при жёстком задании входов и выходов тоже является функцией контекста, поэтому нынешний вариант кажется мне предпочтительнее. А вот число точек, по которым делалось усреднение, для приведенных картинок составляло ровно 100 :).

Для контроля качества эквити я сейчас смотрю на отношение максимального профита к максимальной просадке и на параметры линейной регрессии по эквити (наклон и СКО).

ПФ пожалуй может оказаться полезен для исследования оптимальной зоны.

В конечном итоге выберутся конкретные параметры фильтров, как компромис между высоким ПФ и общей прибылью (фактически кол-вом сделок). Но работоспособность системы можно отслеживать в этом случае и по эквити с менее жестким параметрами фильтрации. Это будет опережающим показателем т.к. сделок будет гораздо больше.

Любопытный приём. Я считаю уменьшение статистики сделок при ужесточении фильтра серьёзной проблемой.

HideYourRichess >>:

... выделение устойчивых областей профита и лосса, и отслеживание этих областей во времени. Если такие области находятся, и они устойчивы как в пространстве (изменения параметров) так и во времени - смело берётся центр области - и алга! ;)

Примерно так и я вижу, только уточню, что под перемещением в пространстве нужно подразумевать изменение параметров задающего сделки алгоритма, а не параметров состояния. То есть это скорее подстройка стратегии под контекст. Тоже скользкая дорожка, идти можно, но тщательно контролируя корректность действий, имхо.

 
Candid >>:

Примерно так и я вижу, только уточню, что под перемещением в пространстве нужно подразумевать изменение параметров задающего сделки алгоритма, а не параметров состояния. То есть это скорее подстройка стратегии под контекст. Тоже скользкая дорожка, идти можно, но тщательно контролируя корректность действий, имхо.

Подозреваю, что не понимаю и половины той терминологии, в которой написано. По этому, не могу сказать ни да, ни нет. Могу только сказать, что то о чем вел речь я не имеет отношения к подстройке стратегии под контекст (чем бы этот контекст не был).

 
HideYourRichess >>:

Подозреваю, что не понимаю и половины той терминологии, в которой написано. По этому, не могу сказать ни да, ни нет. Могу только сказать, что то о чем вел речь я не имеет отношения к подстройке стратегии под контекст (чем бы этот контекст не был).

Тогда это меня занесло. Видимо вы имели в виду что со временем деформация поверхности может привести к смещению оптимальной зоны.

 
Candid писал(а) >>

Почему же неявно, вполне явно. Собственно это и есть основная задача алгоритма. Я точно так же, в реалтайме, считаю значения параметров, просто они не имеют никакого отношения к выбору точек входа и выхода. Потом, после определения контекстного фильтра, по этим параметрам можно будет запрещать или разрешать сделку. А вот двигать точки входа и выхода будет нельзя.

Ну так об этом же и я говорю. На этапе построения контекстов параметры и не должны иметь отношение к точкам входа-выхода. Однако, когда кластеризация выполнена, то эти значения могут уже играть роль фильтра входов-выходов. А о том, чтобы двигать их речи вообще не было. Тем более в твоем случае, когда эти точки берутся за основу кластеризации.

Candid писал(а) >>

Да, но ты утверждал что это должны быть идеальные входы. Я всё время пытался тебе объяснить что это и есть самое слабое место твоего видения. По той причине, что сделав свою работу и пытаясь потом найти свои входы и выходы в реалтайме ты попадёшь туда, откуда я начинаю. Я никогда не утверждал что у нас всё наоборот :).

Видишь ли, если речь идет о максимизации прибыли (а именно об этом мы разговаривали, как о первоначальном критерии построения ТС), то именно идеальные входы должны использоваться для подбора оптимальной (идеальной) параметризации ФП. В идеале (:-) тогда может вообще не понадобиться внешний фильтр сделок, достаточно будет параметров ФП. Но если речь идет об уже готовой стратегии входов-выходов, то это уже просто другой вопрос - оптимизация имеющейся стратегии методом кластеризации ФП. Если стратегия стоящая, то результат тоже будет хорош. А методика одна и та же.

Так что можно сказать и наоборот: сделав свою работу я достигаю результата минуя весьма субъективный этап создания стратегии входов-выходов на ровном месте.

Однако, надеюсь ты понимаешь, что эти варианты не противостоят друг другу. Любой подходит, если он дает результат.

Candid писал(а) >>

Ты ничего не попутал? Вроде до сих мы параметризовали ценовый ряд и эти-то параметры и образовывали фазовое пространство.

Мы параметризуем процесс. Иначе: мы создаем модель процесса, которая с очевидность будет обладать некоторами параметрами. Эта модель должна позволить нам считать необходимые числа, описывающие процесс, например МО. Или предполагаемый профит. И если мы используем точки, изображающие сделки, для построения поверхности профита и последующей кластеризации ФП, то это ничем не противоречит ни тому, что я говорил раньше, ни тому, что потом. И ты безусловно прав - именно эти параметры и образуют ФП.

А у тебя какие ?

Candid писал(а) >>

Хм, как бы ещё сказать. Каждая синяя точка это сделка, у неё в этой фазовой плоскости есть координаты, (Xi, Yi). Для каждой точки фазовой плоскости (X,Y) мы можем рассчитать расстояние до каждой синей точки, например по Евклиду: (X-Xi)^2+(Y-Yi)^2. У каждой синей точки есть профит, положительный или отрицательный. Нас интересуют, скажем, 10 ближайших к X и Y синих точек. Усредняем их профит и получаем координату поверхности Z для каждой точки (X,Y). То есть задаётся не радиус усреднения, а число учитываемых соседей, радиус усреднения может оказаться любым.

Я, кстати, уже сделал вариант взвешенного гауссом суммирования, ещё бы понять, из каких соображений сигму нормировать :). Впрочем, в густозаселённых областях результаты вполне похожи.


P.S. Ещё раз: мои сделки не просто имеют неидеальный профит, ничто не запрещает части из них быть убыточными.

Теперь понятно. Я поступаю немного не так. Я считаю вероятность положительного исхода. Кстати, несмотря на твое недоверие, убыточные сделки присутствуют и у меня тоже.
 
Yurixx >>:

...

Хм, мне казалось что я примерно представлял о чём ты говоришь, но этим постом ты полностью разрушил это заблуждение :). Но я хотел бы разобраться. Может начнём по порядку, мелкими шажками? На примере одного параметра.

Итак, вот ценовый ряд, вот ты идёшь по нему и на каждом баре рассчитываешь параметр. Или на каждом тике?

Затем ты из этих значений строишь фазовое пространство. Ты говорил, что фазовые траектории должны быть непрерывны. То есть ты берёшь ВСЕ значения? С каждого бара (с каждого тика) ?

Если нет, то как ты определяешь, в какие моменты времени брать значения для дальнейшего анализа? И в каком смысле тогда ты говорил о непрерывности?

Причина обращения: