Алгоритм объединения диапазонов отрезка - помогите создать - страница 6

 
Aleksey Vyazmikin:

Какая разница, какие отрезки длинные или короткие, или речь об оценке (длине стрелки по аналогии с рисунком)?

У нас желание - шагнуть по двум лучшим путям в примере, если их меньше то путь один.

Поясните, пожалуйста, почему может возникнуть сложность.

Если в множестве есть области с короткими и длинными отрезками, то попав в область с только длинными отрезками, путь будет длиннее, чем если бы вы попали в область с короткими отрезками. Например, в начале как на рисунке у вас, а далее есть две области параллельные друг другу, и в первой области отрезки в 3 раза короче чем во второй и занимают эти области 75 процентов пути.

 
Valeriy Yastremskiy:

Если в множестве есть области с короткими и длинными отрезками, то попав в область с только длинными отрезками, путь будет длиннее, чем если бы вы попали в область с короткими отрезками. Например, в начале как на рисунке у вас, а далее есть две области параллельные друг другу, и в первой области отрезки в 3 раза короче чем во второй и занимают эти области 75 процентов пути.

Движение будет начинаться из каждого отрезка, поэтому должны пройти и по тем областям.

 
Aleksey Vyazmikin:

Движение будет начинаться из каждого отрезка, поэтому должны пройти и по тем областям.

Движение может начинаться из любого отрезка, но заведомо ясно, что точки с длинными отрезками не нужны. В алгоритме у вас соотношения только с ближайшими отрезками, а не с любыми, и если вы попали в точку с длинными отрезками, и рядом точки только с длинными отрезками, то это не лучший результат.

 
Valeriy Yastremskiy:

Движение может начинаться из любого отрезка, но заведомо ясно, что точки с длинными отрезками не нужны. В алгоритме у вас соотношения только с ближайшими отрезками, а не с любыми, и если вы попали в точку с длинными отрезками, и рядом точки только с длинными отрезками, то это не лучший результат.

"Длина" тут относительная, пока не дойдем до точки не сможем измерить.

Другое дело, это оценка на составные аналоги, когда один отрезок представлен двумя, тогда да, можно выкинуть один отрезок.

 
Aleksey Vyazmikin:

"Длина" тут относительная, пока не дойдем до точки не сможем измерить.

Другое дело, это оценка на составные аналоги, когда один отрезок представлен двумя, тогда да, можно выкинуть один отрезок.

Не понял. Если длину / цену можно посмотреть, только попав в точку, это гораздо более сложная задача. И без достаточно полной оценки цен / длин результат нельзя оценить достоверно.

Про составные аналоги не понятно.

 
Valeriy Yastremskiy:

Не понял. Если длину / цену можно посмотреть, только попав в точку, это гораздо более сложная задача. И без достаточно полной оценки цен / длин результат нельзя оценить достоверно.

Да, так и есть.

Valeriy Yastremskiy:

Про составные аналоги не понятно.

На рисунке ниже у нас два больших отрезка и под ними 5 малых, но видно что они на одном диапазоне, а значит по сути описывают аналогичную область.

Вопрос лишь в том, что лучше - более мелкие отрезки, дающие возможность для каждого из них нахождения корреспондирующего предиктора и имеющего более точный отрезок, или большая обобщающая способность в большем отрезке. Думаю, что мелки отрезки лучше, их минимум ограничен при отборе.

 

Ещё вот мысль пришла, а почему бы действительно не взять лучшие x% отрезков и не заполнить с помощью их пространство на первом этапе, а на втором выявить промежутки между отрезками и поискать отрезки для внедрения в эти промежутки.

На рисунке показал условно два этапа.


 
Aleksey Vyazmikin:

Ещё вот мысль пришла, а почему бы действительно не взять лучшие x% отрезков и не заполнить с помощью их пространство на первом этапе, а на втором выявить промежутки между отрезками и поискать отрезки для внедрения в эти промежутки.

На рисунке показал условно два этапа.


Ну я про это и пытаюсь сказать, сперва оценить длины/цены от точек, выявить множества ценных отрезков и токсичных и потом строить путь исходя из ценностей отрезков и возможности наиболее полно заполнить путь без разрывов.

Как минимум решение не будет лучшим, но будет лучше среднего. 

 

Вопрос не по теме и скорее философский. Осознаётся ли, что подход к классификации посредством разбиения признаков на отрезки подразумевает разрывную зависимость выходов от входов? То есть, может возникнуть ситуация, когда сделка откроется при одном наборе значений признаков и не откроется при другом очень-очень близком к первому (они рядом с границей, но по разную сторону от неё). Я не говорю, что это неправильный подход. Просто хочу спросить - стоит ли за ним какая-то трейдерская интуиция или это произвольный выбор?

Как возможный альтернативный вариант можно предложить классификацию посредством логистической регрессии или методом ближайших соседей. Там на выходе можно получать оценку вероятности принадлежности к классу, которую можно, например, использовать для определения объёма сделки. Не настаиваю на каких-либо конкретных алгоритмах, просто интересует трейдерский аспект выбора конкретного алгоритма МО.

 
Valeriy Yastremskiy:

Ну я про это и пытаюсь сказать, сперва оценить длины/цены от точек, выявить множества ценных отрезков и токсичных и потом строить путь исходя из ценностей отрезков и возможности наиболее полно заполнить путь без разрывов.

Как минимум решение не будет лучшим, но будет лучше среднего. 

Вопрос тут в том, как выявить "множество ценных отрезков и токсичных" - т.е. требуется выявить их взаимозаменяемость, либо делать в два прохода, как я ранее предложил. Или у Вас есть иной вариант?

Причина обращения: