Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3582

 
Aleksey Nikolayev #:
Возникает мысль перейти от деревьев к простому поиску прямоугольников, когда сплиты делаются не по-очереди, а одновременно несколько.

Можно взять отобранные квантовые отрезки по моему методу и проверить их попарно (это есть у меня в планах) - те, что будут улучшать вероятность нужного класса и представляют по сути прямоугольник в духмерном пространстве.

 
Хочу это!!!! 


Через 10-15 лет это будет продаваться у китайцев за 2000$ как старый бу хлам
 
mytarmailS #:
Хочу это!!!! 


Через 10-15 лет это будет продаваться у китайцев за 2000$ как старый бу хлам

да, серверное все скупается крупными продавцами, и выкладывается на али(сами китайца не могут на али покупать)

 
Aleksey Vyazmikin #:

Можно взять отобранные квантовые отрезки по моему методу и проверить их попарно (это есть у меня в планах) - те, что будут улучшать вероятность нужного класса и представляют по сути прямоугольник в духмерном пространстве.

Называю прямоугольником не двумерную фигуру, а многомерную, размерностью равной числу признаков (n-гиперпрямоугольник). Мне так удобнее, поэтому и вы тоже также понимайте.
 
Aleksey Nikolayev #:
Называю прямоугольником не двумерную фигуру, а многомерную, размерностью равной числу признаков (n-гиперпрямоугольник). Мне так удобнее, поэтому и вы тоже также понимайте.

Можно так же и многомерную искать фигуру, но уже посложней. Правда, я нахожу сомнительным поиск на всех предикторах сразу - даже в теории не могу представить как такое может быть.

Пара признаков может быть связана одной логикой.

 
Aleksey Nikolayev #:
Называю прямоугольником не двумерную фигуру, а многомерную, размерностью равной числу признаков (n-гиперпрямоугольник). Мне так удобнее, поэтому и вы тоже также понимайте.

.

 
Aleksey Vyazmikin #:

Можно так же и многомерную искать фигуру, но уже посложней. Правда, я нахожу сомнительным поиск на всех предикторах сразу - даже в теории не могу представить как такое может быть.

Пара признаков может быть связана одной логикой.

Речь же была о деревьях, которые не делают ничего, кроме разрезания пространства N признаков на N-прямоугольники.

Допустим, у нас действительно есть некий N-прямоугольник в пространстве признаков, в котором один класс сильно преобладает над другим. Чтобы выделить его деревом нужно сделать минимум 2N сплитов и получить в сумме 3^N (это огромное число при больших N) N-прямоугольников. Не лучше ли в таком случае сразу искать один N-прямоугольник?

Главная идея в том, что задача полной "картографии" пространства признаков черезчур амбициозна - зря тратится ограниченная информация содержащаяся в выборке. Что если ограничиться попытками просто вырезать "хорошие" кусочки из него?

 
Aleksey Nikolayev #:

 пространства признаков черезчур амбициозна - зря тратится ограниченная информация содержащаяся в выборке. Что если ограничиться попытками просто вырезать "хорошие" кусочки из него?


.


Жую туже жвачку...


В долгих размышлениях реализации пришел к евристическому поиску, симвойлной регрессии и логическим правилам как конечный продукт.

Столкнулся с проблемами проклятия рамерности (несмотря на большое количество данных\котировок найденых хороших примеров/паттернов  5-20 екземпляров) и моральным выгоранием :)

 
По идее, какая-то хитрая предобработка/постобработка должна заменять такие хитрые модели. 
 
Aleksey Nikolayev #:
Речь же была о деревьях, которые не делают ничего, кроме разрезания пространства N признаков на N-прямоугольники.

Если берёте диапазон значений предикторов, то находите сторону условно многомерной фигуры.

Aleksey Nikolayev #:
Допустим, у нас действительно есть некий N-прямоугольник в пространстве признаков

Как мне представляется, такое возможно если вероятность на шкале предиктора меняется плавно, я же вижу в своих предикторах резкие изменения смещения вероятности. Таким образом, всё сводится к поиску строк, на которых предикторы показывали значения в определённом диапазоне и преимущественно выделяли один класс. И, это проще искать через квантовые отрезки, после получения которых проводится группировка их по откликам в строках.

Даже если получить то, что задумываете, то гарантии работы на новых данных нет. Нужно копать именно в сторону поиска таких гарантий...