Оценку листьев деревьев я делаю с учетом равномерности распределения сигнала по всей выборке. Давайте предпочтение тем, что распределены по всей - Общее обсуждение

Грааль 2019.05.25 15:00 #14851

typedef struct

{

double dist;

double* vector;

} distvect;

int distvectcomp(distvect *v1, distvect *v2)

{

if (v1->dist == v2->dist) return 0;

double sub = v1->dist - v2->dist;

return sub / fabs(sub);

}

double* parsen(dataset inputs, dataset outputs, int k, double kernel(double), double vector[])

{

distvect* dvarr = malloc(inputs.length * sizeof(distvect));

for (int i = 0; i < inputs.length; ++i)

{

double dist = 0;

for (int j = 0; j < inputs.dimentions; ++j) dist += pow(vector[j] - inputs.data[i][j], 2);

distvect dv = { dist, outputs.data[i] };

dvarr[i] = dv;

}

qsort(dvarr, inputs.length, sizeof(distvect), distvectcomp);

double *res = calloc(outputs.dimentions, sizeof(double));

double W = 0;

for (int i = 0; i < k; ++i)

{

if (dvarr[i].dist == 0) continue;

double w = kernel(dvarr[i].dist);

W += w;

for (int d = 0; d < outputs.dimentions; ++d)

res[d] += dvarr[i].vector[d] * w;

}

for (int d = 0; d < outputs.dimentions; ++d) res[d] /= W;

free(dvarr);

return res;

}

Считается что "квазиоптимальный" алгоритм МО

Ошибки, баги, вопросы Показатель Херста Рыночный этикет или правила

Maxim Dmitrievsky 2019.05.25 20:28 #14852

В смысле? что это за огрызок SVM

Грааль 2019.05.25 21:40 #14853

Maxim Dmitrievsky:
В смысле? что это за огрызок SVM

да не, какой же это svm это "парзеновское окно", ядерное сглаживание, а "квазиоптимальный" в смысле что почти идеальный(у Митчела где то было), но только очень медленный, каждая иттерация - сортировка всего датасета к новой точке и свёртка с ядром

Расчёт идеального вхождения на какому индикатору больше всего Неподгоночная система - основные

Aleksey Vyazmikin 2019.05.25 23:35 #14854

Я вот не пойму, почему нет алгоритмов для построения дерева, которые бы учитывали равномерность распределения сигнала по всей выборки при построении дерева?

Может как то это реализуем, ведь для трейдинга это критически актуально.

Оценку листьев я делаю с учетом этого распределения, но если бы дерево строилось с его учетом, то эффективных листьев/деревьев было бы значительно больше.

Ищем закономерности Группировка листьев - требуются Как отличить график FOREX

Yuriy Asaulenko 2019.05.26 00:47 #14855

Aleksey Vyazmikin:

Не буду утверждать, но не исключаю, что зря ты деревца обрезкой мучаешь.

Это так, из общих соображений и личного опыта.

Forester 2019.05.26 06:36 #14856

Aleksey Vyazmikin:

Я вот не пойму, почему нет алгоритмов для построения дерева, которые бы учитывали равномерность распределения сигнала по всей выборки при построении дерева?

Может как то это реализуем, ведь для трейдинга это критически актуально.

Оценку листьев я делаю с учетом этого распределения, но если бы дерево строилось с его учетом, то эффективных листьев/деревьев было бы значительно больше.

Там перед каждым делением, происходит сортировка данных по фиче (что перемешивает их по времени), делится (по середине или по квартилям), запоминается уменьшение ошибки, повторяется для всех фич. Самое лучшее разделение становится узлом.

Предложите лучший алгоритм.

Вопросы от начинающих MQL5 Интересное и Юмор Вопросы от начинающих MQL4

Aleksey Vyazmikin 2019.05.26 06:48 #14857

Yuriy Asaulenko:
Не буду утверждать, но не исключаю, что зря ты деревца обрезкой мучаешь.

Это так, из общих соображений и личного опыта.

В юности я считал бонсай издевательством над природой, но когда стал родителем - понял, всю глубину идеи.

Aleksey Vyazmikin 2019.05.26 06:51 #14858

elibrarius:
Там перед каждым делением, происходит сортировка данных по фиче (что перемешивает их по времени), делится (по середине или по квартилям), запоминается уменьшение ошибки, повторяется для всех фич. Самое лучшее разделение становится узлом.

Предложите лучший алгоритм.

Вот и нужно давать оценку в момент сортировки предикторов и их значений и не брать те предикторы со значениями (диапазонами), которые скучковались очень сильно, а давать предпочтение тем, что распределены по всей выборке.

Т.е. нужно оценивать частоту повторения сплита по выборке, а не только его абсолютную повторяемость.

Обсуждение статьи "Глубокая нейросеть Использование искусственного интеллекта в Есть ли закономерность в

Forester 2019.05.26 06:54 #14859

Aleksey Vyazmikin:

Вот и нужно давать оценку в момент сортировки предикторов и их значений и не брать те предикторы со значениями (диапазонами), которые скучковались очень сильно, а давать предпочтение тем, что распределены по всей выборке.

Ну на бэктесте всегда все очень хорошо выглядит)
Полагаю вам форвард нужен равномерный? Про форвард лес ничего не знает при обучении\

Aleksey Vyazmikin 2019.05.26 06:58 #14860

elibrarius:
Ну на бэктесте всегда все очень хорошо выглядит)
Полагаю вам форвард нужен равномерный? Про форвард лес ничего не знает при обучении\

Оценка должна быть на двух выборках, участвующих в обучении.

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1486