Попробуйте, чтобы найти суслика в куче входного мусора. Подбор целевой переменной нужно решать как-то иначе - Общее обсуждение

Alexey Burnakov 2016.08.08 14:43 #911

Vizard_:
Хорошо))) но читаем внимательно условия -
"выложить результаты в % (удачно предсказанныхслучаев) для обоих выборок(train = хх%, test = хх%). Методы и модели озвучивать не нужно, лишь цифры"
Ждем еще результаты. Интересно какие выводы получаться у Mihail Marchukajtes.

мой результат (если захотите, озвучу и метод):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56% на обучении:

> table(glm_predict_train[, 2], glm_predict_train[, 1])

down up

down 333 181

up 256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

down up

down 0.333 0.181

up 0.256 0.230

52% на тесте:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

down up

down 332 173

up 309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

down up

down 0.332 0.173

up 0.309 0.186

Разговор с ChatGPT об Новая версия платформы MetaTrader Обсуждение статьи "Глубокие нейросети

Mihail Marchukajtes 2016.08.08 14:49 #912

Ну вообщем максимальный уровень обобщения данных 53% примерно, так что..... Изредка вылезает Гарбедж ин гарбедж оут, тобишь мусор.... Проверять на тесте нет возможности, так как в экселе длинные формулы не поддерживаюстся. Писать на МКУЛЬ под это дело не хочется, если бы модель была бы нормального качества то заморочился, а так с таким процентом обобщения, результат думаю на тесте будет не очень...

Где грань между подгонкой Количество сумасшедших на форуме? ЭЦП

Dr. Trader 2016.08.08 15:24 #913

mytarmailS:
мне не понятно каким образом вычисляется эта "прогнозированость" и есть ли в этом какой то смысл если не учитывается целевая

Там с помощью каких-то формул оценивается насколько сигнал зашумлён, или наоборот закономерен. Как и что вычисляют формулы одному автору известно, можно только доверять ему что он понимает что делает.
Суть довольно проста - если предикторы сами по себе не "шум", то на них легче что-то предсказывать. А если их как-то обработать, то можно получить ещё более стабильный сигнал. Стабильный сигнал - хорошая основа для прогноза.

Можно даже на скорую руку оценить предикторы самому, с функцией Omega() из этого пакета, подавать в неё нужно значения какого-то конкретного предиктора (одну колонку из обучающей таблицы). результат 0% - шум и предиктор бесполезен. 100% - всё хорошо, предиктор можно использовать.
Я полагаю что в функцию нужно подавать не чистые значения индикаторов, а их прирост, например для скользящей средней - c(MA[0]-MA[1], MA[1]-MA[2], MA[2]-MA[3], итд).

Насчёт целевых значений - да, они не используются в пакете. Этот пакет ничего предсказывать не может. Он только как-то определяет каким предикторам можно доверять, а каким нет, и создаёт на их основе ещё несколько новых. Подбор целевой переменной и обучение предсказательной модели нужно решать как-то иначе. Логично, что какие-то целевые переменные получится предсказать лучше, какие-то хуже.
Целевая переменная это вообще проблема для любого пакета. Не факт что используемая целевая переменная вообще может быть предсказана с помощью имеющихся предикторов. Например я могу для целевой переменной использовать или "рост/падение цены за следующий бар", или "рост/падение зигзага". Хотелось бы научиться создавать новые целевые переменные, так чтобы они подходили лучше всего к имеющимся предикторам. Кто знает, может быть я своими предикторами мог бы идеально предсказывать флэт, но я об этом никогда не узнаю потому что не попробовал.

Предсказание рынка на основе Распределение ценовых приращений Bayesian regression - Делал

Vizard_ 2016.08.08 15:53 #914

Alexey Burnakov:

СанСаныч Фоменко

Mihail Marchukajtes

Условия как я понял никто не читает (Допускается использование любых манипуляции с данными), посему не буду мучить. На самом деле все просто.
Нужно лишь взять лаги от A6, применить простую формулу седьмой меньше пятого и получить 100% на обоих выборках. Всем спасибо. Удачи...

Копирование данных с CopyBuffer. Как вычислить маржу? От теории к практике

Mihail Marchukajtes 2016.08.08 16:02 #915

Vizard_:
Условия как я понял никто не читает (Допускается использование любых манипуляции с данными), посему не буду мучить. На самом деле все просто.
Нужно лишь взять лаги от A6, применить простую формулу седьмой меньше пятого и получить 100% на обоих выборках. Всем спасибо. Удачи...

Ну и в чём прикол??? Я тоже могу выходную переменную так закодировать в куче входного мусора. Что хрен догадаетесь. Я так и не понял в чём был смысл сего???

Dr. Trader 2016.08.08 16:15 #916

Mihail Marchukajtes:
Ну и в чём прикол??? Я тоже могу выходную переменную так закодировать в куче входного мусора. Что хрен догадаетесь. Я так и не понял в чём был смысл сего???

Он обратил наше внимание на то, что используемое количество данных не всегда достаточно для прогноза. Например ограничив себя 9 барами, мы может быть упускаем важную информацию из более далёких баров. А также, что нельзя ставить оценку предиктору без учёта его взаимодействий с другими предикторами.

Обсуждение статьи "Глубокая нейросеть Любые вопросы новичков по Количество баров в истории

Vizard_ 2016.08.08 16:27 #917

Mihail Marchukajtes:
Ну и в чём прикол??? Я тоже могу выходную переменную так закодировать в куче входного мусора. Что хрен догадаетесь. Я так и не понял в чём был смысл сего???

В том, что суслика не видно, а он есть)))
Давай, попробуем. Только простенькое.

Mihail Marchukajtes 2016.08.08 16:32 #918

Vizard_:
В том, что суслика не видно, а он есть)))
Давай, попробуем. Только простенькое.

Ну давай, сейчас чтонибудь придумаю....

Mihail Marchukajtes 2016.08.08 16:39 #919

Ну к примеру вот этот файл. Читсо трайн никакого теста делать не нужно. На оптимизаторе решетова показывает мусор ил 56%, но суслик там тоже есть. Кто сможет найти....??? Правда не вижу смысла в этих играх, когда выход делается из преобразования входа, тут и сеть не нужна будет.... так то....

Неподгоночная система - основные Импульсы в ночное время ICWR в качестве эксперта?

Mihail Marchukajtes 2016.08.08 16:40 #920

Mihail Marchukajtes:
Ну к примеру вот этот файл. Читсо трайн никакого теста делать не нужно. На оптимизаторе решетова показывает мусор ил 56%, но суслик там тоже есть. Кто сможет найти....??? Правда не вижу смысла в этих играх, когда выход делается из преобразования входа, тут и сеть не нужна будет.... так то....

Пилять ну бесит этот форум что простой архив раровский прицепить нельзя.... Убожество одним словом....

Файлы:

lm9m_mwe9y5a1.txt 5 kb

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 92