Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 92

 
Vizard_:
Хорошо))) но читаем внимательно условия -
"выложить результаты в % (удачно предсказанныхслучаев) для обоих выборок(train = хх%, test = хх%). Методы и модели озвучивать не нужно, лишь цифры"
Ждем еще результаты. Интересно какие выводы получаться у Mihail Marchukajtes.

мой результат (если захотите, озвучу и метод):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

 56% на обучении: 

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

 

 52% на тесте:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
Ну вообщем максимальный уровень обобщения данных 53% примерно, так что..... Изредка вылезает Гарбедж ин гарбедж оут, тобишь мусор.... Проверять на тесте нет возможности, так как в экселе длинные формулы не поддерживаюстся. Писать на МКУЛЬ под это дело не хочется, если бы модель была бы нормального качества то заморочился, а так с таким процентом обобщения, результат думаю на тесте будет не очень...
 
mytarmailS:
мне не понятно каким образом вычисляется эта "прогнозированость" и есть ли в этом какой то смысл если не учитывается целевая

Там с помощью каких-то формул оценивается насколько сигнал зашумлён, или наоборот закономерен. Как и что вычисляют формулы одному автору известно, можно только доверять ему что он понимает что делает.
Суть довольно проста - если предикторы сами по себе не "шум", то на них легче что-то предсказывать. А если их как-то обработать, то можно получить ещё более стабильный сигнал. Стабильный сигнал - хорошая основа для прогноза.

Можно даже на скорую руку оценить предикторы самому, с функцией Omega() из этого пакета, подавать в неё нужно значения какого-то конкретного предиктора (одну колонку из обучающей таблицы). результат 0% - шум и предиктор бесполезен. 100% - всё хорошо, предиктор можно использовать.
Я полагаю что в функцию нужно подавать не чистые значения индикаторов, а их прирост, например для скользящей средней - c(MA[0]-MA[1], MA[1]-MA[2], MA[2]-MA[3], итд).

Насчёт целевых значений - да, они не используются в пакете. Этот пакет ничего предсказывать не может. Он только как-то определяет каким предикторам можно доверять, а каким нет, и создаёт на их основе ещё несколько новых. Подбор целевой переменной и обучение предсказательной модели нужно решать как-то иначе. Логично, что какие-то целевые переменные получится предсказать лучше, какие-то хуже.
Целевая переменная это вообще проблема для любого пакета. Не факт что используемая целевая переменная вообще может быть предсказана с помощью имеющихся предикторов. Например я могу для целевой переменной использовать или "рост/падение цены за следующий бар", или "рост/падение зигзага". Хотелось бы научиться создавать новые целевые переменные, так чтобы они подходили лучше всего к имеющимся предикторам. Кто знает, может быть я своими предикторами мог бы идеально предсказывать флэт, но я об этом никогда не узнаю потому что не попробовал. 

 
Условия как я понял никто не читает (Допускается использование любых манипуляции с данными), посему не буду мучить. На самом деле все просто.
Нужно лишь взять лаги от A6, применить простую формулу седьмой меньше пятого и получить 100% на обоих выборках. Всем спасибо. Удачи...
 
Vizard_:
Условия как я понял никто не читает (Допускается использование любых манипуляции с данными), посему не буду мучить. На самом деле все просто.
Нужно лишь взять лаги от A6, применить простую формулу седьмой меньше пятого и получить 100% на обоих выборках. Всем спасибо. Удачи...
Ну и в чём прикол??? Я тоже могу выходную переменную так закодировать в куче входного мусора. Что хрен догадаетесь. Я так и не понял в чём был смысл сего???
 
Mihail Marchukajtes:
Ну и в чём прикол??? Я тоже могу выходную переменную так закодировать в куче входного мусора. Что хрен догадаетесь. Я так и не понял в чём был смысл сего???
Он обратил наше внимание на то, что используемое количество данных не всегда достаточно для прогноза. Например ограничив себя 9 барами, мы может быть упускаем важную информацию из более далёких баров. А также, что нельзя ставить оценку предиктору без учёта его взаимодействий с другими предикторами.
 
Mihail Marchukajtes:
Ну и в чём прикол??? Я тоже могу выходную переменную так закодировать в куче входного мусора. Что хрен догадаетесь. Я так и не понял в чём был смысл сего???
В том, что суслика не видно, а он есть)))
Давай, попробуем. Только простенькое.
 
Vizard_:
В том, что суслика не видно, а он есть)))
Давай, попробуем. Только простенькое.
Ну давай, сейчас чтонибудь придумаю....
 
Ну к примеру вот этот файл. Читсо трайн никакого теста делать не нужно. На оптимизаторе решетова показывает мусор ил 56%, но суслик там тоже есть. Кто сможет найти....??? Правда не вижу смысла в этих играх, когда выход делается из преобразования входа, тут и сеть не нужна будет.... так то....
 
Mihail Marchukajtes:
Ну к примеру вот этот файл. Читсо трайн никакого теста делать не нужно. На оптимизаторе решетова показывает мусор ил 56%, но суслик там тоже есть. Кто сможет найти....??? Правда не вижу смысла в этих играх, когда выход делается из преобразования входа, тут и сеть не нужна будет.... так то....
Пилять ну бесит этот форум что простой архив раровский прицепить нельзя.... Убожество одним словом....
Файлы:
Причина обращения: