Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3042

 
mytarmailS #:

Вычленяем нескольго "годных" правил/стратегий из данных..

Получаю ошибку при запуске

> sw <- embed(x = close,dimension = 10)[,10:1] # make slide window data
Error in h(simpleError(msg, call)) : 
  ошибка при оценке аргумента '.data' при выборе метода для функции 'embed': argument ".data" is missing, with no default
 

Возник чисто теоретический вопрос - может ли ONNX модель использоваться для получения другой ONNX модели. Например, первая модель используется для периодического переобучения на новых данных и обновления рабочей модели. Имеется в виду, без использования питона и тд.

На первый взгляд, вряд ли это возможно, но вдруг кто-то пытался делать что-то подобное.

Осмысленных ответов от ИИ добиться не удалось - пишет что можно и приводит в подтверждение ссылки не имеющие никакого отношения к вопросу)

 
Aleksey Nikolayev #:

Основная проблема в применении матстата для таких задач в том, что поиск ТС осуществляется отбором из большого числа вариантов. Всегда можно из большого набора выбрать что-то очень красивое - на простом примере как-то показывал здесь, что моделируя цены как СБ, всегда можно "найти" хороший час недели для торговли. А это всего-то 120 вариантов для выбора.

При этом матстат не говорит, что отобранная ТС обязательно плохая, а говорит лишь о том, что подобный результат МОЖЕТ (А НЕ ОБЯЗАН) являться всего лишь результатом отбора из СБ.

Я всетаки не понял , те нет способа уверенно сказать статистически значим фин. рез. ТС или нет?

Aleksey Vyazmikin #:

Получаю ошибку при запуске

1) Данные те же что и в примере?

2) может в новом R изменились названия аргументов функции 

?embed
 

одним из направлений может быть поиск не самых лучших, а самых стабильных параметров ТС. т.е., отбрасывать те варианты, которые имеют вариабельность результатов на разных участках истории.

один из способов - заложить в критерии оценки показатели стабильности результатов.

 

Есть класный пакет по баесовской оптимизации..

Можно делать многокритериальную опмимизацию, оптимизацию на функциях с шумом и много много другого , очень интересный пакет

сделал  игрушечный пример как алгоритм ищет минимум в одномерном векторе

library(mlrMBO)

set.seed(123)
xx <- cumsum(rnorm(1000))
par(mar=c(2,2,2,2))
plot(xx,t="l")

fun = function(i){
  plot(xx,t="l",col=8)
  points(i,xx[i],col=4,lwd=4)
  return(xx[i])
}

obj.fun = makeSingleObjectiveFunction(name = "noisy_parable", 
                                      fn = fun,
                                      has.simple.signature = TRUE, 
                                      par.set = makeNumericParamSet("i", 1, 1, length(xx)),
                                      noisy = F)


ctrl = makeMBOControl(final.method = "best.true.y", final.evals = 10)
ctrl = setMBOControlInfill(ctrl, crit = crit.eqi)
ctrl = setMBOControlTermination(ctrl, iters = 40)

configureMlr(on.learner.warning = "quiet", show.learner.output = F)
res = mbo(obj.fun, control = ctrl, show.info = T)

points(res$x$i, xx[res$x$i] , col=2,lwd=5, pch=10)
Bayesian Optimization and Model-Based Optimization of Expensive Black-Box Functions
  • mlrmbo.mlr-org.com
Flexible and comprehensive R toolbox for model-based optimization (MBO), also known as Bayesian optimization. It implements the Efficient Global Optimization Algorithm and is designed for both single- and multi- objective optimization with mixed continuous, categorical and conditional parameters. The machine learning toolbox mlr provide dozens of regression learners to model the performance of the target algorithm with respect to the parameter settings. It provides many different infill criteria to guide the search process. Additional features include multi-point batch proposal, parallel execution as well as visualization and sophisticated logging mechanisms, which is especially useful for teaching and understanding of algorithm behavior. mlrMBO is implemented in a modular fashion, such that single components can be easily replaced or adapted by the user for specific use cases.
 
mytarmailS #:

Я всетаки не понял , те нет способа уверенно сказать статистически значим фин. рез. ТС или нет?

Не надо смешивать две вещи, которые связаны с использованием одного и того же показателя:

1) Оценка результата работы одной ТС по этому показателю. 

2) Выбор одной ТС из большого числа вариантов, посредством максимизации этого показателя.

В первом случае значение показателя может говорить о статистической значимости, а во втором - вряд ли.

 
mytarmailS #:

Я всетаки не понял , те нет способа уверенно сказать статистически значим фин. рез. ТС или нет?

1) Данные те же что и в примере?

2) может в новом R изменились названия аргументов функции 

1. да

2. Может - включил 3.5.0 - затребовал библиотеку - устанавливаю и опять какие то ошибки

installing the source package ‘inTrees’

trying URL 'https://mirrors.tuna.tsinghua.edu.cn/CRAN/src/contrib/inTrees_1.3.tar.gz'
Content type 'application/octet-stream' length 16771 bytes (16 KB)
downloaded 16 KB

ERROR: dependency 'arules' is not available for package 'inTrees'
* removing 'C:/Users/S_V_A/Documents/R/win-library/3.5/inTrees'
In R CMD INSTALL
Warning in install.packages :
  installation of package ‘inTrees’ had non-zero exit status
 
Aleksey Vyazmikin #:

1. да

2. Может - включил 3.5.0 - затребовал библиотеку - устанавливаю и опять какие то ошибки

посмотри какие аргументы принимает функция 

?embed

в той версии в которой была ошибка с этой функцией.

написал же!

 
Aleksey Nikolayev #:

Не надо смешивать две вещи, которые связаны с использованием одного и того же показателя:

1) Оценка результата работы одной ТС по этому показателю. 

2) Выбор одной ТС из большого числа вариантов, посредством максимизации этого показателя.

В первом случае значение показателя может говорить о статистической значимости, а во втором - вряд ли.

Те простыми словами получаеться если я оцениваю одну ТС по стат. значимости , то это хрошо,

если у меня 100 ТС и я выбираю лучшую по тому же критерию то это уже плохо?


Я наверное всетаки что не так понял? так же не может быть верно?

 
Andrey Dik #:

одним из направлений может быть поиск не самых лучших, а самых стабильных параметров ТС. т.е., отбрасывать те варианты, которые имеют вариабельность результатов на разных участках истории.

один из способов - заложить в критерии оценки показатели стабильности результатов.

Какой у вас вариант оценки стабильности? Мы тут недавно обсуждали 2 варианта.
Причина обращения: