Discusión sobre el artículo "Evaluación y selección de variables en modelos de aprendizaje de máquinas" - página 3

 
Vladimir Perervenko:

Primero se da la definición de Clasificación a nivel de parvulario. Luego se dice que se genera incertidumbre(!?) Y termina como siempre: "¿Dónde está la llave del piso donde está el dinero?".

Necesitas más formación teórica. Estudiar, estudiar y volver a estudiar... Ya sabes.

Y sé más modesto.

PD. Pon tu propuesta en Freelance. Consigue un producto real.

No es la primera vez que oigo hablar de la clave plana. Relee mi propuesta:"Los detalles del modelo, la normalización de los datos y su selección no me interesan. Me interesan los resultados de las predicciones..." Y las predicciones sobre la historia pasada desde 2000 hasta hoy. Así que supongo que todos no sabemos leer. En resumen, la teoría continúa. Releemos otros libros y artículos y escribimos los nuestros. Al menos intentad operar en el mercado real con vuestros propios métodos y luego escribid artículos. Muy bien, teóricos académicos. Os di publicidad aquí, y la rama empezó a ahogarse en la avalancha de nuevos artículos.

 

Aquí hay un par de artículos más sobre el tema:

http://robotwealth.com/machine-learning-financial-prediction-david-aronson/

http://robotwealth.com/machine-learning-for-financial-prediction-experimentation-with-david-aronsons-latest-work-part-2/

Quizás a alguien le resulte útil.

Machine learning for financial prediction: experimentation with David Aronson’s latest work – part 1
Machine learning for financial prediction: experimentation with David Aronson’s latest work – part 1
  • 2016.03.04
  • Robot Master
  • robotwealth.com
One of the first books I read when I began studying the markets a few years ago was David Aronson’s Evidence Based Technical Analysis. The engineer in me was attracted to the ‘Evidence Based’ part of the title. This was soon after I had digested a trading book that claimed a basis in chaos theory, the link to which actually turned out to be...
 
Andrew Ng - en la transcripción rusa es probablemente más correcto Andrew Eun ;)

En primer lugar, un ENORME agradecimiento al autor por una serie única de artículos, ¡esto es realmente el Grial para aquellos que están en el tema o al menos tratando de entender!

En segundo lugar, sin formación previa la lectura de estos materiales para la persona promedio es un bosque oscuro, incluso diría que se encuentra más allá de su horizonte de eventos de las capacidades cognitivas. Por lo tanto, es muy recomendable para escuchar cursos sobre aprendizaje automático en econometría y álgebra lineal de la Escuela Superior de Economía en el mismo recurso.

Y sólo después de eso tal vez llegue la comprensión de lo que Vladimir escribe en sus artículos.

Una vez más, ¡BRAVO!
 

Estimado Vladimir, gracias por su buen artículo.

Estoy leyendo todos tus artículos y son muy interesantes.

En cuanto a éste, todavía no entiendo muy bien ¿por qué utilizar preProcess para dividir los datos y cómo se dividen los datos?

Según mis experimentos esta función divide los datos en un orden diferente.

La pregunta es: ¿cómo puedo restablecer el orden original después de tener los resultados de la función predecir?

Parece que este resultado está en un orden diferente.

Gracias de antemano por sus comentarios.

Saludos

 
mg64ve:

Estimado Vladimir, gracias por su buen artículo.

Estoy leyendo todos tus artículos y son muy interesantes.

En cuanto a éste, todavía no entiendo muy bien ¿por qué se utiliza preProcess para dividir los datos y cómo se dividen los datos?

Según mis experimentos esta función divide los datos en un orden diferente.

La pregunta es: ¿cómo puedo restablecer el orden original después de tener los resultados de la función predecir?

Parece que este resultado está en un orden diferente.

Gracias de antemano por sus comentarios.

Saludos

Hola,

Probablemente lo has entendido mal. Split de las funciones holdout() realizado. A continuación, la función preProcess() definido por los parámetros de normalización en el conjunto de entrenamiento . Y entonces el código ..

Saludos cordiales

Vladimir

> idx <- rminer::holdout(y = data.f$Class)
> prep <- caret::preProcess(x = data.f[idx$tr, -ncol(data.f)],
+             method = c("spatialSign"))
> x.train <- predict(prep, data.f[idx$tr, -ncol(data.f)])
> x.test <- predict(prep, data.f[idx$ts, -ncol(data.f)])
> y.train <- data.f[idx$tr, ncol(data.f)]
> y.test <- data.f[idx$ts, ncol(data.f)]
 

¿Es eso worng? " mejor <- Cs(cci, cmo, slowD, oscK, señal, tr, ADX. chv, atr, ar)"


 

En caso de que el código correcto es:

>library(Hmisc)

>best <- Cs(cci, cmo, slowD, oscK, signal, tr, ADX,chv, atr, ar)

¿el "ADX." debería ser "ADX,"?

 
JunCheng Li:

En caso de que el código correcto es:

>library(Hmisc)

>best <- Cs(cci, cmo, slowD, oscK, signal, tr, ADX,chv, atr, ar)

¿el "ADX." debería ser "ADX,"?

Да, это опечатка в статье.

 
Muchas gracias al autor del artículo. Acabo de empezar y tengo un problema. He instalado RStudio, no Revolution R Open 3.2.1 como sugiere el autor. El paquete "RandomUniformForests" y el paquete "RoughSets " se cargan, pero la función nearZeroVar() y la función findLinearCombos() no se llaman correctamente. El paquete "RandomUniformForests" y el paquete "RoughSets" se cargan, pero la función nearZeroVar() y lafunción findLinearCombos() no se ejecutan correctamente, ¿son estas funciones específicas de Revolution R Open?
Microsoft R Open: The Enhanced R Distribution · MRAN
  • Microsoft Corporation
  • mran.revolutionanalytics.com
Microsoft R Open, formerly known as Revolution R Open (RRO), is the enhanced distribution of R from Microsoft Corporation. It is a complete open source platform for statistical analysis and data science. The current version, Microsoft R Open 3.3.2, is based on (and 100% compatible with) R-3.3.2, the most widely used statistics software in the...
 

Hola Vlad,

Estoy intentando volver a ejecutar tu ejemplo paso a paso.

En la sección Datos de entrada, La función In(p=16) trata con un objeto precio. Cual es su formato o clase en R ( zoo, xts o dataframe ) y como es ( sus nombres de columnas, etc..). Sin esta información, es imposible ejecutar el comando x <- In(p = 16) ...

Saludos cordiales.

Julien