Investigación en paquetes matriciales - página 7

 
http://quantquant.com/viewtopic.php?f=7&t=1236
 
zaskok3:
http://quantquant.com/viewtopic.php?f=7&t=1236

¿Para qué sirve este enlace? Un breve comentario sería útil.

Por ejemplo: un conjunto de enlaces a tutoriales de R y Python.

En cuanto al contenido de los enlaces: ¿has sacado todo de la amplia red? ¿O hay alguna preferencia? De Python, pyBrain es el más interesante y digno de estudio y aplicación. Implementa redes que no están presentes en los paquetes de R. No es una discusión, no es una crítica, sólo un comentario de pasada.

Buena suerte

 
Vladimir Perervenko:

1. Sí.

2. ¿Por qué? Necesito un único MT4R.dll que sea la puerta de entrada para enviar datos a R y recibir resultados de vuelta.

3. A todas las bases de datos existentes. Además, tanto Microsoft como Oracle han integrado R en sus bases de datos.

4. R implementa varias opciones de interacción con Matlab, desde el simple intercambio de archivos Matlab hasta la ejecución de funciones Matlab desde R. Si tiene experiencia y conocimientos en esta área, puede implementar un excelente enlace Matlab-MTterminal con R.

5. En R se realizan los paquetes para todas las direcciones de una ciencia y técnica y teniendo en cuenta los últimos logros. Puede empezar por aquí.

6. Hay más de uno. El más común es el ff.

En general, estoy sorprendido. Estás en medio de la nada. Mira los artículos 1 y 2 de este sitio y no entenderás mucho pero te harás una idea de cómo funciona el lenguaje.

Estoy terminando el segundo artículo sobre el aprendizaje profundo que espero enviaros mañana para su revisión y los ejemplos se adjuntarán a los expertos... Si hay interés, creo que escribiré varios artículos sobre el nivel inicial (filtrado, descomposición, predicción, etc.). Y por supuesto, seguir indagando en el aprendizaje profundo, sobre todo porque Google abrió su biblioteca TensorFlow para todo el mundo. Y hay otros no menos interesantes y prometedores (mxnet, pyBrain).

Si un grupo de entusiastas se reúne, podemos organizar una rama de usuarios del lenguaje R.

Buena suerte

¡Buenos artículos! Gracias. Tendré que investigarlo. Pero pienso probar SVM, GBM, xGBoost en lugar de NS.
 
Alexey Burnakov:
¡Buenos artículos! Gracias. Tengo que investigarlo. Pero pienso probar SVM, GBM, xGBoost en lugar de NS.
SVM, ada, randomforest. Todo esto después de ejercitarse con estos paquetes en traqueteo. Y después, paquetes de selección de predictores
 
Alexey Burnakov:
¡Buenos artículos! Gracias. Tendré que investigarlo. Pero pienso probar SVM, GBM, xGBoost en lugar de NS.

Pruébalos todos.

Mi favorito es randomForest en varias modificaciones (la principal ventaja es que no requiere preprocesamiento de entrada. Y también ada - puntuación de calidad muy alta. Ambos tienen dos inconvenientes: una curva de aprendizaje muy larga y una gran propensión al sobreentrenamiento.

Eso no significa que no debas usarlos, sólo que debes tener en cuenta las molestias.

Buena suerte

 
СанСаныч Фоменко:
SVM, ada, randomforest. Todo esto después del ejercicio con estos paquetes en el traqueteo. Y después de los paquetes de selección de predictores
Sam Sanych, yo también he practicado bastante con estos paquetes en el trabajo. ))) Sólo xGBoost no lo ha tocado todavía.
 
Vladimir Perervenko:

Pruébalos todos.

Mi favorito es randomForest en varias modificaciones (la principal ventaja es que no requiere preprocesar los datos de entrada. También ada - puntuación de calidad muy alta. Ambos tienen dos inconvenientes: tardan mucho en aprender y son muy propensos a sobreaprender.

Eso no significa que no haya que utilizarlos, sino que hay que tener en cuenta estas molestias.

Buena suerte

Tengo una pregunta sobre el artículo 1. Veo en el gráfico de emulación de operaciones que el algoritmo realiza operaciones en cada barra, ¿verdad?

Y una pregunta más. Al entrenar, ¿también alimentaste los datos de la máquina de cada barra?

El punto central que diferencia los problemas de series temporales de la mayoría de los demás problemas estadísticos es que en una serie temporal las observaciones no son independientes entre sí. Más bien, un único acontecimiento fortuito puede afectar a todos los puntos de datos posteriores. Esto hace que el análisis de las series temporales sea bastante diferente de la mayoría de las otras áreas de la estadística.

Debido a esta falta de independencia, los verdaderos patrones subyacentes a los datos de las series temporales pueden ser extremadamente difíciles de percibir mediante una inspección visual. Cualquiera que haya mirado el típico gráfico de los periódicos sobre las medias del mercado de valores ve tendencias que parecen prolongarse durante semanas o meses. Pero los estadísticos que han estudiado el tema coinciden en que esas tendencias se producen básicamente con la misma frecuencia que cabría esperar por azar, y que prácticamente no hay correlación entre el movimiento bursátil de un día y el del día siguiente. Si existiera tal correlación, cualquiera podría ganar dinero en la bolsa simplemente apostando a que la tendencia de hoy se mantendrá mañana, y simplemente no es tan fácil. De hecho, la acumulación de casi cualquier serie de números aleatorios dará lugar a un patrón que parece no aleatorio.

De:http://node101.psych.cornell.edu/Darlington/series/series1.htm

La cuestión, como supongo que la entiendes, es que un enfoque directo en el que todos los puntos de la serie temporal participan en el entrenamiento (y en las pruebas) crea observaciones mutuamente dependientes, lo que anula de un plumazo la validez de las conclusiones sobre los "patrones" encontrados. Sencillamente, no se puede confiar en los resultados, aunque todo lo demás se haga correctamente. Por lo tanto, crear una muestra de observaciones de una serie temporal que no viole los supuestos estadísticos es archivar. Muy a menudo este paso es simplemente ignorado en las fuentes populares, y las consecuencias son muy deplorables. La máquina no aprenderá los patrones.

 
Alexey Burnakov:

Tengo una pregunta sobre el artículo 1. Veo en el gráfico de emulación de operaciones que el algoritmo realiza operaciones en cada barra, ¿verdad?

Y una pregunta más. Al entrenar, ¿también alimentaste la máquina con datos de cada barra?

De:http://node101.psych.cornell.edu/Darlington/series/series1.htm

La cuestión, como supongo que la entiendes, es que un enfoque directo en el que todos los puntos de la serie temporal participan en el entrenamiento (y las pruebas) crea observaciones mutuamente dependientes, lo que de un plumazo pone en entredicho la validez de las conclusiones sobre los "patrones" encontrados. Sencillamente, no se puede confiar en los resultados, aunque todo lo demás se haga correctamente. Por lo tanto, crear una muestra de observaciones de una serie temporal que no viole los supuestos estadísticos es archivar. Muy a menudo este paso es simplemente ignorado en las fuentes populares, y las consecuencias son muy deplorables. La máquina no aprenderá los patrones.

Por la tarde.

que el algoritmo hace tratos en cada bar?

No. El algoritmo realiza operaciones sobre las señales recibidas en la última barra formada. ¿Quizá no entiendo la pregunta?

Una pregunta más. ¿Alimentaste al Asesor Experto con los datos de cada barra durante el entrenamiento?

No lo entiendo. ¿Quiere explicarlo? Intentaré responder.

Buena suerte

 
Alexey Burnakov:

Tengo una pregunta sobre el artículo 1. Veo en el gráfico de emulación de operaciones que el algoritmo realiza operaciones en cada barra, ¿verdad?

Y una pregunta más. Al entrenar, ¿también alimentaste la máquina con datos de cada barra?

De:http://node101.psych.cornell.edu/Darlington/series/series1.htm

La cuestión, como supongo que la entiendes, es que un enfoque directo en el que todos los puntos de la serie temporal participan en el entrenamiento (y las pruebas) crea observaciones mutuamente dependientes, lo que de un plumazo pone en entredicho la validez de las conclusiones sobre los "patrones" encontrados. Sencillamente, no se puede confiar en los resultados, aunque todo lo demás se haga correctamente. Por lo tanto, crear una muestra de observaciones de una serie temporal que no viole los supuestos estadísticos es archivar. Muy a menudo este paso es simplemente ignorado en las fuentes populares, y las consecuencias son muy deplorables. La máquina no aprenderá los patrones.

El artículo al que se refiere es sobre la regresión. Se trata de una clasificación. Son dos grandes diferencias...

Sigo sin entender su pregunta.

Buena suerte

 
Vladimir Perervenko:

El artículo al que se refiere es sobre la regresión. Se trata de una clasificación. Son dos grandes diferencias...

Sigo sin entender su pregunta.

Buena suerte

Una pregunta de pasada para todos los que participan en el debate. ¿Trabaja con datos de garrapatas? Hace tiempo que me alejé del análisis de barras, trabajo únicamente con métodos DSP
Razón de la queja: