Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 86

 
Mihail Marchukajtes:

Bien, digamos que lo mezcló y lo redujo a la mitad, entonces el número de ambas clases será el mismo en las muestras de entrenamiento y de prueba, ¿no es así?

Si el número de ejemplos de ambas clases en la muestra no era el mismo, entonces no serán iguales en la parte de la prueba. Sólo los ejemplos de la clase menos representativa se reducirán a la mitad: la mitad de ellos estarán en la parte de entrenamiento y la otra mitad en la parte de prueba. En la parte didáctica habrá exactamente tantos ejemplos de la clase más representativa como de la menos representativa. Y los ejemplos restantes de la clase más representativa, que no se incluyen en la parte de formación, se incluirán en la parte de prueba.

La cuestión es que en las versiones anteriores no había ningún tipo de equilibrio. La muestra se mezcló por MSRP y se dividió trivialmente en dos partes: una mitad de las muestras se utilizó en el entrenamiento y la otra mitad en la parte de prueba. Entonces me encontré con una muestra en la que los ejemplos de ambas clases estaban muy desequilibrados. Resulta evidente que la clase más representativa obtuvo excelentes resultados en cuanto a la generalizabilidad, mientras que la clase poco representativa se situó por debajo del zócalo. Tuve que añadir un equilibrio al algoritmo de separación para deshacerme de esos valores atípicos.

 
No... está bien.... falsa alarma :-)
 
SanSanych Fomenko:
El modelo se vuelve a entrenar porque la lista de predictores no se ha limpiado de predictores de ruido. Este es un ejemplo de entrenamiento y está hecho como tal deliberadamente. Por eso lo digo con tanta seguridad.

He pensado en ello.
El bosque recuerda datos, eso es un hecho, y con más árboles tendrá más "capacidad de memoria" para recordar. Pero si incluso con un número suficiente de árboles no se consigue una precisión del 100%, significa que hay ejemplos inconsistentes en los datos de entrenamiento. Hay algunos conjuntos de ejemplos de entrenamiento, en los que los valores de los predictores son exactamente los mismos, pero tienen clases diferentes. Estos datos nunca pueden predecirse al 100%, ni siquiera con datos de entrenamiento. Por lo tanto, el modelo ni siquiera puede aprender completamente, sólo le faltan datos y, por lo tanto, tiene menos posibilidades de reentrenamiento.
La incoherencia en los ejemplos de entrenamiento ni siquiera se debe a un error, sino a la eliminación de un predictor que permitiría una precisión del 100%. Pero sin ella las predicciones sobre los nuevos datos serán mejores.
Regla muy interesante, podemos utilizarla para hacer algún método sencillo de preestimación del conjunto de predictores para descartar algunos conjuntos antes del entrenamiento y la validación cruzada de los modelos.

 

¡Hola!

1) ¿Alguien ha probado alguno de los anteriores? ¿Algún resultado?

2) ¿Alguien ha intentado probar estrategias directamente en R? Necesito simular el trading en R-ka de forma bastante primitiva, pero hay stops y otras cositas, ¿hay alguna herramienta que lo haga lo más sencillo y rápido posible?

 
Yury Reshetov:

¿Dónde puedo obtener volúmenes reales como datos históricos? MetaTrader sólo proporciona un medidor de ticks, que se llama "volúmenes". Además, los valores de estos contadores pueden diferir en órdenes de magnitud en diferentes cocinas.

...

Los volúmenes de las garrapatas difieren no sólo en las distintas cocinas, sino incluso en una sola. A veces se puede ver un paso, aquí había un flujo denso, entonces bam fue un flujo escaso.

Esto se debe a un cambio de filtro de teca en el interior del dilling.

Pregunta interesante: hay una correlación entre los volúmenes reales y los volúmenes de los ticks, y hay una correlación entre los volúmenes de los ticks y el tamaño de las barras.

 
Nikolay Demko:

¿significa esto que hay una correlación entre los volúmenes reales y el tamaño de las barras?

por supuesto
 
mytarmailS:
por supuesto
Cuál es la colocación entre el volumen y la barra. El volumen puede ser alto y el cuerpo de la vela no está, así que es lo mismo en el oborod. El volumen es pequeño y la vela subió.... todo depende de las condiciones del mercado en el momento de la comercialización....
 
Mihail Marchukajtes:
¿Qué significa la correlación entre el volumen y la barra? El volumen puede ser alto y el cuerpo de la vela está ausente, lo mismo ocurre con la barra. El volumen es pequeño y la vela ha crecido.... todo depende de las condiciones del mercado en el momento de la comercialización....

:)

Creía que estábamos hablando de mercados de gran liquidez, que son los de futuros y divisas, no creo que nadie esté negociando penaltis.

http://prntscr.com/c10p51

La Fig. muestra la correlación en una ventana deslizante de 100, volatilidad frente a volumen, según recuerdo, un valor superior a 0,6 se considera una correlación positiva significativa

Скриншот
Скриншот
  • prnt.sc
Снято с помощью Lightshot
 
mytarmailS:

Quizás a alguien le interese, he encontrado un paquete que puede simular el trading y construir sistemas de trading llamado quantstrat

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf

Lo volveré a publicar, tal vez se me haya pasado.

y otro enlace útilhttp://www.r-programming.org/papers

¿o nadie está interesado en estos paquetes? si no, ¿por qué? tengo curiosidad por saber cómo y dónde se prueban los modelos

 
mytarmailS:

Lo volveré a publicar, tal vez se me haya pasado volando

y otro enlace útilhttp://www.r-programming.org/papers

¿o nadie está interesado en estos paquetes? si no, ¿por qué? tengo curiosidad por saber cómo y dónde se prueban los modelos

Todos los paquetes (modelos) pueden dividirse en dos categorías:

  • bueno en principio
  • en principio no es bueno

El rendimiento de los paquetes que son "básicamente buenos" es más o menos el mismo, las diferencias no son sustanciales.

El problema no está en el modelo, sino en el conjunto de predictores y su precondición. Si tomamos algún conjunto de predictores, la posibilidad de construir un modelo NO sobreentrenado, así como la magnitud del error depende poco del cambio en el modelo. Por lo tanto, hay que tomar el modelo más sencillo y rápido de los que "en principio encajan".

PS.

Por mi propia experiencia. En mi caso, más del 75% de la mano de obra en la construcción de TS - es la selección de predictores, si es que se logra encontrar un conjunto de este tipo para una variable objetivo en particular.

Razón de la queja: