Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3189

 
Aleksey Nikolayev #:

Idear un esquema de cálculo simplificado para las simulaciones.

Para tener cierta confianza (no absoluta) en el significado, el resultado de los datos reales debería caer al menos en la cola del 5% de la muestra (izquierda o derecha). Pero la muestra debería ser de varios miles como mínimo.

Si cambio las condiciones del experimento, a las siguientes:

1. En la muestra original encontramos segmentos cuánticos, que se supone que se utilizarán en el futuro, como resultado se forma una tabla cuántica - más adelante trabajamos sólo con ella.

2. Aleatoriamente generamos una de destino con los mismos parámetros que la original - 1000 ciclos.

3. 3. Contar cuántos segmentos cuánticos se seleccionan en comparación con la variante original. Pueden ser los mismos o menos.

4. Evalúe a través de la desviación estándar. Si la desviación es pequeña, entonces los objetivos aleatorios tienen muchas posibilidades de entrar en los segmentos cuánticos seleccionados.

¿Qué te parece?

 
Aleksey Nikolayev #:

Bueno, y otro añadido no del todo científico: el indicador recogido en la muestra debe correlacionarse de algún modo con los beneficios. La distinción de la SB sobre la base de una característica completamente de izquierda no tiene sentido, IMHO.

Es decir, ¿cambiar el objetivo para que el beneficio fuera comparable al original? No estoy muy seguro de lo que se quería decir.

 
Maxim Dmitrievsky #:
Es la línea de meta. ¿Qué hay que criticar?). ¿Te diste cuenta de lo que hiciste y por qué? Si lo hiciste, ¿por qué lo preguntaste en el foro?)

Veo algunos intentos de poner los números que quedan después de los esfuerzos anteriores en alguna parte.

Ahora se trata de que no entiendes lo que estoy haciendo, y puedo verlo mientras evalúo los comentarios sobre preguntas y afirmaciones de tu parte.

Cuando lo entiendas volveremos al diálogo.

 
Aleksey Vyazmikin #:

Ahora se trata de que no entiendes lo que hago, y me resulta obvio al evaluar los comentarios sobre preguntas y afirmaciones de tu parte.

Cuando lo entiendas, volvamos al diálogo.

Estás buscando secuencias diferentes a las de sb. No encontrarás ninguna.

Eso es porque nadie lo ha hecho. Basta con calcular la entropía por signos de incrementos y no sufrir gilipolleces.
 
Aleksey Vyazmikin #:

Si cambio las condiciones del experimento por las siguientes:

1. En la muestra original encontramos segmentos cuánticos, que se supone que se utilizarán más adelante, como resultado se forma una tabla cuántica - más adelante trabajamos sólo con ella.

2. 2. Generamos aleatoriamente un objetivo con los mismos parámetros que el original - 1000 ciclos.

3. Contar cuántos segmentos cuánticos se seleccionan en comparación con la variante original. Pueden ser los mismos o menos.

4. Estimar a través de la desviación estándar. Si la dispersión es pequeña, los objetivos aleatorios tienen muchas posibilidades de entrar en los segmentos cuánticos seleccionados.

¿Qué te parece?

Relaciónalo de alguna manera con el beneficio, al menos aproximadamente, y compara el beneficio real con una muestra de beneficios aleatorios. Comprueba que no hay errores es igualdad del beneficio medio de la muestra a cero. Comprobar la importancia de la positividad del beneficio real con respecto a la muestra: la regla de las tres sigmas.

No estoy dispuesto a entrar en detalles de su tarea, ya que mis propias tareas están demasiado ocupadas.

 
Aleksey Vyazmikin #:

Es decir, ¿cambiar el objetivo para que el beneficio sea comparable al original? No estoy seguro de lo que se quería decir.

¿Sus cuantos están diseñados para obtener beneficios? ¿Existe un esquema para ello? Hágalo extremadamente simplista para que pueda calcular, aunque sea de forma aproximada, una muestra rápida y compruebe si el resultado real coincide con la cola de esa muestra.

Tu voluntad de exigir a la gente que profundice en tu forma de pensar, acompañada de tu total falta de voluntad para profundizar en ideas sencillas y ampliamente conocidas como Montecarlo, es cansina.

Creo que ya he tenido bastante.

 
Aleksey Nikolayev #:

Es cansina tu voluntad de exigir que la gente se meta en tu mentalidad, acompañada de tu absoluta falta de voluntad para meterte en ideas sencillas y ampliamente conocidas como Montecarlo.

Creo que ya he tenido suficiente.

Yo no podría haberlo dicho mejor.
Hace tiempo que me di cuenta de que la petaca silbaba.
Ignorarlo es la mejor solución. Estarás más sano por ello.
 
Maxim Dmitrievsky #:
Busca secuencias diferentes de las de sb. No encontrará ninguna.

Eso es porque nadie lo ha hecho. Basta con calcular la entropía por signos de incrementos y no sufrir gilipolleces.

Sobre la secuencia estricta escribí sólo como ejemplo para mayor claridad. Y, escribí que la solución de este problema puede mejorar la estabilidad del modelo. Pero la solución puede ser diferente.

Incluso sin resolver el problema antes mencionado - la selección de la tabla cuántica correcta mejora el aprendizaje, que fue probado por mí en docenas de muestras.

Luego mostré cómo se puede hacer rápidamente el preprocesamiento para la formación, la limpieza de la muestra de datos inconsistentes. Usted puede ver en los gifs que incluso se puede obtener un modelo rentable en los nuevos datos con este método.

En definitiva, el método funciona, su desarrollo es mi objetivo.

Así que decir que no funciona es negar la realidad.

No creo que el precio esté en forma de SB pura, cuya naturaleza no se pueda analizar al menos parcialmente. Si es pura SB, entonces toda la rama es un error.

 
Aleksey Nikolayev #:

Relaciónalo de algún modo con el beneficio, al menos aproximadamente, y compara el beneficio real con una muestra de beneficios aleatorios. La comprobación de que no hay errores es que el beneficio medio de la muestra es igual a cero. Comprueba la importancia de la positividad del beneficio real en relación con la muestra: la regla de los tres sigma.

No estoy dispuesto a entrar en detalles sobre su tarea, ya que mis propias tareas están demasiado ocupadas.

¿Qué tiene que ver el beneficio cuando hablamos de preprocesamiento de datos para su posterior clasificación?

Aleksey Nikolayev #:

¿Están sus cuantos diseñados para la extracción de beneficios? ¿Existe algún esquema para ello? Hacer su simplificación extrema para calcular incluso aproximadamente pero rápidamente una muestra y comprobar si el resultado real cae en la cola de esta muestra.

Su voluntad de exigir a la gente que profundice en su forma de pensar, acompañada de su total falta de voluntad para profundizar en ideas simples y ampliamente conocidas como Montecarlo, es cansina.

Creo que ya he tenido bastante.

Todo el mundo tiene derecho a gestionar su propio tiempo.

Pero, por lo visto, no has entendido la pregunta sobre la que me has aconsejado.

Gracias por intentar ayudar.

 
Aleksey Vyazmikin #:

Entiendo.

Tengo otra sugerencia para usted, ¿y si para hacer más manejable el proceso de construcción del bosque, y tomar como raíz para cada árbol una submuestra concreta del segmento cuántico seleccionado?

La profundidad debería ser de 2-3 splits, de forma que los ejemplos de clase clasificable por hoja no fueran inferiores al 1%.

Creo que el modelo será más estable.

Es decir, si seleccionas 10 cuantos/splits, entonces entrenas 10 árboles en ejemplos de estos splits? Parece simple de hacer.
Acerca de la estabilidad en OOS - experimento mostrará. Mi estabilidad se viola cuando se cambia el tamaño de la ventana de datos (2 meses y 4) y cuando se desplaza incluso en un 2% (formación el martes en lugar del sábado). Los árboles resultan ser diferentes.

Aleksey Vyazmikin #:

Hice un experimento con la muestra en la que publiqué los gifs, ya hay 47% unidades en la muestra, los datos se resumieron en la tabla.

...
resultó que la calidad (utilidad) de estos segmentos cuánticos es peor (menos) que los originales en 10 veces.

Sobre tal deterioro (en tiempos) supuse, cuando me comuniqué con fxsaber, sobre la mezcla por su algoritmo. Él no tiene una diferencia tan fuerte en sus datos. Al parecer, porque él no tiene todas las barras en una fila en el marcado (o filas de pie en una fila), pero con grandes lagunas. Si sus barras están juntas, tienen un pasado y un futuro muy similares, es decir, 20 ejemplos de la clase 1 pueden estar en una fila. Al aleatorizarlas, haces que tengan una media de 0101010...., y debes cambiar toda la serie de 20 "1" por 20 "0". Ya que están cerca y se pueden contar como un ejemplo. Si no es así para ti, lo es para mí (evalúo todas las barras seguidas, por eso surgió esta idea).

En general, creo que con una diferencia tan fuerte de 10 veces, es posible no hacer 10000 pruebas. Demasiado clara la diferencia en las 10 primeras pruebas (todas peores) como para suponer que otras 10000 elevarán el resultado a la igualdad con el original. Si fueron 3 peores, 3 mejores, 4 más o menos iguales, entonces sí - sigue acumulando estadísticas.

Si los datos están serializados, el problema es que una serie de 20 1 en algún lugar de la historia encontrará una serie de 20 0 con un pasado similar. Aquí se trata de aleatorización del mercado. No en convertir 111111111 en 010101010.

UPD Así que creo que Monte Carlo en la forma de 01010101 para datos de mercado no funcionará para datos de mercado (si va en serie). Es como dividir un rectángulo y un cuadrado en cuadrados iguales y luego tratar de determinar a qué figura primaria pertenecía el cuadrado)).