Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3187

 
Aleksey Nikolayev #

Forester#:

Hice un experimento con la muestra sobre la que publiqué los gifs, ya hay un 47% de unidades en la muestra, los datos están resumidos en una tabla.


Descripción del contenido de las columnas:

  • Generación - el número de generación aleatoria del objetivo con un número fijo de "1" y "0", la última línea - el objetivo original.
  • % Similitud de todos - se especifica el porcentaje de similitud del objetivo.
  • % Similitudes "1" - se especifica el porcentaje de similitud del objetivo, pero sólo para la respuesta "1".
  • % Similitud "0" - se especifica el porcentaje de similitud del objetivo, pero sólo para una respuesta "0".
  • Q_All - cuántos segmentos cuánticos totales se encontraron usando 870 tablas cuánticas y 6533 predicados.
  • Q_All% - cuántos "Q_All" como porcentaje de la muestra con el objetivo original
  • Q muestreados - muestra cuántos segmentos cuánticos se muestrearon (sólo se muestrean los que no se solapan en el rango)
  • Q seleccionado% - cuántos "Q seleccionados" en expresión porcentual de la muestra con objetivo original.
  • Predictors - para cuántos predictores de la muestra fue posible encontrar un segmento cuántico que cumpliera los criterios dados
  • Predictores % - cuántos "Predictores" en porcentaje de expresión de la muestra con el objetivo original.

Me explico: para un predictor se puede seleccionar más de un segmento cuántico en total, y estos segmentos no deben solaparse en el rango del valor del predictor.

Lo que no me gusta es que en la vecindad del 50% de los objetivos se dejen en su sitio, lo que puede afectar negativamente a la evaluación del resultado.

De hecho, resulta que se encontraron bastantes segmentos cuánticos en objetivos aleatorios, pero al tratarse de algunos clusters (presumiblemente), diferentes tablas solaparon sus coordenadas, por lo que tras seleccionar rangos no solapados, resultó que la calidad (utilidad) de estos segmentos cuánticos es peor (menor) que la de los originales por un factor de 10. En consecuencia, en promedio, en la muestra con el objetivo original, se encontraron más cortes cuánticos para diferentes predictores en 3,5 veces.

¿Qué opina de los resultados?

Añadido:

El gráfico de la secuencia binaria del objetivo aleatorio y el original tiene este aspecto


 
Aleksey Vyazmikin #:

He realizado un experimento con la muestra sobre la que he publicado los gifs, ya hay un 47% de unidades en la muestra, los datos se resumen en la tabla.


Descripción del contenido de las columnas:

  • Generación - el número de generación aleatoria del objetivo con un número fijo de "1" y "0", la última línea - el objetivo original.
  • % Similitud de todos - se especifica el porcentaje de similitud del objetivo.
  • % Similitudes "1" - se especifica el porcentaje de similitud del objetivo, pero sólo para la respuesta "1".
  • % Similitud "0" - se especifica el porcentaje de similitud del objetivo, pero sólo para una respuesta "0".
  • Q_All - cuántos segmentos cuánticos totales se encontraron usando 870 tablas cuánticas y 6533 predicados.
  • Q_All% - cuántos "Q_All" como porcentaje de la muestra con el objetivo original
  • Q muestreados - muestra cuántos segmentos cuánticos se muestrearon (sólo se muestrean los que no se solapan en el rango)
  • Q seleccionado% - cuántos "Q seleccionados" en expresión porcentual de la muestra con objetivo original.
  • Predictors - para cuántos predictores de la muestra fue posible encontrar un segmento cuántico que cumpliera los criterios dados
  • Predictores % - cuántos "Predictores" en porcentaje de expresión de la muestra con el objetivo original.

Me explico: para un predictor se puede seleccionar más de un segmento cuántico en total, y estos segmentos no deben solaparse en el rango del valor del predictor.

Lo que no me gusta es que en la vecindad del 50% de los objetivos se dejen en su sitio, lo que puede afectar negativamente a la evaluación del resultado.

De hecho, resulta que se encontraron bastantes segmentos cuánticos en objetivos aleatorios, pero al tratarse de algunos clusters (presumiblemente), diferentes tablas solaparon sus coordenadas, por lo que tras seleccionar rangos no solapados, resultó que la calidad (utilidad) de estos segmentos cuánticos es peor (menor) que la de los originales por un factor de 10. En consecuencia, en promedio, en la muestra con el objetivo original, se encontraron más cortes cuánticos para diferentes predictores en 3,5 veces.

¿Qué opina de los resultados?

Pregunta para Alexei. No soy experto en teoría estadística. Sólo sugerí mezclar el objetivo en lugar de la generación.
 
Forester #:
Pregunta para Alexei. No soy bueno en teoría estadística. Sólo sugerí mezclar el objetivo en lugar de la generación.

Ya veo.

Tengo otra sugerencia para ti, ¿y si hacemos más manejable el proceso de construcción del bosque, y tomamos una submuestra específica del segmento cuántico seleccionado como raíz para cada árbol?

Hacer la profundidad alrededor de 2-3 divisiones, de modo que los ejemplos de clase clasificable por hoja sería de al menos 1%.

Creo que el modelo será más estable.

 
Aleksey Vyazmikin #:

He realizado un experimento con la muestra sobre la que he publicado los gifs, ya hay un 47% de unidades en la muestra, los datos se resumen en la tabla.


Descripción del contenido de las columnas:

  • Generación - el número de generación aleatoria del objetivo con un número fijo de "1" y "0", la última línea - el objetivo original.
  • % Similitud de todos - se especifica el porcentaje de similitud del objetivo.
  • % Similitudes "1" - se especifica el porcentaje de similitud del objetivo, pero sólo para la respuesta "1".
  • % Similitud "0" - se especifica el porcentaje de similitud del objetivo, pero sólo para una respuesta "0".
  • Q_All - cuántos segmentos cuánticos totales se encontraron usando 870 tablas cuánticas y 6533 predicados.
  • Q_All% - cuántos "Q_All" como porcentaje de la muestra con el objetivo original
  • Q muestreados - muestra cuántos segmentos cuánticos se muestrearon (sólo se muestrean los que no se solapan en el rango)
  • Q seleccionado% - cuántos "Q seleccionados" en expresión porcentual de la muestra con objetivo original.
  • Predictors - para cuántos predictores de la muestra fue posible encontrar un segmento cuántico que cumpliera los criterios dados
  • Predictores % - cuántos "Predictores" en porcentaje de expresión de la muestra con el objetivo original.

Me explico: para un predictor se puede seleccionar más de un segmento cuántico en total, y estos segmentos no deben solaparse en el rango del valor del predictor.

Lo que no me gusta es que en la vecindad del 50% de los objetivos se dejen en su sitio, lo que puede afectar negativamente a la evaluación del resultado.

De hecho, resulta que se encontraron bastantes segmentos cuánticos en objetivos aleatorios, pero al tratarse de algunos clusters (presumiblemente), diferentes tablas solaparon sus coordenadas, por lo que tras seleccionar rangos no solapados, resultó que la calidad (utilidad) de estos segmentos cuánticos es peor (menor) que la de los originales por un factor de 10. En consecuencia, en promedio, en la muestra con el objetivo original, se encontraron más cortes cuánticos para diferentes predictores en 3,5 veces.

¿Qué opina de los resultados?

Añadido:

El gráfico de la secuencia binaria del objetivo aleatorio y el original tiene este aspecto


Diez simulaciones no es nada, se necesitan miles para la significación estadística.

Tampoco estoy dispuesto a dar una opinión experta sobre un caso en particular, sólo he señalado posibles problemas y formas comunes de resolverlos.

 
Aleksey Vyazmikin #:

¿Qué opina de los resultados?

Añadido:

El gráfico de secuencia binaria del objetivo aleatorio y el original tiene este aspecto

Estas haciendo una tonteria sin sentido e implacable. A Saber al menos le pasó en media hora y se olvidó.
 
Aleksey Nikolayev #:

Diez simulaciones no son nada, se necesitan miles para la significación estadística.

Tampoco estoy dispuesto a dar una opinión experta sobre un caso concreto, sólo he señalado posibles problemas y formas habituales de resolverlos.

Miles - se necesitan demasiados recursos informáticos - una pasada - unos 40 minutos - cálculo básico en una tarjeta de vídeo.

En general, pensé que esta prueba sólo le permite comprobar la posibilidad de tales grupos en diferentes rangos del predictor.

Y es necesario mirar a la probabilidad de golpear un rango particular del segmento cuántico, que ya ha sido seleccionado inicialmente.

Y todavía me gustaría escuchar la opinión sobre la cuestión de la diferencia del objetivo en la expresión porcentual para la fiabilidad de dicha prueba.

 
Maxim Dmitrievsky #:
Estás haciendo tonterías sin sentido y sin descanso. A Saber al menos le pasó en media hora y se olvidó del tema.

Guárdate para ti tus valoraciones sobre la actuación de los demás, sobre todo cuando no entiendes lo que hace la otra persona.

Estoy abierto a la crítica constructiva, y no hay ninguna viniendo de ti.

 
Aleksey Vyazmikin #:

Guárdate para ti las evaluaciones del rendimiento de los demás, sobre todo cuando no entiendas lo que hace la otra persona.

Yo estoy abierto a la crítica constructiva, y tú no.

Estás haciendo gilipolleces. Se ha escrito varias veces que obtendrás CUALQUIER resultado al azar. Abre los ojos para ver. Nada que añadir :)

¿Puedes al menos entender lo que estás haciendo y por qué)?
 
Maxim Dmitrievsky #:
Estás diciendo tonterías. Se ha escrito varias veces que obtendrás CUALQUIER resultado al azar. Abre los ojos para ver. Nada que añadir :)

Si usted piensa que el mercado es al azar, entonces ¿por qué estás perdiendo el tiempo - cualquier modelo no funcionará, excepto por casualidad.

 
Aleksey Vyazmikin #:

Si crees que el mercado es aleatorio, entonces para qué perder el tiempo: cualquier modelo no funcionará, salvo por casualidad.

No creo que sea aleatorio, es aleatorio. No es diferente de un sb.

No sólo no verás la diferencia, sino que no entiendes lo que estás haciendo.
Razón de la queja: