Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3371

 
Forester #:

Estás malinterpretando la estufa. Parece que nunca has mirado el código de construcción del árbol.... Ahí no hay operaciones dentro de una sola fila en absoluto!!!, sólo con conjuntos (completos o lotes).

En resumen:
Un conjunto aleatorio/completo de filas pasado a entrenamiento, es ordenado uno a uno para cada predictor/columna. Se comprueban diferentes divisiones (media/percentil/aleatoria), se cuentan las estadísticas de cada una y se selecciona la mejor división para todo el conjunto de filas, no para una/cada fila como sugieres.
Según la mejor división, el conjunto de cadenas se divide en 2 conjuntos, luego cada conjunto se ordena de nuevo y se selecciona la mejor división para cada una de las partes, etc. hasta que se alcanza la regla de parada (por profundidad, número de ejemplos por línea, etc.)

Puedes ver más detalles en el editor, tienes el fichero:
\MQL5\Include\Math\Alglib\dataanalysis.mqh
Función ClassifierSplit() y aquella desde la que se llama.
Lo entenderás en un par de horas y no tendrás que hablar de buscar predictores por una línea.

Tienes razón en lo de muchas líneas.

Volvamos al principio: ¿qué es un patrón en un bosque aleatorio?

Es un árbol único. He aquí un ejemplo de uno de estos árboles de RF:

    left daughter right daughter split var split point status prediction
1               2              3         2  0.34154125      1          0
2               4              5         2  0.28238475      1          0
3               6              7         4  0.37505155      1          0
4               0              0         0  0.00000000     -1          2
5               8              9         5  0.64235664      1          0
6               0              0         0  0.00000000     -1          2
7              10             11         1  0.45438075      1          0
8              12             13         1  0.46271469      1          0
9              14             15         3  0.25803691      1          0
10             16             17         2  0.51942328      1          0
11             18             19         1  0.48839881      1          0
12             20             21         3  0.45243581      1          0
13              0              0         0  0.00000000     -1          2
14              0              0         0  0.00000000     -1          2
15             22             23         6  0.62789488      1          0
16             24             25         2  0.34224983      1          0
17             26             27         4  0.53845361      1          0
18             28             29         3  0.39207978      1          0
19             30             31         3  0.03596312      1          0
20             32             33         7  0.49380156      1          0
21              0              0         0  0.00000000     -1          2
22              0              0         0  0.00000000     -1          2
23             34             35         6  0.76472904      1          0
24              0              0         0  0.00000000     -1          1
25              0              0         0  0.00000000     -1          2
26             36             37         5  0.87588550      1          0
27             38             39         1  0.31089209      1          0
28             40             41         2  0.39193398      1          0
29             42             43         1  0.47068628      1          0
30             44             45         7  0.76420940      1          0
31             46             47         2  0.38380954      1          0

 [ reached getOption("max.print") -- omitted 185 rows ]

Total de filas = ¡166+185! Todos ellos no encajaban

Hay 150 árboles de este tipo en mi modelo

split var - это номер переменной, всего их в модели 8
split point - лучшее значение конкретной переменной, которое использовалось для разделения.
 
СанСаныч Фоменко #:

Tienes razón en lo de las muchas líneas.

Volviendo al principio: ¿qué es un patrón en un bosque aleatorio?

Es un árbol único. He aquí un ejemplo de uno de estos árboles de RF:

Total de filas = ¡166+185! Ninguna de ellas encaja

Hay 150 árboles de este tipo en mi modelo

Consideremos de nuevo el camino que forma la hoja. En mi ejemplo anterior hay 5 divisiones. ¿No es esto una descripción del patrón de 2 vértices con una depresión? Descripción.
7 divisiones pueden describir cabeza hombros etc.
Cada hoja de un árbol describe un patrón diferente.

El bosque es la opinión de la multitud (derviews).
El 1er árbol dice: esta cadena cae en mi 18º patrón/hoja y respuesta = 1
2º: la misma cadena cae en mi 215º patrón/hoja y da respuesta=0
3º: = 1

...

Hacemos la media y obtenemos la opinión media de 150 árboles. Por ejemplo = 0,78. Cada uno tenía un patrón/hoja activado diferente.

 
Forester #:

Consideremos de nuevo la hoja de formación de trayectorias. En mi ejemplo anterior hay 5 divisiones. ¿No es eso una descripción del patrón de 2 cimas con una depresión? Descripción.
7 divisiones pueden describir cabezas hombros etc.
Cada hoja de un solo árbol describe un patrón diferente.

Un bosque es la opinión de una multitud de derviches.
El 1er árbol dice: esta línea cae en mi 18º patrón/hoja y respuesta = 1
2º: la misma línea cae en mi 215º patrón/hoja y da respuesta=0
3º: = 1

...

Hacemos la media y obtenemos la opinión media de 150 árboles. Cada uno tenía un patrón/hoja activado diferente.

No sabemos cuántas hojas.

El número de árboles es un parámetro que puede modificarse para obtener el tamaño mínimo de muestra para el entrenamiento.

Vemos que 50 árboles son suficientes, por lo que es conveniente considerar un árbol como un patrón.

 
СанСаныч Фоменко #:

Se desconoce el número de hojas.

El número de árboles es un parámetro que puede modificarse para obtener el tamaño de muestra mínimo para el entrenamiento.

Vemos que 50 árboles son suficientes, por lo que es conveniente considerar un árbol como un patrón.

El árbol responde a cada situación/fila con una hoja/patrón. En otras situaciones la respuesta será de otras hojas/patrones.
 
Forester #:
El árbol responde a cada situación/línea con una hoja/patrón. En otras situaciones la respuesta será de otras hojas/patrones.

Parece que no sólo la hoja, sino también el árbol no resuelve nada.

Aquí encontré la fórmula para el clasificador final




Donde

  • N - número de árboles;
  • i - contador de árboles;
  • b - el árbol decisivo;
  • x - la muestra que generamos a partir de los datos.

También cabe señalar que para la tarea de clasificación elegimos la solución por mayoría, mientras que en la tarea de regresión elegimos la solución por media.

 
СанСаныч Фоменко #:

Parece que no sólo la hoja, sino también el árbol no resuelven nada.

Aquí está la fórmula para el clasificador final

También vale la pena señalar que para la tarea de clasificación elegimos la solución por mayoría, mientras que en la tarea de regresión elegimos la solución por promedio.

¿Por qué no resuelve? Contribuye (1/150) a la respuesta final.

De cada árbol participa en la votación (media) una de las hojas/patrones activados.

La respuesta del bosque es la media de las respuestas de todos los árboles (u hojas/patrones activados) - esta fórmula la cuenta. La mayoría para la clasificación binaria será si la media es >0.5, entonces 1, de lo contrario 0.
Pero la frontera de 0.5 probablemente no es la mejor opción, si el paquete da acceso al valor de la media, puedes experimentar con diferentes fronteras.

 
Forester #:
El árbol responde a cada situación/línea con una hoja/patrón. En otras situaciones la respuesta será de otras hojas/patrones.
SanSanych Fomenko #:

Parece que no sólo hoja, sino también árbol no resuelve nada.

No solo una hoja sino todos los árboles son responsables de cada situación, solo que no todos se activan, la suma de previsiones de los que se activan es la previsión del modelo....


¿De qué demonios estáis hablando, expertos en modelos arbóreos?

 
mytarmailS #:

No una hoja, sino todos los árboles son responsables de cada situación, sólo que no todos se activan, la suma de las previsiones de los que se activan es la previsión del modelo.


¿De qué demonios estáis hablando, expertos en modelos de árboles?

¿Habéis dicho algo nuevo? Si no es así, entonces, según sus cálculos, también es basura.
 
mytarmailS #:


¿Tienes alguna experiencia con LigthGBM?

 
СанСаныч Фоменко #:

¿Tienes alguna experiencia con LigthGBM?

¿Alguna vez has hecho algo, por qué?

Razón de la queja: