Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1236
Queridos silvicultores. ¿Es necesario hacer un balance de clases para árboles y bosques (igualar el número de ejemplos de diferentes clases)?
No
No
Estoy leyendo: Flach P. - Machine Learning. La ciencia y el arte de construir algoritmos que extraen conocimiento de los datos - 2015
Allí hay varias páginas dedicadas a este tema. Esta es la conclusión:
El punto 1 señalado dice que el equilibrio es útil.
Pero también está el punto 2. Del que podemos concluir que con una muestra grande, cuando hay suficientes ejemplos de una clase pequeña, entonces la muestra para ella se convertirá en representativa. Y entonces el equilibrio es innecesario.
¿Cuántos ejemplos pueden considerarse representativos de BP?
Y luego está el para. 3. Pero es difícil saber si existe tal corrección en la implementación particular del árbol en el programa elegido para usar.
El punto 1 señalado dice que el equilibrio es útil.
Pero también está el punto 2. Del cual podemos concluir que con una muestra grande, cuando hay suficientes ejemplos de una clase pequeña, entonces la muestra para esa clase se volverá representativa. Y entonces el equilibrio es innecesario.
Y luego está el para. 3. Pero es difícil saber si existe tal corrección en la implementación particular del árbol en el programa elegido para usar.
En mi opinión, el aftar está afirmando la ley de los grandes números para MO.
Evidentemente, si tiene 10 observaciones en la primera clase y 6 en la segunda, añadir 4 en la segunda cambiará el modelo (no necesariamente lo mejorará), pero seguirá sin ser representativo.
¿Cuántos ejemplos pueden considerarse representativos de BP? Normalmente no uso menos de 10000, la clase pequeña debe tener al menos 1000
Sí, sólo estaba mirando los ejemplos de 10 vs 8:2 vs 6:4. Pero tenemos muchos datos.
¿Cuántos ejemplos pueden considerarse representativos de BP?
HZ. He tomado el máximo, pero he trabajado con datos diarios de árboles y bosques, un mínimo de 2 años.
Pregúntale a A_K - utilizó la desigualdad de Chebyshev para determinar el óptimo (si no recuerdo mal), pero sólo para variables continuas.
Intenta partir del número de variables, al menos 100 para cada una.
En general, si se trata de encontrar un patrón "perpetuo", cuantos más sean, mejor. Si el "patrón" es flotante, hay que buscar la ventana óptima.
Aunque iremos añadiendo en miles, y entonces el modelo también puede cambiar.
Y tal vez tenga razón. El mercado, como se dice, está cambiando, así que dejemos que el modelo cambie también.
Aunque haremos adiciones por miles, y entonces el modelo podría cambiar también.
¿Utilizas madera para ello?
Todavía no lo uso, pero me estoy preparando para hacerlo. Todavía estoy leyendo la teoría para entender sus pros y sus contras. No estoy satisfecho con los resultados, así que decidí trabajar con el bosque. Me parece que es más adecuado para la BP.
Para el análisis de BP, con el fin de ganar dinero.
Todavía no lo uso, pero me estoy preparando para hacerlo. Todavía estoy leyendo la teoría para entender sus pros y sus contras. No estoy satisfecho con los resultados, así que decidí dedicarme a la silvicultura. Me parece que es más adecuado para la BP.
Hace dos años escribí aquí Maximka que el NS es un juguete como una bomba nuclear. Que si CUALQUIER otro modelo da resultados al menos satisfactorios, no es recomendable usar NS - encuentran algo que no existe y no se puede hacer nada al respecto.
Los árboles son una buena cosa, pero es mejor usar andamios.