Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 555

 
Maxim Dmitrievsky:

así que no sé qué creer en esta vida... hay que comprobarlo todo dos veces.


Los puntos de referencia son la salvación)))

Diversas conversiones y cortes. La de arriba son los datos en bruto.

train = muestra rms con sql ligero. test = OOS. time = tiempo rms en seg.


 
En cuanto a las emisiones en los conjuntos de datos, el mercado podría utilizar este método.
 

A veces me pregunto desde este foro. Todo está tranquilo y aburrido. Y de repente aparecen algunos como Vladimir o Vizard_ o el más sospechoso podotr y empiezan a dar clases magistrales. ¿Quiénes son? Todos, por favor, muestren los pasaportes y los diplomas de educación. :))))

 
SanSanych Fomenko:

Sólo deben utilizarse los predictores que TIENEN RELACIÓN con la variable objetivo. No importa si "linealmente" o "no linealmente" no tiene nada que ver con la expresión "tener una relación".

esto y todo lo demás en el texto está claro, pero ¿qué tiene que ver la correlación del atributo con el objetivo en un modelo inherentemente no lineal?

Escribí sobre por qué es necesario en el modelo de regresión, pero no en la clasificación, porque no es el objetivo sino las clases... profundiza en lo que estoy escribiendo :)

 
Maxim Dmitrievsky:

esto y todo lo demás en el texto está claro, pero ¿qué tiene que ver la correlación del atributo con el objetivo en un modelo inherentemente no lineal?

y escribí por qué es necesario en el modelo de regresión, pero no en la clasificación, porque no es el objetivo, pero las clases ... leer más profundamente lo que estoy escribiendo :)


No necesito leer más profundamente: te entiendo perfectamente, pero tú no me entiendes en absoluto.

Escribo sobre el sobreentrenamiento (overfitting): es el principal enemigo de todos los modelos de clasificación. El comportamiento de los modelos sobreajustados NO se determina en el futuro.

Para combatir este mal total, veo dos herramientas:

1. eliminar el conjunto de predictores de entrada del ruido

2. pruebas cuidadosas.

Todo esto lo escribo en base a mis propios cálculos, te aseguro que de un volumen muy grande, que he estado haciendo durante más de un año.

Me da pereza buscar y luego formar un psot legible, ya que no tengo ningún propósito de convencer a nadie de nada.


PS.

Sigues insistiendo en la inocuidad e incluso utilidad de los predictores de ruido, no eres el primero, hay mucha gente así, se llaman astrólogos.

 
SanSanych Fomenko:

Sigues insistiendo en que los predictores de ruido son inofensivos e incluso útiles, no eres el primero, hay mucha gente así, se llaman astrólogos.


¿Dónde he escrito tal cosa?

 
Maxim Dmitrievsky:

¿Dónde he escrito eso?

Vuelve a leer tu post.

ну это и все далее по тексту понятно, но причем здесь корреляция признака с целевой в изначально нелинейной модели

а я написал зачем она (корреляция) нужна в случае регрессионной, а в классификации нет, потому что там вообще не целевая а классы



Resulta que yo especulaba y creo que nuestro desacuerdo se basa en lo siguiente:

Usted está en contra de la correlación y yo nunca escribí sobre la correlación entre el predictor y la variable objetivo.

Se llama hablar.

Siempre he escrito: el predictor debe estar relacionado con la variable objetivo. Nunca me referí a la correlación, la regresión lineal y no lineal en el sentido de la palabra"relación". Además, todos los algoritmos de predicción de "importancia" que dan los algoritmos de clasificación tampoco me satisfacen.


Mira mi ejemplo: objetivo: género con las clases masculino/femenino y predictor: ropa con el valor de faldas/pantalones.

 
SanSanych Fomenko:

Vuelve a leer tu post.



Resulta que he especulado y creo que nuestro desacuerdo se basa en lo siguiente:

Usted está en contra de la correlación y yo nunca escribí sobre la correlación entre el predictor y la variable objetivo.

Se llama hablar.

Siempre he escrito: el predictor debe estar relacionado con la variable objetivo. Nunca me referí a la correlación, la regresión lineal y no lineal en el sentido de la palabra"relación". Además, todos los algoritmos de predicción de "importancia" que dan los algoritmos de clasificación tampoco me satisfacen.


Véase mi ejemplo: objetivo: género con las clases masculino/femenino, y predictor: ropa con el valor de faldas/pantalones.


sí, es que a veces se escribe que los rasgos con el objetivo deben correlacionarse exactamente, es decir, debe haber una dependencia lineal

y escribí que para los modelos de regresión puede ser razonable que al menos 1 atributo esté relacionado linealmente con el objetivo

sobre la "relación" por supuesto que estoy de acuerdo :)

 
Vizard_:

Salvación de la prueba de fuego))

Diversas conversiones y cortes. El de arriba son los datos en bruto.

tren = r.muestreo con luz cuadrada prueba = OOS. tiempo = r.tiempo en seg.



incluso un buen resultado en un delantero no es siempre un precursor de la posterior salida de un beneficio en la tarjeta :)

La validación cruzada ya se ha mencionado anteriormente. Creo que es la mejor manera de hacerlo

 
Sobreaprendizaje - Ocurre en presencia de grandes pesos (~10^18), una consecuencia de la multicolinealidad, que conduce a un modelo A(x, w) inestable.


El sobreaprendizaje se trata mediante: la detención temprana del aprendizaje del modelo, la restricción del crecimiento de los pesos (regularización L1(Lasso) y L2), la restricción de las conexiones en la red (Dropout), también la posible aplicación de funciones de penalización (ElacticNet, Lasso).

Y la regularización L1 conduce a la selección de características, ya que se centra en sus coeficientes de peso.

La eliminación de los rasgos "ruidosos" es la selección de rasgos. Existen métodos para ello. Esto no siempre beneficia al modelo, por lo que a veces se utiliza la regularización L2 (ayuda a resolver el problema de la multicolinealidad).


SanSanych Fomenko, su afirmación sobre la relación de las características y los objetivos es un poco presuntuosa. Porque cómo se puede afirmar algo que aún no se ha demostrado; para eso está construido el modelo MO. Un modelo construido y en funcionamiento da una estimación de que existe una relación con "tal o cual" precisión.

Y el ejemplo de los pantalones y las faldas muestra la escasez de conocimientos del investigador sobre la zona de estudio, ya que en un modelo de este tipo se descartan características valiosas sobre la ubicación, la época del año, la latitud y la longitud de la región de residencia, etc.


Antes de construir un modelo hay que entender el área investigada, ya que el diablo, como el genio, está en los detalles.


PS. Tener discusiones es algo bueno. Ayudan a pulir los puntos de vista, te enseñan a dar buenos argumentos a las tesis y te llevan a una verdad común.

Razón de la queja: