Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2745

 
Aleksey Nikolayev #:

En mi opinión, hay dos tipos de comunicación.

La primera es la causal, que viene determinada por una información a priori sobre el objeto de investigación a partir de los conocimientos en la materia dada, y no por unos cálculos.

El segundo tipo es la dependencia probabilística, que puede calcularse a posteriori a partir de algunos datos obtenidos mediante la observación del comportamiento del objeto. El segundo tipo incluye la correlación, la dependencia determinista (como caso extremo), etc., incluida la descrita por cópulas y otros métodos. La base para estudiar este tipo es la suposición de que existe una distribución conjunta para los predictores y el objeto.

Correcto. A falta de supuestos a priori, se utiliza el segundo tipo. Me pregunto cómo lo ve Sanych. Por ejemplo, cómo se construyen los objetivos, pueden ajustarse simplemente a cualquier rasgo y viceversa.

Mi enfoque está totalmente adaptado para tales manipulaciones, tal vez algo se puede mejorar.
 
mytarmailS #:

Existe un ACP que considera el objetivo, pondrá de relieve los componentes que lo caracterizan,

...nunca lo hará. No tiene en cuenta la relación con el objetivo... - simplemente creará una proyección ortogonal en el espacio de características que explique la máxima varianza..... (No estoy seguro de si la rotación debe hacerse manualmente [creo que había algo al respecto en el paquete Statistika - algún botón] o si lo hará automáticamente - otras bibliotecas ya pueden tener la rotación incorporada).


mytarmailS #:

pero lo triste es que el objetivo es una variable subjetiva y va a "flotar" tan pronto como se termine la traza.... ¿y en qué se diferencia del aprendizaje normal con un profesor?

Sí, tristemente, tiene sus propias interpretaciones del propósito de este método y sus propias maneras y propósitos de usarlo.... No sé cómo puede ayudarte con esas opiniones al respecto... - así que tampoco hace falta que me preguntes más.
 
JeeyCi #:
¡¡¡¡1)nunca lo hará, no tiene en cuenta los vínculos con el objetivo!!!! - sólo creará una proyección en el espacio de características que explique la varianza máxima.... (No estoy seguro de si la rotación debe hacerse manualmente [creo que había algo al respecto en el paquete Statistika - algún botón] o si lo hará automáticamente - otras bibliotecas ya pueden tener la rotación incorporada).


2)sí, triste - tienes tus propias interpretaciones del propósito de este método y tus propias maneras y propósitos de usarlo... No sé cómo puede ayudarle con tales puntos de vista sobre ella..... - así que tampoco hace falta que me preguntes más.

1) Digo que hay rsa que tienen en cuenta el objetivo.

2) Yo no he preguntado nada, lo he afirmado.

 

mytarmailS #:

1) Estoy diciendo que hayrsa quetienen en cuenta la focalización.

2) No estaba preguntando nada, estaba afirmando.

estos ya son algoritmos para atar artificialmente PCs al target - diferentes algoritmos (software implementado a veces incluso diferente en diferentes librerias)... bien podrias usar PLS... como ligas el target a las caracteristicas es asunto tuyo, no hace el punto de PCA = "con el maestro" (el maestro se liga por separado - de hecho - de la manera que quieras) -- de nuevo nos estamos alejando del punto y entrando en el tema de "gusto y color..." (librerias). (bibliotecas).

Ni siquiera estoy seguro de si sabes si tu biblioteca hace rotación o si tienes que codificarla tú mismo... asi que las afirmaciones no verificadas e incompletas/inexactas no interesan a nadie aqui, especialmente cuando cambian los significados y la esencia de los fenomenos/objetos, despues de lo cual gritas que no entiendes las palabras... aparentemente ni siquiera entiendes tus propias palabras con exactitud

 
JeeyCi #:

Ni siquiera estoy seguro de si usted mismo sabe si su biblioteca hace la rotación o si tiene que codificarlo usted mismo....

no juzgues por ti mismo

(No estoy seguro de si la rotación se debe hacer manualmente [creo que había algo al respecto en el paquete Statistika - algún botón] o si lo resolverá automáticamente - en el otro.

JeeyCi #:

por lo que las declaraciones no verificadas e incompletas / inexactas no son de interés para nadie aquí

Y si no estás seguro, entonces no hay derecho a afirmar nada que se comprueba. lo que no es, que está interesado, que no es.... si su cabeza está en orden, por supuesto


ps Y si hay rotación en la matriz es fácil de comprobar si hay entendimiento, pero al parecer hay un problema con ello.....

 

Así que compruébalo antes de lanzarte

- si usted no lo entiende desde la 1ª vez, por favor, vierta su gurian / tonos inexactos en su código y sus resultados, en lugar de buscar los extremos

 
¿En qué se diferencia de LDA? En las citas, se obtiene un ajuste estrecho que no funciona con datos nuevos. Pero reduce el error del modelo entrenado con ellos a casi cero. Una situación similar puede darse con el enfoque de Sanych. El principio es el mismo: ajustar las moscas a las chuletas.

Pero una ventana deslizante debería dar alguna alegría si se recogen estadísticas sobre ella. Aún no me lo imagino.
 

¡Vaya pico de mensajes!


Una vez más.

Clasifico los pronosticadores según su capacidad predictiva.

Utilizo mi propio algoritmo ya que los algoritmos de numerosos paquetes son demasiado lentos - el mío es menos preciso pero muy rápido.

La capacidad predictiva NO es correlación y NO es el resultado de la elección de los predictores que producen los modelos.

La capacidad predictiva es correlación de información y NO:

1. La correlación es la "similitud" de una serie estacionaria con otra, y siempre hay algún valor y ningún valor de "no relación". La correlación siempre tiene algún valor, por lo que se puede utilizar fácilmente la correlación para encontrar la relación entre un profesor y los posos del café.

2. La selección de fichas es la frecuencia con la que se utilizan fichas al construir modelos. Si tomamos predictores no relacionados con el profesor, seguimos obteniendo una clasificación de fiches.

Un análogo a mi entender de "poder predictivo es, por ejemplo, caret::classDist(), que define las distancias de muestreo Mahalanobis para cada clase de centros de gravedad. O woeBinning. Hay muchos enfoques y muchos paquetes en R. Hay más basados en la teoría de la información.

 
JeeyCi #:

así que compruébalo antes de hacerlo.

¿Comprobar qué? ¿Si tienes una rotación?

Esto ya ni siquiera tiene gracia.

 
Maxim Dmitrievsky #:
Para resumir la teoría de Sanych (ya que él mismo no la formalizó adecuadamente ni dio ejemplos):

*su forma de selección de rasgos se basa en la correlación, ya que "relación" y "parentesco" son definiciones de correlación.

*De esta manera hacemos un ajuste implícito a la historia, similar en significado a LDA (análisis discriminante lineal) o PCA, simplificamos el proceso de aprendizaje, reducimos el error.

*Ni siquiera existe la teoría de que el modelo entrenado debería funcionar mejor con datos nuevos (no implicados en la estimación de las relaciones rasgo-objetivo) porque los rasgos se ajustaron previamente al rasgo o (peor) a toda la historia disponible.

*La situación mejora algo promediando QC en una ventana deslizante, como si se pudiera estimar la dispersión y seleccionar las más estables. Al menos algunas estadísticas en las que basarse

*Estaba pensando en causalidad o en una relación estadísticamente significativa, pero ese no es el caso en su enfoque.

Es completamente erróneo.

1. Escribí más arriba sobre mi forma de entender el "poder predictivo"

2. El significado no está claro

3. no hay traine en el sentido habitual. Ajuste de bosque aleatorio. Tamaño de la muestra = 1500 barras, número de árboles=150. El tamaño de la muestra se obtiene del gráfico de error de ajuste. Sobre esta muestra de 170 predictores, se realiza la selección y el preprocesamiento de los predictores según diferentes criterios. Finalmente, de los 20-30 predictores restantes, se seleccionan de 5 a 10 predictores en función de la máxima capacidad predictiva y se ajusta el modelo. La siguiente barra se predice utilizando el modelo obtenido. Con la llegada de una nueva barra, se repite todo el proceso de construcción del modelo.

El error máximo de ajuste se sitúa en torno al 20%, pero es bastante raro. Suele rondar el 10%.

4. Antes he descrito mi método.

Razón de la queja: