Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1934

 
Valeriy Yastremskiy:

¿Y con qué quieres terminar?, con armónicos el camino a Fourier. O polinomios ortogonales, hay muchos. Todo se puede descomponer).

No necesito descomponerme, necesito crear. Necesito crear una función que satisfaga mis necesidades, no sé cuál es esta función.

Tal vez la enumeración por armónicos, pero voy a considerar todas las variantes.

En esencia es la misma aproximación pero la enumeración no va en la reducción del error sino en la correspondencia con la condición.


Entonces, quiero saber cómo se organiza esta búsqueda , incluso en una simple aproximación armónica, ¿qué se multiplica allí para cambiar la función?

¿Cómo funciona en general el mecanismo de ajuste de una función a otra?
 
mytarmailS:

No necesito descomponerme, necesito crear. Necesito crear una función a partir del tiempo que satisfaga mi condición, cuya función desconozco, por lo que necesito crear una búsqueda.

Probablemente una enumeración armónica, pero consideraré todas las opciones.

En esencia es la misma aproximación pero no va sobre la reducción del error sino sobre la correspondencia con la condición.


Así que quiero saber cómo se organiza esta búsqueda , incluso en una simple aproximación armónica, ¿qué se multiplica allí para cambiar la función?

¿Cómo funciona en general el mecanismo de ajuste de una función a otra?

No puedo decir en fórmulas, en el sentido de la descomposición del período más grande al más pequeño. Encuentras el mayor armónico, lo restas de la señal real, encuentras el mayor del resto y lo restas con la precisión requerida. Y en la aproximación (Representación de aproximación de la señal real por funciones lineales quebradas rectas) representamos el armónico en tramos discretos por líneas rectas. Si el muestreo es de medio período (si es mayor, no saldrá nada), obtendremos "P" o líneas rectas entre extremos, y si es de un cuarto o más, obtendremos líneas discontinuas. Y si disminuimos el paso de muestreo, aumentamos la precisión.

Si la selección de precios es larga, se puede dividir en secciones más cortas y se pueden enumerar/seleccionar funciones lineales, de potencia, armónicas y logarítmicas en estas secciones. Lo ideal es que los armónicos y los ortogonales lineales resuelvan el problema. Probado más de una vez. Pero sólo en la historia.

No tiene sentido con el mercado, tenemos función / modelo matemático cambio en el tiempo y no hay criterios claros, no se ha demostrado la cantidad de datos necesarios para determinar el modelo matemático y su desajuste con el mismo BP, que no sea la discreción en medio período no dará resultados, esto ha sido probado). Todo empírico o NS con MO) pero también experiencial.

No hay función con las condiciones cambiantes, tenemos un conjunto de armónicos en esta sección, otro en la siguiente. El muestreo del sonido es de 48 kilohercios, el doble de lo que oímos, por lo que perdemos en las frecuencias altas. Y el digital tiene 2 niveles de señal por periodo de 1/48000 seg.

 
mytarmailS:

No necesito descomponerme, necesito crear. Necesito crear una función a partir del tiempo que satisfaga mi condición, cuya función desconozco, por lo que necesito crear una búsqueda.

Probablemente sea una enumeración armónica, pero consideraré todas las variantes.

En esencia es la misma aproximación pero no va sobre la reducción del error sino sobre la correspondencia con la condición.


Entonces, quiero saber cómo se organiza esta búsqueda , incluso en una simple aproximación armónica, ¿qué se multiplica allí para cambiar la función?

¿Cómo funciona el mecanismo de adaptación de una función a otra?
armónico, ¿es a través de Fourier? Simplemente suma ondas sinusoidales de diferentes períodos y amplitudes A1*cos(2Pi*t/T1+Fi1)+ A2*cos(2Pi*t/T2+Fi2) +... A - amplitud, T - período, Fi - fase
 
mytarmailS:

¿Cuántas veces te lo he dicho? ¿3? ¿5?

Así que por qué se lo inventaron, y el vídeo que se publicó antes con un hombre que más o menos usó este milagro-diablo y concluyó que la muestra es adecuada para el entrenamiento...

 
Aleksey Vyazmikin:

Bueno, por qué se les ocurrió, y el video fue publicado antes con un hombre que tipo de uso de esta herramienta milagro y llegó a la conclusión de que el muestreo es adecuado para la formación ...

usó t-sne (como) pero no importa, funciona y funciona bien pero no para el mercado como todo lo demás, solo descarga cualquier conjunto de datos de internet y verás que funciona bien pero...

Pero puedo sacar algunas conclusiones: los clusters son estables y estables pero no se correlacionan con el beneficio, el objetivo se correlaciona con el beneficio pero se mueve alrededor de los clusters, probablemente porque cada objetivo es una realidad objetiva. Intentaré reconocer los patrones por sus análogos históricos pero no por los precios, sino por el umap como quería desde el principio.


Rorschach:
armónico, ¿es como una onda de Fourier? Son sólo ondas sinusoidales de diferentes períodos y amplitudes sumadas A1*cos(2Pi*t/T1+Fi1)+ A2*cos(2Pi*t/T2+Fi2) +... A - amplitud, T - período, Fi - fase

hombre, es complicado.... Entiendo lo de los armónicos, pero probablemente es una estupidez recoger series de armónicos y probarlas, probablemente debería hacerse como una dependencia de algo en algo, es jodidamente duro.... pero si se hace, es un grial

 
mytarmailS:

Selección de características[editar|editar código]

Artículo principal:Selección de características

El método deselección de características trata de encontrar un subconjunto de las variables originales (llamadas características o atributos). Existen tres estrategias: una estrategia de filtrado(por ejemplo, laacumulación de características [en]), una estrategia deenvoltura(por ejemplo, la búsqueda según la precisión) y una estrategia deincrustación(seleccionar las características que se añaden o eliminan a medida que se construye el modelo, basándose en los errores de predicción). Véase también problemas deoptimización combinatoria.

En algunos casos, elanálisis de datos, como laregresión o laclasificación, puede realizarse en el espacio reducido con mayor precisión que en el espacio original [3].

Proyección de rasgos[editar|editar código]

La proyección de características convierte los datos de unespacio de alta dimensión a un espacio de baja dimensión. La transformación de los datos puede ser lineal, como en elmétodo de componentes principales(PCM), pero existen varias técnicas dereducción no lineal [en] [4] [5]. En el caso de los datos multidimensionales, se puede utilizaruna representacióntensorial para reducir la dimensionalidad mediante elentrenamiento polilineal de subespacios [en] [6].

Mehe perdido el texto con sus explicaciones - me corrijo.

Enseguida me surgen varias preguntas:

1. ¿Cómo obtener el resultado de la selección de características con su transformación en forma de cualquier regla para utilizarla por separado en el código?

2. ¿Quizás haya una forma de visualizar las características seleccionadas y su transformación, a través de un árbol u otra cosa?

3. ¿Ha probado estas estrategias de selección de características?

El método deselección de características trata de encontrar un subconjunto de las variables originales (que se denominan características o atributos). Existen tres estrategias: la estrategia de filtrado(por ejemplo,acumulación de características [es]), la estrategia deenvoltura(por ejemplo, búsqueda según la precisión) y la estrategia deanidamiento(seleccionar características para añadir o eliminar a medida que se construye el modelo, basándose en los errores de predicción). Véase también problemas deoptimización combinatoria.

En algunos casos, elanálisis de datos, como laregresión o laclasificación, puede realizarse en el espacio reducido con mayor precisión que en el espacio original [3].

mytarmailS:

Eso es lo que hicimos ayer.

Reducción de la dimensionalidad[editar|editar código]

Para los conjuntos de datos de alta dimensión (es decir, con más de 10 dimensiones), se suele reducir el tamaño antes de aplicarel algoritmo de los vecinos más cercanos(k-NN), para evitar el efecto de lamaldición de la dimensionalidad [16].


Ventajas de la reducción de la dimensionalidad[editar|editar código]

  1. Reduce el tiempo y la memoria necesarios.
  2. La eliminación de la multicolinealidad mejora la velocidad del modelo de aprendizaje automático.
  3. Es más fácil representar los datos visualmente cuando se reducen a dimensiones muy bajas, como 2D o 3D.

Y me parece que el código indica que la agrupación está separada, la construcción de la proyección está separada, y luego sólo alimentamos los resultados de la agrupación para la gradación del color al renderizar, ¿no?

 
mytarmailS:

usó t-sne (como) pero no importa, bueno, se lo inventaron, y funciona y funciona muy bien pero no para el mercado, como todo, bájate cualquier conjunto de datos de internet y verás que la cosa funciona muy bien pero...

Pero puedo concluir: los clusters son estables y estables pero no resuenan con el beneficio, el objetivo resuena con el beneficio pero se mueve alrededor de los clusters, probablemente porque cada objetivo es una realidad objetiva. Quiero intentar reconocer patrones usando análogos históricos, no usando precios sino usando umap como planeé desde el principio.

Entonces, ¿cómo se marcan en el historial para su clasificación? Y entonces, los has reconocido, ¿y luego qué? El otro día estaba distribuyendo a través de 4 clusters buscando objetivos... A menos que se cambie el objetivo de clúster a clúster. En general, tenemos que entender por qué las cadenas se metieron en diferentes grupos - analizar la lógica, si hay uno y es contiguo con el mercado.

 
Aleksey Vyazmikin:

Se me pasó el texto con sus explicaciones - me corrijo.

Enseguida me surgen varias preguntas:

1. ¿Cómo obtener el resultado de la selección de características con su transformación en forma de cualquier regla para su aplicación por separado en el código?

2. ¿Quizás haya una forma de visualizar las características seleccionadas y su transformación, a través de un árbol u otra cosa?

3. ¿Ha probado estas estrategias de selección de características?

4. Me parece que el código indica que la agrupación es independiente, la construcción de la proyección es independiente, y luego sólo alimentamos los resultados de la agrupación para la gradación del color al renderizar, ¿no?


1. es lo mismo que querer los precios de cierre de 100k descritos por las reglas para la aplicación separada en el código

2. los atributos vienen en forma de funciones con todo lo que ello implica

3. He probado algo; reduce la dimensionalidad, pero la calidad no mejora, pero aun así, me parece genial comprimir 10k atributos a 500 sin perder calidad; me parece genial, o a 50 con una pérdida aceptable.

4. así es, primero hemos disminuido la dimensionalidad y luego la hemos agrupado, también está escrito aquí - -----. Para conjuntos de datos de alta dimensionalidad (es decir, con un número de dimensiones superior a 10), lareducción de tamaño suele hacerseantes de aplicarel método de los vecinos más cercanos (k-nearest neighbours )

 
mytarmailS:


1. es lo mismo que querer que los precios de cierre de 100k se describan mediante reglas para su uso por separado en el código

2. Las características aparecen como funciones con todas sus consecuencias

3. He probado algo; reduce la dimensionalidad, pero la calidad no aumenta, pero sigue siendo genial, por ejemplo, podemos comprimir 10k atributos a 500 sin pérdida de calidad, lo que me parece muy genial, o a 50 con una pérdida aceptable.

4. así es, primero hemos disminuido la dimensionalidad y luego la hemos agrupado, lo dice aquí - ----- Para conjuntos de datos de alta dimensionalidad (es decir, con un número de dimensiones superior a 10), ladisminución de la dimensionalidad suele hacerseantes de aplicarel método de los vecinos más cercanos

1. Debes haber entendido mal la pregunta: se trata de descargar las reglas en un archivo, y hay reglas, lo que se confirmó en la 2.

2.

3. ¿Probable alta correlación entre los predictores, incluso después de la conversión? ¿Es posible obtener una lista de los predictores retirados o no están retirados sino fusionados en grupos sólo - no puedo entenderlo.

4. Tal vez entendí mal el código o lo agrupé mal, lo publicaré de nuevo

#way <- "F:\\FX\\R\\tree_classification_2019_fS_Eks_29\\Test_Pred_ALL_01.csv"  #  ваш путь
way <- "F:\\FX\\R\\2020_04_11_Pred_New_Full\\Pred_New_Full.csv"  #  ваш путь

dt <- read.csv(file = way,header = T,sep = ";") #  читаем файл

target <- dt$Target_100 #  целевую в отдельную переменную

dt <- dt[, ! colnames(dt)  %in% 
           #            c("Target_100_Buy","Target_100_Sell",
           #             "Time","Target_100")  ] #  удаляем не нужные колонки
                      c("Target_100")  ] #  удаляем не нужные колонки

km <- kmeans(um$layout, centers = 4)           

#  роскоментируем и Устанавливаем нужные пакеты после чего эту строку можно удалить
#install.packages(c("rgl", "car" , "umap"))



#  про umap
#https://cran.r-project.org/web/packages/umap/vignettes/umap.html
#https://github.com/ropenscilabs/umapr

library(umap)
um <- umap(dt,n_components=3)   
#  n_components=3  во сколько измерений уменьшаем данные, можно 100 можно 1
#  можно 333, но нам для 3 д надо трех мерное пространство поетому у нас n_comp=3
um.res <- um$layout #  наши три вектора выход 



#тут  все настройки по пакету  car
#  http://www.sthda.com/english/wiki/amazing-interactive-3d-scatter-plots-r-software-and-data-visualization
library(car)  # 3 d

target <- as.factor(target)  #   target нужен для того чтобы окрасить точки в цвет целевой

scatter3d(x = um.res[,1], 
          y = um.res[,2], 
          z = um.res[,3],
          groups = as.factor(km$cluster),
          grid = FALSE, 
          surface = FALSE,
          ellipsoid = TRUE,
            bg.col = "black")


write.csv(km$cluster, file = "F:\\FX\\R\\2020_04_11_Pred_New_Full\\Pred.csv", sep = ";",row.names = F,col.names = T)
 
Aleksey Vyazmikin:

1. Debes haber entendido mal la pregunta: se trata de subir las reglas a un archivo, y hay reglas, como se confirma en el punto 2.

2. Esto es bueno.

3. ¿Probable alta correlación entre los predictores, incluso después de la conversión? ¿Es posible obtener una lista de los predictores retirados o no están retirados sino fusionados en grupos sólo - no puedo entenderlo.

4. Tal vez entendí mal el código o lo agrupé mal, lo publicaré de nuevo

1. Todavía no lo entiendo.

3. no puede haber características correlativas después de la transformación. Sí, podemos decir que se funden en otras estructuras (atributos), pero sin redundancia

4.

dt <- dt[, ! colnames(dt)  %in% 
           #            c("Target_100_Buy","Target_100_Sell",
           #             "Time","Target_100")  ] #  удаляем не нужные колонки
                      c("Target_100")  ] #  удаляем не нужные колонки

las tesis son una expresión, es decir, no se puede comentar )))

Razón de la queja: