Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2219

 
Maxim Dmitrievsky:

¿Ha probado alguna otra agrupación que no sea GMM?

 
mytarmailS:

¿Ha probado alguna otra agrupación que no sea GMM?

No se necesita la agrupación, sino la estimación de la densidad. El codificador y el GAN son suficientes.

Hay técnicas especiales para trabajar con distribuciones de cola en MO, pero todavía no las domino.

Por ejemplo, existe un truco de este tipo. Para una distribución con colas (mientras que los incrementos forman exactamente tales distribuciones), el tamaño de la muestra para el entrenamiento debe ser casi infinito para que algo funcione en los nuevos datos. Y esto se ha demostrado. ¿Qué te parece?

 
Maxim Dmitrievsky:

Lo que se necesita no es la agrupación, sino la estimación de la densidad. El codificador y el GAN son suficientes.

Hay técnicas especiales para trabajar con distribuciones de cola en MO, pero todavía no he llegado a ellas. Esto es literalmente lo más nuevo que hay.

No puedo entenderlo.

He entrenado el modelo en dos clusters.

> gm <- ClusterR::GMM(X,gaussian_comps = 2)
> gm
$centroids
            [,1]       [,2]       [,3]
[1,] -0.24224591 -0.5103346  0.7653689
[2,]  0.07675401  0.1668665 -0.2967750

$covariance_matrices
         [,1]      [,2]      [,3]
[1,] 1.169446 0.5971381 0.5771400
[2,] 1.006148 0.7724611 0.8297428

$weights
[1] 0.2505878 0.7494122

$Log_likelihood
            [,1]      [,2]
 [1,]  -4.060188 -3.111429
 [2,]  -6.105358 -3.516479
 [3,]  -4.301979 -4.310115
 [4,]  -3.752352 -3.583401
 [5,]  -3.172447 -3.302278
 [6,]  -7.849530 -5.254127
 [7,]  -3.055816 -3.157801
 [8,]  -5.307695 -2.795444
 [9,] -11.721658 -6.764240
[10,] -10.575876 -5.565554
[11,]  -6.760511 -5.193087
[12,]  -3.978182 -5.066543
[13,]  -2.577926 -4.418768
[14,]  -4.398716 -3.614050
[15,]  -4.082245 -5.268694
[16,]  -2.918141 -2.901401
[17,]  -9.153176 -4.797331
[18,]  -5.678321 -3.599856
[19,]  -4.500670 -2.622113
[20,]  -2.965878 -4.415078
[21,]  -4.453389 -4.152286
[22,]  -5.365306 -4.368355
[23,]  -8.533327 -3.813763
[24,]  -4.142515 -2.811048
[25,]  -7.174136 -5.631351
[26,]  -5.063518 -3.491408
[27,]  -4.935992 -8.336194
[28,]  -4.210241 -5.869093
[29,]  -3.605818 -2.577456
[30,]  -3.670845 -5.686447
[31,]  -2.733389 -5.010803
[32,]  -3.730563 -2.646749
[33,]  -3.201767 -3.689452
[34,]  -4.879268 -3.111545

que es la distribución.

$centroids

o

$covariance_matrices

y cómo simularlos (criar similares)

 
Maxim Dmitrievsky:

Y está probado. ¿Qué te parece?

La bomba.

¿Dónde lo has leído?

 
mytarmailS:

La bomba.

¿Dónde lo has leído?

He visto algunos artículos.

compruébalo.

https://venturebeat.com/2020/08/14/how-to-improve-ai-economics-by-taming-the-long-tail-of-data/

How to improve AI economics by taming the long tail of data
How to improve AI economics by taming the long tail of data
  • 2020.08.14
  • Matt Bornstein, Andreessen Horowitz
  • venturebeat.com
As the CTO of one late-stage data startup put it, AI development often feels “closer to molecule discovery in pharma” than software engineering. This is because AI development is a process of experimenting, much like chemistry or physics. The job of an AI developer is to fit a statistical model to a dataset, test how well the model performs on...
 
mytarmailS:

No puedo entenderlo.

He entrenado el modelo en dos grupos.

¿Cuál es la distribución

o

y cómo simularlos (criar similares)

busque un paquete que le permita tomar muestras de un modelo entrenado

 
Maxim Dmitrievsky:

busque un paquete que le permita tomar muestras de un modelo entrenado

Hay tres distribuciones (líneas).

Normal Mixture' object   ``#9 Trimodal'' 
       mu sigma    w
[1,] -1.2  0.60 0.45
[2,]  1.2  0.60 0.45
[3,]  0.0  0.25 0.10

¿Se supone que tiene que ser así?

 
mytarmailS:

Hay tres distribuciones (líneas)

¿Se supone que tiene que ser así?

Estos son los parámetros gaussianos

 
Maxim Dmitrievsky:

Lo que se necesita no es la agrupación, sino la estimación de la densidad. El codificador y el GAN son suficientes.

Hay técnicas especiales para trabajar con distribuciones de cola en MO, pero aún no he llegado a ellas.

Por ejemplo, existe un truco de este tipo. Para una distribución con colas (mientras que los incrementos forman exactamente tales distribuciones), el tamaño de la muestra para el entrenamiento debe ser casi infinito para que algo funcione en los nuevos datos. Y esto se ha demostrado. ¿Qué te parece?

Bueno, son los incrementos de cola los que demostraron la similitud de la serie de precios con la SB.)))) Y como conclusión, para que funcione, hay que mirar toda la serie, es decir, la serie futura también, o si aceptamos que la serie es infinita, entonces se reconocerá la serie futura. Como si la conclusión fuera que hay un número infinito de variaciones sobre una serie infinita y que nos entrenaremos en ellas y las veremos.

Es inútil para la práctica, pero debe entenderse.

ZS y en términos de densidad se puede desglosar en secciones después de la evaluación.
 
Valeriy Yastremskiy:

Bueno, sólo estaba probando la similitud de la serie de precios con la SB.)))) por incrementos de cola. Y como conclusión, lo que funcionaría es ver toda la serie, es decir, la serie futura también, o si aceptamos que la serie es infinita, entonces se reconocerá la serie futura. Como si la conclusión fuera que hay un número infinito de variaciones sobre una serie infinita y que nos entrenaremos en ellas y las veremos.

Es inútil para la práctica, pero es necesario entenderlo.

SZY y por densidad después de la evaluación se puede dividir en secciones.

dividirlos en secciones y elegir los ejemplos más frecuentes, el resto debe descartarse como ruido

o viceversa, trazar los límites de los eventos raros

Como puede ver en el artículo, este es un problema del mundo real, no sólo del Forex. Y las MOs están luchando con ello en diferentes áreas

Razón de la queja: