L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2219

 
Maxim Dmitrievsky:

Avez-vous essayé un autre type de clustering que le GMM ?

 
mytarmailS:

Avez-vous essayé un autre type de clustering que le GMM ?

Vous n'avez pas besoin de regroupement, vous avez besoin d'une estimation de la densité. Un encodeur et un GAN feront l'affaire.

Il existe des techniques spéciales pour travailler avec des distributions à queue dans MO, mais je ne les ai pas encore tout à fait maîtrisées.

Par exemple, il existe une telle astuce. Pour une distribution à queue (alors que les incréments forment exactement de telles distributions), la taille de l'échantillon pour la formation doit être presque infinie pour que quelque chose fonctionne sur les nouvelles données. Et cela a été prouvé. Qu'en pensez-vous ?

 
Maxim Dmitrievsky:

Ce n'est pas le regroupement qui est nécessaire, mais l'estimation de la densité. Un encodeur et un GAN feront l'affaire.

Il existe des techniques spéciales pour travailler avec des distributions à queue dans MO, mais je ne les ai pas encore abordées. C'est littéralement le dernier cri en la matière.

Je n'arrive pas à comprendre.

J'ai entraîné le modèle sur deux clusters.

> gm <- ClusterR::GMM(X,gaussian_comps = 2)
> gm
$centroids
            [,1]       [,2]       [,3]
[1,] -0.24224591 -0.5103346  0.7653689
[2,]  0.07675401  0.1668665 -0.2967750

$covariance_matrices
         [,1]      [,2]      [,3]
[1,] 1.169446 0.5971381 0.5771400
[2,] 1.006148 0.7724611 0.8297428

$weights
[1] 0.2505878 0.7494122

$Log_likelihood
            [,1]      [,2]
 [1,]  -4.060188 -3.111429
 [2,]  -6.105358 -3.516479
 [3,]  -4.301979 -4.310115
 [4,]  -3.752352 -3.583401
 [5,]  -3.172447 -3.302278
 [6,]  -7.849530 -5.254127
 [7,]  -3.055816 -3.157801
 [8,]  -5.307695 -2.795444
 [9,] -11.721658 -6.764240
[10,] -10.575876 -5.565554
[11,]  -6.760511 -5.193087
[12,]  -3.978182 -5.066543
[13,]  -2.577926 -4.418768
[14,]  -4.398716 -3.614050
[15,]  -4.082245 -5.268694
[16,]  -2.918141 -2.901401
[17,]  -9.153176 -4.797331
[18,]  -5.678321 -3.599856
[19,]  -4.500670 -2.622113
[20,]  -2.965878 -4.415078
[21,]  -4.453389 -4.152286
[22,]  -5.365306 -4.368355
[23,]  -8.533327 -3.813763
[24,]  -4.142515 -2.811048
[25,]  -7.174136 -5.631351
[26,]  -5.063518 -3.491408
[27,]  -4.935992 -8.336194
[28,]  -4.210241 -5.869093
[29,]  -3.605818 -2.577456
[30,]  -3.670845 -5.686447
[31,]  -2.733389 -5.010803
[32,]  -3.730563 -2.646749
[33,]  -3.201767 -3.689452
[34,]  -4.879268 -3.111545

qui est la distribution.

$centroids

ou

$covariance_matrices

et comment les simuler (reproduire les mêmes)

 
Maxim Dmitrievsky:

Et c'est prouvé. Qu'en pensez-vous ?

La bombe.

Où l'avez-vous lu ?

 
mytarmailS:

La bombe.

Où l'avez-vous lu ?

J'ai vu quelques articles.

Vérifiez.

https://venturebeat.com/2020/08/14/how-to-improve-ai-economics-by-taming-the-long-tail-of-data/

How to improve AI economics by taming the long tail of data
How to improve AI economics by taming the long tail of data
  • 2020.08.14
  • Matt Bornstein, Andreessen Horowitz
  • venturebeat.com
As the CTO of one late-stage data startup put it, AI development often feels “closer to molecule discovery in pharma” than software engineering. This is because AI development is a process of experimenting, much like chemistry or physics. The job of an AI developer is to fit a statistical model to a dataset, test how well the model performs on...
 
mytarmailS:

Je n'arrive pas à comprendre.

J'ai entraîné le modèle sur deux clusters.

Quelle est la répartition

ou

et comment les simuler (reproduire les mêmes)

recherchez un logiciel qui vous permette d'échantillonner à partir d'un modèle formé.

 
Maxim Dmitrievsky:

recherchez un logiciel qui vous permette d'échantillonner à partir d'un modèle entraîné.

Il y a trois distributions (lignes).

Normal Mixture' object   ``#9 Trimodal'' 
       mu sigma    w
[1,] -1.2  0.60 0.45
[2,]  1.2  0.60 0.45
[3,]  0.0  0.25 0.10

C'est censé ressembler à ça ?

 
mytarmailS:

Il existe trois distributions (lignes)

Est-ce que c'est censé ressembler à ça ?

Ce sont les paramètres gaussiens

 
Maxim Dmitrievsky:

Ce n'est pas le regroupement qui est nécessaire, mais l'estimation de la densité. Un encodeur et un GAN feront l'affaire.

Il existe des techniques spéciales pour travailler avec des distributions à queue dans MO, mais je ne les ai pas encore abordées.

Par exemple, il existe une telle astuce. Pour une distribution à queue (alors que les incréments forment exactement de telles distributions), la taille de l'échantillon pour la formation doit être presque infinie pour que quelque chose fonctionne sur les nouvelles données. Et cela a été prouvé. Qu'en pensez-vous ?

Ce sont les incréments en forme de queue qui ont prouvé la similitude de la série de prix avec le SB.)))). Et en conclusion, pour que cela fonctionne, il faut considérer l'ensemble de la série, c'est-à-dire aussi les séries futures, ou si l'on accepte que la série est infinie, alors les séries futures seront reconnues. Comme si la conclusion était qu'il existe un nombre infini de variations sur une série infinie et que nous allons nous entraîner sur elles et les voir.

Elle est inutile pour la pratique, mais doit être comprise.

ZS et en termes de densité, vous pouvez vous répartir en sections après l'évaluation.
 
Valeriy Yastremskiy:

Eh bien, c'était juste pour prouver la similitude de la série de prix avec le SB.)))) par des incréments en forme de queue. Et en guise de conclusion, ce qui fonctionnerait, c'est de voir toute la série, c'est-à-dire aussi les séries futures, ou si nous acceptons que la série est infinie, alors les séries futures seront reconnues. Comme si la conclusion était qu'il existe un nombre infini de variations sur une série infinie et que nous allons nous entraîner sur elles et les voir.

C'est inutile pour la pratique, mais c'est nécessaire pour comprendre.

SZY et en termes de densité après évaluation, vous pouvez la diviser en sections.

divisez-les en sections et choisissez les exemples les plus fréquents, le reste devant être écarté comme du bruit

ou vice versa, tracer des limites sur des événements rares

Comme vous pouvez le constater dans l'article, il s'agit d'un problème du monde réel, et pas seulement du Forex. Et les OM y sont confrontées dans différents domaines.

Raison: