L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo

mytarmailS 2020.12.04 09:58 #22181

Maxim Dmitrievsky:

Avez-vous essayé un autre type de clustering que le GMM ?

[Supprimé] 2020.12.04 10:02 #22182

mytarmailS:

Avez-vous essayé un autre type de clustering que le GMM ?

Vous n'avez pas besoin de regroupement, vous avez besoin d'une estimation de la densité. Un encodeur et un GAN feront l'affaire.

Il existe des techniques spéciales pour travailler avec des distributions à queue dans MO, mais je ne les ai pas encore tout à fait maîtrisées.

Par exemple, il existe une telle astuce. Pour une distribution à queue (alors que les incréments forment exactement de telles distributions), la taille de l'échantillon pour la formation doit être presque infinie pour que quelque chose fonctionne sur les nouvelles données. Et cela a été prouvé. Qu'en pensez-vous ?

Il existe un mandat. [Toute question de débutant, Des tâches d'entraînement cérébral

mytarmailS 2020.12.04 10:18 #22183

Maxim Dmitrievsky:

Ce n'est pas le regroupement qui est nécessaire, mais l'estimation de la densité. Un encodeur et un GAN feront l'affaire.

Il existe des techniques spéciales pour travailler avec des distributions à queue dans MO, mais je ne les ai pas encore abordées. C'est littéralement le dernier cri en la matière.

Je n'arrive pas à comprendre.

J'ai entraîné le modèle sur deux clusters.

> gm <- ClusterR::GMM(X,gaussian_comps = 2)
> gm
$centroids
            [,1]       [,2]       [,3]
[1,] -0.24224591 -0.5103346  0.7653689
[2,]  0.07675401  0.1668665 -0.2967750

$covariance_matrices
         [,1]      [,2]      [,3]
[1,] 1.169446 0.5971381 0.5771400
[2,] 1.006148 0.7724611 0.8297428

$weights
[1] 0.2505878 0.7494122

$Log_likelihood
            [,1]      [,2]
 [1,]  -4.060188 -3.111429
 [2,]  -6.105358 -3.516479
 [3,]  -4.301979 -4.310115
 [4,]  -3.752352 -3.583401
 [5,]  -3.172447 -3.302278
 [6,]  -7.849530 -5.254127
 [7,]  -3.055816 -3.157801
 [8,]  -5.307695 -2.795444
 [9,] -11.721658 -6.764240
[10,] -10.575876 -5.565554
[11,]  -6.760511 -5.193087
[12,]  -3.978182 -5.066543
[13,]  -2.577926 -4.418768
[14,]  -4.398716 -3.614050
[15,]  -4.082245 -5.268694
[16,]  -2.918141 -2.901401
[17,]  -9.153176 -4.797331
[18,]  -5.678321 -3.599856
[19,]  -4.500670 -2.622113
[20,]  -2.965878 -4.415078
[21,]  -4.453389 -4.152286
[22,]  -5.365306 -4.368355
[23,]  -8.533327 -3.813763
[24,]  -4.142515 -2.811048
[25,]  -7.174136 -5.631351
[26,]  -5.063518 -3.491408
[27,]  -4.935992 -8.336194
[28,]  -4.210241 -5.869093
[29,]  -3.605818 -2.577456
[30,]  -3.670845 -5.686447
[31,]  -2.733389 -5.010803
[32,]  -3.730563 -2.646749
[33,]  -3.201767 -3.689452
[34,]  -4.879268 -3.111545

qui est la distribution.

$centroids

ou

$covariance_matrices

et comment les simuler (reproduire les mêmes)

mytarmailS 2020.12.04 10:19 #22184

Maxim Dmitrievsky:

Et c'est prouvé. Qu'en pensez-vous ?

La bombe.

Où l'avez-vous lu ?

[Supprimé] 2020.12.04 10:21 #22185

mytarmailS:

La bombe.

Où l'avez-vous lu ?

J'ai vu quelques articles.

Vérifiez.

https://venturebeat.com/2020/08/14/how-to-improve-ai-economics-by-taming-the-long-tail-of-data/

How to improve AI economics by taming the long tail of data

2020.08.14
Matt Bornstein, Andreessen Horowitz
venturebeat.com

As the CTO of one late-stage data startup put it, AI development often feels “closer to molecule discovery in pharma” than software engineering. This is because AI development is a process of experimenting, much like chemistry or physics. The job of an AI developer is to fit a statistical model to a dataset, test how well the model performs on...

[Supprimé] 2020.12.04 10:23 #22186

mytarmailS:

Je n'arrive pas à comprendre.

J'ai entraîné le modèle sur deux clusters.

Quelle est la répartition

ou

et comment les simuler (reproduire les mêmes)

recherchez un logiciel qui vous permette d'échantillonner à partir d'un modèle formé.

mytarmailS 2020.12.04 10:26 #22187

Maxim Dmitrievsky:

recherchez un logiciel qui vous permette d'échantillonner à partir d'un modèle entraîné.

Il y a trois distributions (lignes).

Normal Mixture' object   ``#9 Trimodal'' 
       mu sigma    w
[1,] -1.2  0.60 0.45
[2,]  1.2  0.60 0.45
[3,]  0.0  0.25 0.10

C'est censé ressembler à ça ?

[Supprimé] 2020.12.04 10:28 #22188

mytarmailS:

Il existe trois distributions (lignes)

Est-ce que c'est censé ressembler à ça ?

Ce sont les paramètres gaussiens

Valeriy Yastremskiy 2020.12.04 10:37 #22189

Maxim Dmitrievsky:

Ce n'est pas le regroupement qui est nécessaire, mais l'estimation de la densité. Un encodeur et un GAN feront l'affaire.

Il existe des techniques spéciales pour travailler avec des distributions à queue dans MO, mais je ne les ai pas encore abordées.

Par exemple, il existe une telle astuce. Pour une distribution à queue (alors que les incréments forment exactement de telles distributions), la taille de l'échantillon pour la formation doit être presque infinie pour que quelque chose fonctionne sur les nouvelles données. Et cela a été prouvé. Qu'en pensez-vous ?

Ce sont les incréments en forme de queue qui ont prouvé la similitude de la série de prix avec le SB.)))). Et en conclusion, pour que cela fonctionne, il faut considérer l'ensemble de la série, c'est-à-dire aussi les séries futures, ou si l'on accepte que la série est infinie, alors les séries futures seront reconnues. Comme si la conclusion était qu'il existe un nombre infini de variations sur une série infinie et que nous allons nous entraîner sur elles et les voir.

Elle est inutile pour la pratique, mais doit être comprise.

ZS et en termes de densité, vous pouvez vous répartir en sections après l'évaluation.

vagabondage aléatoire Le modèle de régression Comment puis-je clôturer tous

[Supprimé] 2020.12.04 10:42 #22190

Valeriy Yastremskiy:

Eh bien, c'était juste pour prouver la similitude de la série de prix avec le SB.)))) par des incréments en forme de queue. Et en guise de conclusion, ce qui fonctionnerait, c'est de voir toute la série, c'est-à-dire aussi les séries futures, ou si nous acceptons que la série est infinie, alors les séries futures seront reconnues. Comme si la conclusion était qu'il existe un nombre infini de variations sur une série infinie et que nous allons nous entraîner sur elles et les voir.

C'est inutile pour la pratique, mais c'est nécessaire pour comprendre.

SZY et en termes de densité après évaluation, vous pouvez la diviser en sections.

divisez-les en sections et choisissez les exemples les plus fréquents, le reste devant être écarté comme du bruit

ou vice versa, tracer des limites sur des événements rares

Comme vous pouvez le constater dans l'article, il s'agit d'un problème du monde réel, et pas seulement du Forex. Et les OM y sont confrontées dans différents domaines.

Systèmes de yaourt et Tendance et niveaux Y a-t-il un graal

L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 2219