L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo

mytarmailS 2022.05.25 13:42 #26471

Aleksey Nikolayev #:

Je pense que la question de savoir ce qu'il faut faire avec les boîtes identifiées est complexe et qu'il n'existe guère de règles claires et sans ambiguïté pour tous les cas possibles. Un bon algorithme bien pensé est probablement un "savoir-faire" assez secret).

Si les cas sont obtenus sur le même ensemble de prédicteurs, leur non-intersection est probablement suffisante. S'il y a une intersection, elle peut être attribuée à une boîte distincte, et ses compléments peuvent être répartis dans plusieurs boîtes. Cependant, un trop grand nombre de boîtes fragmentera trop l'échantillon. Nous pouvons donc généraliser la notion de boîte - dans le langage des règles, cela signifie ajouter les négations et le OU au ET.

Si les boîtes sont obtenues à partir de prédicteurs complètement différents (par exemple, par la méthode randomforest), elles ne peuvent se chevaucher que dans le sens des parties de l'échantillon qui en font partie. Des idées proches du portefeuille sont probablement nécessaires ici.

Si les ensembles de prédicteurs se chevauchent partiellement, il doit y avoir un mélange d'approches, mais il est difficile de l'affirmer avec certitude.

Je ne vois pas très bien comment cela peut être intégré dans un schéma unifié. La méthode standard de construction des arbres de décision contourne simplement et "joliment" ces problèmes, ce qui fait qu'elle ne convient pas tout à fait à nos objectifs. Il est peut-être possible de l'améliorer en sélectionnant un algorithme d'élagage, mais à mon avis, il est préférable de retravailler de manière créative l'algorithme de construction des règles.

Les conclusions les plus intelligentes...

Les algorithmes prêts à l'emploi n'ont que des règles approximatives, c'est-à-dire stupides comme l'enfer, comme :

X[1]>0.5 && X[3]> -0.2 &...

Ils n'ont que des variables (colonnes de la matrice ou du cadre X1.....X10) et des limites abstraites (chiffres X[1]>0,5 ), qu'il invente lui-même en apprenant à créer des limites en classe.

Qu'en est-il du trivial X1 > X2

ou la négation de X1 !> X2.

Qu'en est-il de X1> (X2*X3)?

Et la liaison aux indices, qui ne fonctionne pas sur un marché non stationnaire ?

Je veux parler de l'expression : s'il y avait "A" mais pas "B", alors "C".

Ce n'est tout simplement pas pour les algorithmes prêts à l'emploi.

L'algorithme est le même pour Forrest, qui crée simplement des centaines de règles et examine la somme de leurs probabilités de classe. Sur le marché, nous nous intéressons aux événements rares, et nous devons donc nous intéresser au nombre de règles, et non au nombre de règles.

Théorème sur la présence [Archives] Mathématiques pures, physique, Erreurs, bugs, questions

mytarmailS 2022.05.25 14:35 #26472

Je me demande comment l'algorithme de réduction de la dimensionnalité perçoit les échantillons avec différents types de données avec et sans normalisation

Par exemple, il y a deux types de données : les chaînes de caractères et les chiffres.

q1           q2
1    c -1.630015623
2    c  1.781979246
3    b -0.598134088
4    a -0.611477494
5    b -0.347432530
6    b -0.474427356
7    e -1.048827859
.....

Je commence par convertir q1 en chiffres.

q1           q2
1    3 -1.630015623
2    3  1.781979246
3    2 -0.598134088
4    1 -0.611477494
5    2 -0.347432530
6    2 -0.474427356
7    5 -1.048827859

....

fait

Maintenant, nous l'envoyons à l'algorithme UMAP et obtenons les vecteurs propres.

                  [,1]         [,2]
    [1,]   6.762433406   9.08787260
    [2,] -21.488330368  10.67183802
    [3,]   6.810413818   9.35273386
    [4,] -20.950310976  15.20258097
    [5,]  32.100723691  -9.74704393
    [6,]   6.892939805  16.84639975
    [7,] -17.096480607  -6.63144430

Visualiser les points

Jolis vers que nous avons obtenus ))

Essayons de colorer les points avec la variable q1.

Comme nous pouvons le voir, la variable q1 crée la structure de ces vers, elle tire en quelque sorte l'importance sur elle-même, réduisant la contribution de la variable q2.

Cela est dû au fait que la variable q1 a de grandes valeurs et que les données ne sont pas normalisées.

Si nous normalisons les données, chaque variable apportera la même contribution et nous obtiendrons

Je comprends que pour certains participants, il s'agit d'une évidence, nous devons normaliser bla bla bla bla,

mais avez-vous déjà pensé qu'en augmentant ou en diminuant la contribution des variables, vous pouviez contrôler les regroupements ?

Questions sur la POO EasyLMA_v6 Avalanche

PapaYozh 2022.05.25 14:39 #26473

mytarmailS #:

visualiser les points

On dirait des parasites :)

[Supprimé] 2022.05.25 15:41 #26474

mytarmailS #:

Mais avez-vous déjà pensé qu'en augmentant ou en diminuant la contribution des variables, il est possible de contrôler le regroupement ?

Oui, en surestimant ou en sous-estimant délibérément l'importance.

Mais c'est un art, c'est difficile à analyser.

La situation est aggravée par la non-stationnarité des prix, j'ai longtemps lutté contre les signes : si vous changez d'échelle ou de normalisation, les propriétés du modèle entraîné changent.

Toute question des nouveaux Vous devez décrire la FOREX - Tendances, prévisions

mytarmailS 2022.05.25 16:04 #26475

Maxim Dmitrievsky #:
avec des prix non stationnaires, je suis en guerre contre les signes depuis longtemps.

Nous sommes tous en guerre.

Aleksei Kuznetsov 2022.05.25 16:35 #26476

mytarmailS réduction de la dimensionnalité perçoit les échantillons avec différents types de données avec et sans normalisation.
Par exemple, il existe des types de données, de chaînes et de chiffres.

Je commence par convertir q1 en chiffres

Il est préférable de convertir les chaînes de caractères en catégories plutôt qu'en chiffres. Bien sûr, si votre UMAP peut les traiter.

a=1 n'est pas 5 fois différent de e=5. Ils sont simplement différents, comme chaud et doux. Et en les numérisant, vous les avez rendus de plus en plus chauds.

Que mettre à l'entrée Bibliothèque: Bibliothèque de fonctions Questions des débutants MQL5

mytarmailS 2022.05.25 17:09 #26477

elibrarius #:

a=1 n'est pas cinq fois différent de e=5. Ils sont simplement différents,

Hmm, oui, tu as tout à fait raison, j'ai été stupide.

Il faut faire une conversion à chaud ou quelque chose comme ça.

Aleksey Vyazmikin 2022.05.25 18:02 #26478

Aleksey Nikolayev #:

Je pense que la question de savoir ce qu'il faut faire avec les boîtes identifiées est complexe et qu'il est difficile d'établir des règles claires et sans ambiguïté pour tous les cas possibles. Un bon algorithme bien pensé est probablement un "savoir-faire" assez secret).

Si les cas sont obtenus sur le même ensemble de prédicteurs, leur non-intersection est probablement suffisante. S'il y a une intersection, elle peut être attribuée à une boîte distincte, et ses compléments peuvent être répartis dans plusieurs boîtes. Cependant, un trop grand nombre de boîtes fragmentera trop l'échantillon. Nous pouvons donc généraliser la notion de boîte - dans le langage des règles, cela signifie ajouter les négations et le OU au ET.

Si les boîtes sont obtenues à partir de prédicteurs complètement différents (par exemple, par la méthode randomforest), elles ne peuvent se chevaucher que dans le sens des parties de l'échantillon qui en font partie. Des idées proches du portefeuille sont probablement nécessaires ici.

Si les ensembles de prédicteurs se chevauchent partiellement, il doit y avoir un mélange d'approches, mais il est difficile de l'affirmer avec certitude.

Je ne vois pas très bien comment cela peut être intégré dans un schéma unifié. La méthode standard de construction des arbres de décision contourne simplement et "joliment" ces problèmes, ce qui fait qu'elle ne convient pas tout à fait à nos objectifs. Il est peut-être possible de l'améliorer en sélectionnant un algorithme d'élagage, mais à mon avis, il est préférable de retravailler de manière créative l'algorithme de construction des règles.

Sans comprendre les détails, il est difficile d'apporter des modifications à la logique.

Personnellement, je n'ai pas compris ce que sont les 2 coordonnées supplémentaires de la boîte (2 - limites quantiques) - j'ai supposé qu'il s'agissait d'un élagage d'échantillon.

Je cherche simplement quelque chose d'utile pour développer ma méthode. J'ai également collé des "boîtes", mais l'algorithme n'est pas parfait.

Experts: Programmation MQL5 pour Indicateur Sperandeo. Liste des rapports de

Aleksey Nikolayev 2022.05.25 21:22 #26479

Aleksey Vyazmikin #:

Voilà, sans comprendre les détails, il est difficile d'apporter des modifications à la logique.

Personnellement, je n'ai pas compris ce que sont les 2 coordonnées supplémentaires de la boîte (2 - limites quantiques) - j'ai supposé qu'il s'agissait d'un découpage de l'échantillon.

Je cherche simplement quelque chose d'utile pour développer ma méthode. J'ai également collé des "boîtes", mais l'algorithme n'est pas parfait.

Si vous parlez spécifiquement de PRIM, mon lien vient de donner un exemple de son fonctionnement pour deux prédicteurs x1 et x2. En conséquence, une boîte de la forme (a1<x1<b1)&(a2<x2<b2) est sélectionnée. Ce qui reste à l'extérieur de la boîte est apparemment considéré comme appartenant à une classe différente de ce qui se trouve à l'intérieur. On a tenté de montrer à l'aide d'un exemple simple l' essence de l' algorithme - couper un petit morceau (peler) de la boîte à chaque étape. Le choix du morceau à couper et du prédicteur à utiliser dépend de la condition d'optimalité de l'étape "trajectoire".

Cet algorithme m'intéressait en tant qu'exemple de la manière dont un algorithme standard de construction de règles (pour un arbre de résolution) peut et doit être modifié pour répondre à des besoins particuliers.

MT5 est destiné aux Les tendances cycliques du Comment identifier les modèles

Aleksey Vyazmikin 2022.05.25 22:10 #26480

Aleksey Nikolayev #:

Si vous parlez spécifiquement de PRIM, mon lien vient de donner un exemple de son fonctionnement pour deux prédicteurs x1 et x2. En conséquence, une boîte de la forme (a1<x1<b1)&(a2<x2<b2) est sélectionnée. Ce qui reste à l'extérieur de la boîte est apparemment considéré comme appartenant à une classe différente de ce qui se trouve à l'intérieur. On a tenté de montrer à l'aide d'un exemple simple l' essence de l' algorithme - couper un petit morceau (peler) de la boîte à chaque étape. Le choix du morceau à couper et du prédicteur à utiliser dépend de la condition d'optimalité de l'étape "trajectoire".

Cet algorithme m'intéressait en tant qu'exemple de la manière dont un algorithme standard de construction de règles (pour un arbre de résolution) peut et doit être modifié pour répondre à des besoins particuliers.

C'est une bonne chose que vous ayez trouvé la solution - je ne l'ai pas comprise au début, merci pour la clarification.

Mais il s'avère que l'algorithme, à la première étape, devrait trouver des paires de prédicteurs qui se sépareront mieux dans des boîtes, puis leur appliquer le "pelage".

Programmation asynchrone et multithread Couverture de Martingale. Questions des nuls.

L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 2648