L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3024

 
Maxim Dmitrievsky #:

Je propose de faire ce chapeau en python avec un arbre avec un choix de feuilles, en kolab, vous pouvez y glisser vos jeux de données.

si vous avez des idées sur ce qui est mieux/pire, des règles pour ne prendre que le meilleur ou à travers des filtres, suggérez-les

Je veux comparer, en faisant passer un ensemble de données par les deux approches. Nous comprendrons alors ce qu'il en est :)

Idée intéressante !

Tout d'abord, nous devons comprendre quelle implémentation de l'arbre permettra d'extraire facilement les règles de la feuille pour les retravailler.

Ensuite, la façon de construire l'arbre - gourmande ou génétique. J'ai vérifié les feuilles des arbres de toutes les populations (si je n'ai pas bien compris :))

Bien sûr, on peut utiliser la forêt au lieu de la génétique, mais il faut alors plus d'arbres pour chercher les feuilles, et il faut élaguer en fonction du pourcentage d'exemples dans la feuille par rapport à l'ensemble de l'échantillon. Les arbres forestiers peuvent être plus rapides que les arbres génétiques et ils auront évidemment moins de paramètres.

Le processus de génération de nouvelles feuilles doit être exécuté jusqu'à ce que le nombre requis (spécifié) de feuilles sélectionnées soit atteint.

Dans ce cas, avant de construire l'arbre, il est nécessaire d'assurer la génération d'un sous-échantillon aléatoire de deux types d'échantillons - le premier est la sélection de N parties à partir d'intervalles uniformes continus de la taille spécifiée en tant que pourcentage de l'échantillon d'apprentissage, le second est un sous-échantillon obtenu de manière totalement aléatoire.

Un ensemble aléatoire de prédicteurs utilisés pour construire l'arbre.

En ce qui concerne le prétraitement de toutes les données, il convient de réfléchir davantage.

Critères d'évaluation des feuilles - ils peuvent également être ajoutés ultérieurement, mais l'essentiel est que les métriques aient un seuil déterminé. Je ne sais pas quelles sont vos mesures et je ne me souviens pas de celles que j'ai utilisées - je dois analyser le code. Vous pouvez prendre l'équilibre, la matrice d'espérance et le facteur de récupération.

L'estimation doit avoir lieu à chaque intervalle de l'ensemble de l'échantillon d'entraînement, le nombre d'intervalles étant défini. Si le critère requis n'est pas atteint à un intervalle quelconque, la feuille est archivée ou éliminée. J'ai conservé une base de données de feuilles, en supprimant les doublons afin de ne pas avoir à les vérifier à nouveau.

Après avoir sélectionné les feuilles, il convient de les regrouper par similarité, peut-être la corrélation des rangs permet-elle de le faire correctement. Ensuite, il faut répartir les poids au sein du groupe et décider des règles de vote pour les groupes. Cependant, c'est peut-être déjà beaucoup, et cela vaut la peine d'apprendre au moins comment sélectionner les feuilles jusqu'à présent, ce qui sera efficace pour de nouvelles données.


Je ne sais pas exactement sur quel échantillon vous voulez faire l'expérience - celui que je vais donner ou celui qui sera créé au hasard ?

En tout état de cause, pour comparer les méthodes, l'échantillon doit être le même et pour un grand intervalle de temps, ce qui permettra de prendre en compte sinon la cyclicité, du moins les tendances des différentes phases du marché sur de grandes TF.

Permettez-moi de dire tout de suite que la méthode que j'ai utilisée est très lente. Il est peut-être préférable d'effectuer le processus d'évaluation des feuilles dans MQL5 - cela permettra de répartir la charge sur les cœurs.

 
Aleksey Vyazmikin #:

Une idée intéressante !

Je vais esquisser un exemple simple sur un arbre pour l'instant et le tester immédiatement, puis nous l'étendrons si nécessaire.

sur n'importe quel jeu de données, via google disc vous pouvez télécharger et tester sans rien installer.

Je veux que cela fonctionne rapidement )
 
Maxim Dmitrievsky #:

Pour l'instant, je vais esquisser un exemple simple sur un arbre afin qu'il puisse être testé en une seule fois, puis nous l'étendrons à notre guise.

sur n'importe quel jeu de données, via google disc vous pouvez le télécharger et le tester sans rien installer.

Je veux qu'il fonctionne rapidement)

Bien - l'essentiel est de commencer ! :)

 
Maxim Dmitrievsky #:

Ce n'est plus drôle.

Qu'est-ce que "drôle" a à voir là-dedans ?

Y a-t-il un échantillon hors norme ou non ?

 
СанСаныч Фоменко #:

Qu'est-ce que le terme "drôle" a à voir là-dedans ?

Y a-t-il ou non un échantillon hors norme ?

Et si je trouve

 
Maxim Dmitrievsky #:

et si je trouve

Il n'y a pas de "si". Il s'agit d'une norme de jugement. Toute estimation sans estimation hors échantillon n'est pas intéressante.

 
Maxim Dmitrievsky #:

et si je trouve

Réalisez un graphique de dix périodes OOS en avant et en arrière.

 
СанСаныч Фоменко #:

Cela n'a rien à voir avec "si". Il s'agit d'une norme de jugement. Toute évaluation sans évaluation hors échantillon n'est pas intéressante.

Très bien, c'est assez de rire
 
Valeriy Yastremskiy #:

Réalisez un graphique de dix périodes OOS en avant et en arrière.

Cela représente 100 ans
 
Maxim Dmitrievsky #:
C'est assez de rire.

Vous vous adressez à l'Égyptien ou à moi ?

Je constate que je suis assez satisfait de votre activité dans ce domaine.

Raison: