L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3012

 
Maxim Dmitrievsky #:

ce que vous dites n'est toujours pas compris, à mon avis )

Il a tout clarifié sans mots et simplement, sur le principe du rasoir d'Occam.

Non, c'est juste que lorsque je suis arrivé dans le fil de discussion et que j'ai commencé à parler d'extraire des règles des arbres et de les évaluer, vous avez ri à l'idée.

J'ai maintenant franchi l'étape suivante - la création de conditions pour la création de règles potentiellement de haute qualité par l'évaluation des segments quantiques du prédicteur, et je suis à nouveau confronté à une incompréhension totale.

 
СанСаныч Фоменко #:

Je l'ai écrit à plusieurs reprises.

Ici, il faut dire cent fois la même chose pour être entendu.

 
Aleksey Vyazmikin #:

Non, c'est juste que lorsque je suis arrivé dans le fil de discussion et que j'ai commencé à parler d'extraire des règles des arbres et de les évaluer, vous avez ri de l'idée.

Je suis maintenant passé à l'étape suivante - la création de conditions pour la création de règles potentiellement de haute qualité par l'estimation des sections quantiques du prédicteur, et je suis à nouveau confronté à une incompréhension totale.

Vous ne pouvez donc pas vous contenter d'extraire des règles de l'arbre ? En théorie, c'est une question de chance là aussi, mais au détriment de leur numéro (de règles), on pourrait trouver quelque chose.

C'est à peu près la même chose que de rechercher des paramètres de stratégie dans un optimiseur, mais d'une manière plus élégante.
 
Maxim Dmitrievsky #:

Vous n'avez donc pas été satisfait de l'application des règles ?

La méthode s'est avérée assez bonne, à l'exception du fait qu'il n'y a aucune certitude quant à la vie future des règles et à leur réincarnation ultérieure. À de longs intervalles, plus de 50 % des règles sélectionnées ont donné des résultats positifs.

J'ai utilisé un arbre génétique, qui est très lent si l'échantillon contient de nombreux prédicteurs.

J'ai donc décidé de chercher des moyens de réduire la quantité d'informations transmises à l'arbre pour l'apprentissage. J'ai commencé à chercher des moyens de mettre en évidence les données potentiellement utiles.

Un autre problème est que les feuilles/règles sont très similaires en termes de points d'activation. Et au fur et à mesure que la base de feuilles s'agrandissait, il était difficile de trouver un caractère unique.

En conséquence, la conception est intéressante, il y a quelque chose à améliorer, mais c'était extrêmement lent dans mon cas. En général, ce système ne convient pas aux expériences, mais il est intéressant à mettre en œuvre, si le concept global du dispositif de construction de CT est prêt.

Et bien sûr - je ne connais pas R, j'ai demandé à des gourous locaux, et personne n'a pu m'aider à résoudre mes problèmes.

J'ajouterais maintenant l'échantillonnage et la sélection forcée du prédicteur racine (par liste) et le blocage du prédicteur déjà utilisé.

 
Aleksey Vyazmikin #:

La méthode s'est avérée assez bonne, à l'exception du fait qu'il n'y a aucune certitude quant à la durée de vie des règles et à leur réincarnation ultérieure. À de longs intervalles, plus de 50 % des règles sélectionnées ont donné des résultats positifs.

J'ai utilisé un arbre génétique, qui est très lent si l'échantillon contient de nombreux prédicteurs.

J'ai donc décidé de chercher des moyens de réduire la quantité d'informations transmises à l'arbre pour l'apprentissage. J'ai commencé à chercher des moyens de sélectionner des données potentiellement utiles.

Un autre problème est que les feuilles/règles sont très similaires en termes de points d'activation. Et au fur et à mesure que la base de feuilles s'agrandissait, il était difficile de trouver un caractère unique.

En conséquence, la conception est intéressante, il y a quelque chose à améliorer, mais c'était extrêmement lent dans mon cas. En général, ce système ne convient pas à l'expérimentation, mais il est intéressant pour la mise en œuvre, si le concept global du dispositif de construction de CT est prêt.

Et bien sûr - je ne connais pas R, j'ai demandé aux gourous locaux, et personne n'a pu m'aider à résoudre mes problèmes.

J'ajouterais maintenant l'échantillonnage et la sélection forcée du prédicteur racine (par liste) et le blocage du prédicteur déjà utilisé.

Qu'est-ce que catbust a à voir là-dedans ? Pourquoi en avez-vous besoin, en tirez-vous aussi des règles ?

Pourquoi ne pas prendre un arbre simple et aller de la racine au sommet par des règles, en donnant moins de poids aux règles complexes (pénalité pour la complexité des règles) ?

exécuter chaque règle dans un testeur sur de nouvelles données, en éliminant au préalable celles qui comportent une erreur importante.

ZY, je n'aime toujours pas cette approche intuitivement, je n'ai pas encore compris pourquoi.
 
Aleksey Vyazmikin #:

Et bien sûr, je ne connais pas R,

J'entends cela depuis plus d'un an.

Vous pouvez apprendre le R en une semaine.

 
Maxim Dmitrievsky #:

Quel est le rapport avec le catbust ? Pourquoi en avez-vous besoin, est-ce que vous obtenez aussi les règles ?

CatBoost est une grande vitesse pour vérifier si la direction des idées est correcte en premier lieu.

Je peux tirer des règles du premier arbre, mais elles sont bien sûr beaucoup plus faibles en moyenne (il y en a de bonnes, mais très rarement), et j'ai donc abandonné cette idée pour l'instant. Il existe maintenant une autre façon de construire les arbres, peut-être que les règles y sont plus fortes, mais il n'y a pas de possibilité de travailler dans MQL5 avec un tel modèle sans python.

Et en général, j'ai mes propres idées sur la façon de construire un modèle qui est lent à créer, mais avec les mêmes vérifications que celles utilisées pour sélectionner les feuilles. Peut-être qu'un jour j'arriverai à l'implémenter dans le code.

 
Maxim Dmitrievsky #:

pourquoi ne pas prendre un arbre simple et aller de la racine au sommet par règle, en donnant moins de poids aux règles complexes (pénalité pour la complexité de la règle) ?

exécuter chaque règle dans un testeur sur de nouvelles données, en éliminant au préalable celles qui comportent une grosse erreur.

ZY, je n'aime toujours pas cette approche intuitivement, je n'ai pas encore compris pourquoi

La différence réside essentiellement dans la quantité de données et la charge de travail de l'unité centrale lors de l'application du modèle.

De plus, les feuilles sont plus faciles à assembler en regroupant et en distribuant les poids (j'ai appelé cela un herbier :) ).

Plusieurs arbres sont utilisés pour créer des règles, ce qui signifie que les signaux se chevauchent, ce qui n'est pas le cas avec un seul arbre.

 
mytarmailS #:

Cela fait plus d'un an que j'entends cela.

R peut être appris en une semaine

Apparemment, tout le monde n'est pas aussi doué.

Et le code n'est pas simple - j'ai essayé de le refaire, mais il n'y avait pas assez d'informations sur Internet pour résoudre le problème.

Un autre inconvénient de R est qu'il n'existe pas de solution simple pour paralléliser les calculs entre ordinateurs.

 
Aleksey Vyazmikin #:

La différence réside essentiellement dans la quantité de données et la charge de travail de l'unité centrale lors de l'application du modèle.

De plus, les feuilles sont plus faciles à assembler, à rassembler en groupes et à répartir les poids (j'ai appelé cela un herbier :) ).

Plusieurs arbres sont utilisés pour créer des règles, ce qui signifie que les signaux se chevauchent, ce qui n'est pas le cas avec un seul arbre.

Je comprends pourquoi je n'aime pas cette idée, car association (règles par exemple) != causalité :)

Raison: