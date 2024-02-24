L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 952
Pour le dernier fichier, j'ai eu ceci avec l'arbre :
2016, formation
2015, test :
Est-il possible de représenter la figure en termes de probabilités, comme précédemment ? Peut-être y a-t-il des branches plus importantes sur les données de test ?
Je ne pense pas qu'il y ait assez de prédicteurs dans les données pour classer "0". Besoin de quelques indicateurs de planéité par exemple.
En général, c'est mauvais avec l'arbre. Le bois de SanSanych est bien meilleur.
Mauvais paramétrage du modèle, et par conséquent, réentraînement.
Il n'a pris qu'un seul fichier 2016 (d'ailleurs en 2015 il y avait 1 prédicteur de moins - je l'ai corrigé, je peux le retélécharger), et cette année 2016 avait une tendance à la hausse !
L'arbre s'accroche aux données des TF supérieurs, et il y a essentiellement peu de statistiques sur eux, et à cause de cela il peut y avoir un kazoon sur l'histoire, quand le vecteur de mouvement global change (2015 en hausse et 2016 en baisse) ou qu'il y a un flat total (2017).
En ce qui concerne le plat, nous avons des objectifs qui déterminent l'entrée sur le marché à partir du plat ainsi que le retournement, pouvons-nous essayer de les séparer d'une certaine manière ?
Le plat est bien identifié par les prédicteurs de type Levl, le seul problème est que l'arbre ne peut pas les relier entre eux, du moins à un TF.
Mais il est préférable, par exemple, d'entraîner la forêt sur le fichier 2015, et de la vérifier sur le fichier 2016. Il n'y a qu'une seule colonne manquante en 2015, elle devrait être supprimée en 2016 également, afin que le hochet ne soit pas confondu.
La figure peut-elle être représentée en termes de probabilités comme précédemment ?
Non, il s'agit d'un mode d'apprentissage différent de l'arbre, adapté uniquement à 2 classes. Ou pour la régression.
Il n'a pas un seul prédicteur qui se rapporte à sa variable cible - que du bruit. Et il s'assoit dans le rattle et au lieu de vérifier le bruit, il poste des dossiers avec des déchets ici.
Oui, les objectifs n'ont pas de lien clair avec les prédicteurs, ils montrent simplement le résultat financier de l'entrée sur le marché à un moment donné.
Pensez-vous que le résultat sera meilleur si la logique des entrées est liée aux indicateurs de certains des prédicteurs, c'est-à-dire que si nous entrons au croisement de МА, nous définissons le résultat (1 ou -1) et donnons des informations sur le fait du croisement de la MA dans les prédicteurs ?
L'arbre s'accroche aux données des TF supérieures, et il y a peu de statistiques sur celles-ci, ce qui peut conduire à un coup de théâtre dans l'histoire, lorsque le vecteur de mouvement global change (2015 en hausse et 2016 en baisse) ou qu'il y a un flat total (2017).
Il est clair que nous disposons déjà de différents indicateurs plats, mais l'arbre ne peut les relier entre eux. Alors c'est probablement tout, c'est la limite des possibilités de l'arbre.
Hier, j'ai obtenu des résultats presque aussi précis, mais avec un nombre inférieur d'entrées dans les transactions. Ce que j'ai reçu aujourd'hui n'est pas beaucoup mieux. Quelque chose s'est mal passé et je vais réfléchir aux réglages qui peuvent être corrigés.
Et c'est mon avis : un déchet à l'entrée est un déchet à la sortie ! Ce sont les premières lignes des manuels de statistiques.
Mais il est préférable, par exemple, d'entraîner la forêt sur le fichier 2015, et de la vérifier sur le fichier 2016. Il n'y a qu'une seule colonne manquante en 2015, elle devrait être supprimée en 2016 également, afin que le hochet ne soit pas confondu.
Je n'ai rien construit - j'ai pris un fichier prêt et j'ai construit randomForest, mais j'étais trop paresseux pour le diviser en deux fichiers. Alexey l'a fait pour moi et a montré un résultat génial, qui couvre complètement mes "réalisations".
Oh, je vois, il existe déjà divers indicateurs plats, mais l'arbre ne sait pas comment les relier entre eux. Alors c'est probablement tout, c'est la limite des capacités de l'arbre.
J'ai eu presque les mêmes résultats hier en termes de précision, mais avec un plus petit nombre d'entrées dans les transactions. Ce que j'ai reçu aujourd'hui n'est pas beaucoup mieux. Quelque chose s'est mal passé, je vais examiner les paramètres qui peuvent être corrigés.
Oui, je pense que nous avons besoin d'un arbre qui peut être aidé - pour montrer les relations probables entre les prédicteurs et pour établir les conditions de comparaisons probables pour la prise de décision.
Voici comment expliquer à l'arbre que la tendance mondiale est à la hausse et à la baisse ? Bien sûr, je peux utiliser le même outil, dessiner un canal, faire un percentile, c'est-à-dire indiquer clairement où est dirigé le vecteur de tendance, mais l'arbre peut tout simplement ignorer ce prédicteur, alors qu'il devrait, à mon avis, diviser l'ensemble du groupe en au moins deux par vecteur de tendance global.
Je ne sais pas, peut-être devrions-nous ajuster (diviser en parties) l'échantillon de situations, nous entraîner dessus et ensuite identifier de force la même tendance globale dans le Conseiller Expert et écouter l'un ou l'autre arbre en fonction du vecteur.
Qu'est-ce que cela a à voir avec mon opinion : les ordures entrent, les ordures sortent ! Ce sont les premières lignes des manuels de statistiques.
Il ne s'agit pas de bêtises - l'entrée est en fait un ensemble de probabilités de résultats d'événements, ces probabilités sont influencées par des prédicteurs, et la sortie est le résultat de nombreux événements différents et indépendants, bien que le résultat puisse être le même. Je vais réfléchir à une entrée claire et supprimer toutes les variantes sans signal à l'entrée - il sera intéressant de voir le résultat. Bien que je ne puisse toujours pas obtenir de retour des participants ici - devrions-nous marquer l'entrée explicitement dans les prédicteurs, si différentes stratégies d'entrée sont utilisées ?
Nous cherchons tous des points d'entrée, mais peut-être devrions-nous essayer de chercher un appartement ?
Peut-être que quelqu'un a un indicateur/script pour détecter les plats sur l'historique ?
Je pense que nous pouvons prendre un canal de régression avec une plage de 100, le déplacer sur chaque barre et si la pente est supérieure/inférieure à X, nous pouvons considérer que la zone décrite par le canal est plate. Qu'en pensez-vous ?