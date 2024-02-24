L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3174
Il est connecté parce que vous avez défini les paramètres auparavant, sur la base de vos connaissances ou de vos préférences. Au départ, vous savez comment obtenir une meilleure courbe, grâce à quels paramètres. De plus, vous avez pu faire des transactions dans le passé et, sur la base de cette expérience, construire une nouvelle courbe dans un nouvel historique. La profondeur d'une telle thérapie gestaltiste peut être énorme :)
Je connais bien cet effet de réentraînement du cerveau. Dans ce cas, la TS a été écrite chronologiquement avant celle-ci.
fxsaber, 2023.08.17 07:38
Le graphique montre trois ans de transactions quotidiennes.
Quoi qu'il en soit, je vous remercie pour vos réflexions.
Je ne comprends pas la nécessité de diviser en train/test/examen.
Veuillez préciser quel est l'intérêt de ces intervalles.
Pour l'instant, je suis en train d'imaginer un schéma sur ces intervalles.
Le premier point semble étrange. Un peu comme le "forward test" dans le testeur. Est-ce mieux que l'optimisation sans filtrage, mais sur un intervalle combiné : train+test ?
Je ne pratique pas ce genre d'auto-illusion. C'est la seule façon pour moi de le faire.
Vous faites la même chose que ce que j'ai décrit, relisez plus attentivement.
mytarmailS, 2023.08.16 13:23
Imaginez que vous n'ayez que 1000 variantes de TS, en général.
vos étapes 1 et 2
1) Vous commencez à optimiser/rechercher un bon TS, il s'agit de données de formation (ajustement/recherche/optimisation).
Disons que vous avez trouvé 300 variantes où le CT gagne de l'argent...
2) Vous recherchez maintenant, parmi ces 300 variantes, une CT qui passera OOS, ce sont les données de test. Vous avez trouvé, par exemple, 10 CT qui gagnent à la fois sur la formation et sur le test ( OOS ).
Je ne fais pas la deuxième étape.
Votre deuxième étape que vous "ne faites pas" ))
Quelle est la différence ?
1. Je n'ai pas bien compris la question. L'OOS de gauche correspond à une année. S'agit-il d'un zoom sur le passé ?
2. Je suppose qu'une indication qu'il n'y a pas d'erreurs dans le code est que le code fait exactement ce qui était prévu avant la programmation. En ce sens, tout va bien.
Et dans le cas général, un CT avec des erreurs dans le code est toujours un CT. Ce n'est simplement pas exactement ce que l'auteur avait prévu à l'origine.
1. Oui.
2. Oui.
Si une forte prune survient toujours juste après l'entraînement, il faut négocier à l'envers et c'est tout (mais c'est un scénario très étrange et il est difficile d'en expliquer les raisons). Mais, bien sûr, il est probable que la prune immédiatement après l'entraînement ne se produise pas toujours (par hasard), ce qui indique alors une faible capacité prédictive du modèle.
Des affirmations très catégoriques sans le moindre doute. J'ai fait un post sur le sujet de l'emplacement de l'OOC.
Ce n'est pas la première fois que je rencontre de l'aversion pour le testeur. Je ne sais pas ce qui ne va pas avec le broyeur de numéros.
Je ne comprends pas comment on peut se projeter dans l'avenir lorsqu'on optimise.
En ce qui concerne la méthodologie. Je ne comprends pas la nécessité de diviser l'entraînement, le test et l'examen. Affirmer, même avec l'étude statistique la plus favorable, que le CT n'est PAS surentraîné semble trop croire en soi.
Le maximum que je puisse obtenir en conclusion est "il est probable que le CT a trouvé un modèle qui était présent quelque temps avant et après l'intervalle d'entraînement". En même temps, il n'y a aucune garantie que ce schéma n'ait pas déjà disparu".
Ma catégorisation élevée est basée sur l'approche décrite, qui est standard dans la MO. Je n'ai pas encore mentionné la validation croisée dans la description. Il s'agit de l'approche professionnelle de l'analyse des marchés en OI.
Ce que vous décrivez est un niveau amateur, le niveau TA, où il est impossible de justifier les conclusions par des statistiques. Pour cette raison, les statistiques sont remplacées par le testeur, qui n'est PAS lié aux statistiques.
Si vous comprenez cela, vous pouvez et devez utiliser un testeur UNIQUEMENT après des calculs préliminaires dont les conclusions sont basées sur des statistiques.
C'est pourquoi l'approche que j'ai décrite de la préparation des données brutes va au-delà du testeur et est DEFINITIVEMENT une garantie de surentraînement et d'anticipation. Comparez les tests séquentiels et les tests sur des données mélangées.
Le fait que vous ne compreniez pas comment l'OOS à gauche peut être une conséquence du fait de regarder devant soi ne signifie PAS que ce n'est pas le cas. En regardant l'image, c'est très suspect. Par exemple, il est très probable que l'algorithme cherche quelque chose dans le futur pour le segment OOS qui donne la même belle image que l'OOS. Dès que l'on passe au futur par rapport au segment test, c'est la catastrophe immédiate.
Conclusion.
L'image où la prune se trouve à droite du test est la preuve d'un surentraînement et/ou d'un regard vers l'avenir.
Parlons séparément du testeur.
Le testeur dispose d'un graphique d'optimisation sous la forme d'une "surface bidimensionnelle".
Il peut être utilisé pour surveiller le surentraînement.
Si, sur cette surface, vous pouvez identifier un morceau où une cellule est entourée d'autres cellules ayant approximativement la même couleur, alors cette cellule centrale donnera les paramètres du CT NON surentraîné. Une telle position correspond au fait que l'optimum trouvé représente un plateau.
En revanche, si la "surface" ressemble à une peau de léopard, le TS est sans espoir, car le testeur a trouvé un grand nombre de maxima, ce qui indique une probabilité extrêmement faible de les atteindre à l'avenir.
Uneréférence pour les amateurs de modèles de marché en général.