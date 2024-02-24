L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 452
Je suppose que tous les problèmes liés à l'utilisation de MO dans le commerce sont résolus et que vous pouvez passer aux images ?
Avez-vous vraiment lu les 452 pages ? )
Tu sais quoi ?
Je l'ai lu.
Tu sais quoi ?
Je l'ai lu sans hésiter.
Je ne le fais que de manière sélective).
Mais le sujet est déjà si vaste qu'il est presque impossible d'y trouver quelque chose de précis. J'ai essayé, je l'ai trouvé sur environ 300 pages. Mais cela prend trop de temps).
Plus les anciens problèmes sont résolus, plus les nouveaux restent sans solution.
Il y a quelque temps, j'ai commencé à apprendre à prédire non pas la direction dans laquelle le prix va aller (2 classes de hausse et de baisse), mais à prédire le montant de l'augmentation du prix par barre (régression). C'est plus compliqué, mais ces résultats sont beaucoup plus clairs.
Si vous pouvez réaliser la classification avec une précision de 60% et un beau graphique, il est beaucoup plus difficile d'obtenir un R^2 positif en régression. Il semble impossible d'atteindre R^2 = 1 sur la base des données disponibles dans le terminal.
Mais alors que la classification donne généralement de bons résultats sur le backtest et de mauvais résultats sur le fronttest, la régression avec une validation croisée appropriée fait également apparaître le backtest comme mauvais, ce qui indique en soi de mauvais résultats sur les nouvelles données, pas de fausses attentes.
En ajoutant différentes méthodes de validation croisée éprouvées, et en essayant différents modèles - il s'avère que même un modèle stable bien entraîné n'est pas possible, il n'y a pas assez de données. Il est probable que ce problème ne puisse être résolu que par des abonnements payants à des prédicteurs de haute qualité.
Pour ma part, jusqu'à présent, j'ai pris la direction suivante - pour prédire la hausse des prix sur M5, entraîner le modèle sur chaque nouvelle barre, limiter le commerce par le temps à pas plus de quelques heures par jour, et le temps de commerce lui-même devrait être sélectionné d'une manière ou d'une autre, par exemple, j'ai vu de nombreux conseillers experts sur le marché qui travaillent seulement quelques heures à minuit lorsque les grandes bourses ne fonctionnent pas. L'utilisation d'un cadre temporel inférieur à M5 ou le travail par ticks semble impossible, car le spread absorberait tous les bénéfices. Si ça marche, ce sera génial.
De même, le Forex, d'après mes observations, est très artificiel. Les prix se comportent parfois complètement à l'encontre des modèles précédemment trouvés, ou vice versa, il y a des modèles qui se répètent depuis des années et le prix se comporte soit en fonction, soit à l'encontre, afin d'être à zéro en moyenne.
Si je ne voyais pas mon propre profit en utilisant les Market Advisors, j'aurais abandonné l'étude du MO au Forex depuis longtemps. Mais comme il s'avère qu'il existe des exemples de réussite, il y a de quoi s'efforcer.
Expérimentation. Que diriez-vous de prendre différents gbpusd, usdchf, usdrub, et autres symboles populaires et de les utiliser pour prédire l'eurusd.
Voici deux tables dans atache, train.csv et test.csv, dans lesquels la cible est la croissance eurusd m5 pour la prochaine barre, et les prédicteurs sont audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], etc. Il y a 12 symboles au total, les incréments des 3 barres précédentes de l'histoire sont pris sur chacun d'eux. D'une manière générale, tout est clair dans le nom des colonnes.
Le tableau d'apprentissage comporte 10000 lignes, soit environ 7 semaines.
J'ai essayé d'entraîner un modèle et j'ai obtenu r^2 = 0.0006164161 sur les données d'entraînement, et si nous arrondissons la cible et les résultats aux classes -1 et 1, la précision est de 0.5052. C'est très mauvais. Mais il est tout simplement irréaliste de prendre des dizaines de barres pour chaque exemple d'entraînement et des dizaines de caractères eux-mêmes, mon modèle sur ces centaines de colonnes prendra des semaines à s'entraîner.
Sur le banc d'essai, les résultats de validation du modèle sont en baisse, r^2 = -0.003390913 et précision 0.4907. Le hasard était, le hasard est, et est toujours.
Mais tout cela est ennuyeux et peu concluant.
J'ai trouvé intéressant de regarder les pondérations que le modèle donne à chaque prédicteur (plus la pondération est élevée, mieux c'est) :
Conclusion : Essayer de prédire la direction de l'eurusd sur la prochaine barre m5 est mieux en utilisant audusd, usdrub, usdsgd en premier lieu.
ajouter 10 à 30 colonnes aléatoires supplémentaires pour plus d'intérêt
Pour être honnête, cette approche (prédire le mouvement ici et maintenant) est un fiasco pour moi. Essayez de prédire les niveaux auxquels le prix arrivera sur une certaine période de temps, par exemple une journée, les résultats seront bien meilleurs.