L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 179
Parlez-vous de l'analyse en composantes PCA ou d'autre chose ? Je ne me souviens pas de tous les exemples que j'ai postés ici :)
Si vous parlez de l'APC, vous ne pouvez pas faire un bonbon avec des déchets de toute façon. Il faut avoir d'assez bons prédicteurs mélangés à de mauvais, puis l'ACP peut faire le tri entre les mauvais et les bons.
Vous sous-estimez les résultats positifs de votre expérience. Il n'y a pas de graal. Mais il existe un outil complet pour lutter contre des maux tels que le surentraînement.
La toute première étape consiste à éliminer les déchets, ce qui a un impact décisif sur le surentraînement. Et dans cette première étape, l'ACP est très utile. Après cette étape, les prédicteurs pertinents pour la variable cible resteront, et tous les fantasmes disparaîtront. Mais ne surestimez pas l'importance de cette étape - c'est la première étape. Après cela, les étapes suivantes sont nécessaires :
Et vos expériences avec le rfa vont s'avérer extrêmement utiles.
PS.
Notez que j'ai délibérément gardé le silence sur le travail avec les modèles eux-mêmes.
Réentraînement du modèle sur chaque barre.... Cela signifie-t-il qu'une seule barre affecte l'ensemble du modèle ? En raison de l'importance de chaque barre dans l'entraînement, il met en évidence votre lutte sans fin avec le recyclage...
Le modèle que j'essaie de mettre à niveau maintenant - oui, j'apprends davantage à chaque nouveau bar. Pour être honnête, je ne vois pas un grand impact... Parfois, pendant des dizaines de barres d'affilée, le modèle reste le même qu'avant (mécanisme de protection contre l'overfitting du modèle). Mais si un banquier dit quelque chose de faux dans les nouvelles, et que le prix se trompe quelque part, on peut espérer que le modèle rattrapera tous les changements récents en quelques mesures. Il n'est pas très utile d'adapter le modèle à chaque barreau, mais s'il existe un moyen de réagir rapidement aux changements, il est dommage de ne pas l'utiliser.
Pouvez-vous nous en dire plus sur l'APC ? Comment éliminer les déchets de cette manière ?
Il y a une centaine de pages, Sannych a posté un lien vers l'article "Analyse en composantes principales" dans ce sujet. Je l'ai utilisé pour faire un code et l'ai entré ici aussi. Vous devez lire de nombreuses pages pour le trouver.
J'ai bien aimé cet article aussi, mais il n'y a ni R ni MQL, il ne contient qu'excel. Mais elle explique plus clairement le principe de fonctionnement. h ttp://www.chemometrics.ru/materials/textbooks/pca.htm
Découvrez comment fonctionne la méthode des composantes principales.
Mais il y a aussi un commentaire intéressant de darkAlert qui explique pourquoi cette méthode ne fonctionnera pas dans certaines tâches d'application. Je cite :
"Vous avez oublié de mentionner que l'ACP (comme les autres méthodes classiques de réduction des données multivariées) ne recherche que les dépendances linéaires..."
Lorsqu'elle est appliquée au trading, la méthode n'est pas adaptée car les propriétés des prédicteurs sous la forme de valeurs d'indices et d'oscilli alimentant les entrées sont par nature non linéaires.
^GSPC est extrait de http://finance.yahoo.com, je pense que c'est fiable.
UNRATE, PAYEMS, GDP sont tirés de FRED (probablement https://fred.stlouisfed.org/) , c'est la partie délicate, merci pour l'avertissement.
Je préfère utiliser l'eurusd horaire plus tard.
*quelqu'un a frotté quelque chose, c'était une réponse au fait que tous ces indices gouvernementaux recalculent parfois et changent leurs valeurs historiques.
Vous pouvez, mais je ne le dirai pas))
L'importance est calculée à partir du poids de la désespérance. C'est tout. Utiliser ou non,
si la réduction dimensionnelle est nécessaire, si l'on ne finit pas par jeter le bébé avec l'eau,
s'appliquer à l'abysse ou au prétraitement... une autre question...
Je ne fais pas le prétraitement d'une manière beaucoup plus simple en supprimant certaines données, ce qui, à mon avis, n'est pas bon...... Parce qu'il est nécessaire d'envoyer chaque signal à TC sans l'effacer. Il n'y a qu'une seule idée, celle d'amener la variable de sortie vers l'entrée. Ainsi, un certain élément d'ajustement :-) MAIS
si l'on tient compte du fait que la variable de sortie est contrôlée par la quantité de profit du CT, alors en changeant ce paramètre, dans tous les cas, il est possible de savoir quelle est la qualité de nos données d'entrée. HM.... Laissez-moi vous expliquer. Il y a une philosophie de sélection de la variable de sortie Un exemple simple nous avons deux signaux :
Le gain de Blue est de 1 pip. Dans mes conditions d'installation, il est dit de marquer d'une croix les signaux de plus de 50 pips. Ce signal bleu sera marqué comme 0, bien que le marché ait tendance à monter et que ce signal bleu puisse être marqué comme 1. En ajustant le paramètre de profit, nous incluons et excluons ainsi des éléments supplémentaires dans notre ensemble de sortie pour obtenir la capacité de généralisation maximale...... Cela peut se faire dans une fourchette de moins 100 pips d'écart. Avec la méthode de la force brute, cela prend un temps fou, même par incréments de 10, cela devrait s'exécuter au moins dix fois....... Quoi qu'il en soit, la question reste ouverte.
Non seulement je suis trop paresseux pour trouver un lien pour vous dans ce fil, mais je n'en ai pas besoin.
Si vous aviez l'amabilité de parcourir ce fil. L'APC n'élimine pas les déchets comme ça - il y a une nuance. Il est donc logique de le rechercher.
Le modèle que j'essaie de mettre à niveau maintenant - oui, j'apprends davantage à chaque nouveau bar. Pour être honnête, je ne vois pas un grand impact... Parfois, pendant des dizaines de barres d'affilée, le modèle reste le même qu'avant (mécanisme de protection contre l'overfitting du modèle). Mais si un banquier dit quelque chose de faux dans les nouvelles, et que le prix se trompe quelque part, on peut espérer que le modèle rattrapera tous les changements récents en quelques mesures. Il est inutile d'adapter le modèle à chaque bar, mais s'il existe un moyen de réagir rapidement aux changements, utilisons-le.
J'ai essayé à plusieurs reprises de faire passer une idée qui me paraît évidente : il n'existe pas d'outil unique qui puisse être utilisé sans ré-entraîner le modèle en cas de petite erreur.
Il faut aller dans le sens du grain : nettoyer les déchets évidents, mettre à l'échelle, peut-être Voh-Soh, sélectionner les prédicteurs, choisir un modèle..... et ensuite il s'avère que tout doit être jeté car la cible est totalement ratée.....
Dans ma pratique, il y a littéralement 3-5% d'erreur en moins à chaque étape. Et si, au départ, le modèle donnait une erreur de plus de 40 %, et qu'il était réentraîné, je parvenais à faire passer le modèle non réentraîné à 20 %. Environ six mois de travail.
OK, y a-t-il des experts en MQL ici ????. Puisque nous sommes tous ici :-)
Pouvez-vous me dire comment optimiser une variable pour que l'autre soit égale à 0 ? ? ??? Ou du moins proche de zéro .....
Optimisation générale d'une variable en fonction d'une autre variable....