L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 179

 
Dr. Trader:


Parlez-vous de l'analyse en composantes PCA ou d'autre chose ? Je ne me souviens pas de tous les exemples que j'ai postés ici :)

Si vous parlez de l'APC, vous ne pouvez pas faire un bonbon avec des déchets de toute façon. Il faut avoir d'assez bons prédicteurs mélangés à de mauvais, puis l'ACP peut faire le tri entre les mauvais et les bons.

Vous sous-estimez les résultats positifs de votre expérience. Il n'y a pas de graal. Mais il existe un outil complet pour lutter contre des maux tels que le surentraînement.

La toute première étape consiste à éliminer les déchets, ce qui a un impact décisif sur le surentraînement. Et dans cette première étape, l'ACP est très utile. Après cette étape, les prédicteurs pertinents pour la variable cible resteront, et tous les fantasmes disparaîtront. Mais ne surestimez pas l'importance de cette étape - c'est la première étape. Après cela, les étapes suivantes sont nécessaires :

  • rfe avant chaque formation
  • le réentraînement du modèle à chaque nouveau bar (dans l'idéal) ou pendant les week-ends.

Et vos expériences avec le rfa vont s'avérer extrêmement utiles.

PS.

Notez que j'ai délibérément gardé le silence sur le travail avec les modèles eux-mêmes.

 
SanSanych Fomenko:

Vous sous-estimez les résultats positifs de votre expérience. Il n'y a pas de graal. Il existe un outil complet pour lutter contre le fléau du surentraînement.

La toute première étape consiste à éliminer les déchets, ce qui a un impact décisif sur la reconversion. Et dans cette première étape, l'ACP est très utile. Après cette étape, les prédicteurs pertinents pour la variable cible resteront, et tous les fantasmes disparaîtront. Mais ne surestimez pas l'importance de cette étape - c'est la première étape. Après cela, les étapes suivantes sont nécessaires :

  • rfe avant chaque formation
  • le réentraînement du modèle à chaque nouveau bar (dans l'idéal) ou pendant les week-ends.

Et vos expériences avec le rfa vont s'avérer extrêmement utiles.

PS.

Notez que j'ai délibérément gardé le silence sur le travail avec les modèles eux-mêmes.

Pouvez-vous nous en dire plus sur l'APC ? Comment éliminer les déchets de cette manière ?
 
SanSanych Fomenko:

Vous sous-estimez les résultats positifs de votre expérience. Il n'y a pas de graal. Il existe un outil complet pour lutter contre le fléau du surentraînement.

La toute première étape consiste à éliminer les déchets, ce qui a un impact décisif sur la reconversion. Et dans cette première étape, l'ACP est très utile. Après cette étape, les prédicteurs pertinents pour la variable cible resteront, et tous les fantasmes disparaîtront. Mais ne surestimez pas l'importance de cette étape - c'est la première étape. Après cela, les étapes suivantes sont nécessaires :

  • rfe avant chaque formation
  • leréentraînement du modèle à chaque nouveau bar (dans l'idéal) ou pendant les week-ends.

Et vos expériences avec le rfa vont s'avérer extrêmement utiles.

PS.

Notez que j'ai délibérément gardé le silence sur le travail avec les modèles eux-mêmes.

Réentraînement du modèle sur chaque barre.... Cela signifie-t-il qu'une seule barre a un impact sur l'ensemble du modèle ? Compte tenu de l'importance de chaque barre dans l'apprentissage, votre lutte sans fin pour le recyclage devient compréhensible...
 
Andrey Dik:
Réentraînement du modèle sur chaque barre.... Cela signifie-t-il qu'une seule barre affecte l'ensemble du modèle ? En raison de l'importance de chaque barre dans l'entraînement, il met en évidence votre lutte sans fin avec le recyclage...

Le modèle que j'essaie de mettre à niveau maintenant - oui, j'apprends davantage à chaque nouveau bar. Pour être honnête, je ne vois pas un grand impact... Parfois, pendant des dizaines de barres d'affilée, le modèle reste le même qu'avant (mécanisme de protection contre l'overfitting du modèle). Mais si un banquier dit quelque chose de faux dans les nouvelles, et que le prix se trompe quelque part, on peut espérer que le modèle rattrapera tous les changements récents en quelques mesures. Il n'est pas très utile d'adapter le modèle à chaque barreau, mais s'il existe un moyen de réagir rapidement aux changements, il est dommage de ne pas l'utiliser.

Mihail Marchukajtes:
Pouvez-vous nous en dire plus sur l'APC ? Comment éliminer les déchets de cette manière ?

Il y a une centaine de pages, Sannych a posté un lien vers l'article "Analyse en composantes principales" dans ce sujet. Je l'ai utilisé pour faire un code et l'ai entré ici aussi. Vous devez lire de nombreuses pages pour le trouver.

J'ai bien aimé cet article aussi, mais il n'y a ni R ni MQL, il ne contient qu'excel. Mais elle explique plus clairement le principe de fonctionnement. h ttp://www.chemometrics.ru/materials/textbooks/pca.htm

 
Mihail Marchukajtes:
Puis-je parler davantage de l'APC ? Comment faire pour trier les déchets de cette manière ?

Découvrez comment fonctionne la méthode des composantes principales.

Mais il y a aussi un commentaire intéressant de darkAlert qui explique pourquoi cette méthode ne fonctionnera pas dans certaines tâches d'application. Je cite :

"Vous avez oublié de mentionner que l'ACP (comme les autres méthodes classiques de réduction des données multivariées) ne recherche que les dépendances linéaires..."

Lorsqu'elle est appliquée au trading, la méthode n'est pas adaptée car les propriétés des prédicteurs sous la forme de valeurs d'indices et d'oscilli alimentant les entrées sont par nature non linéaires.

Как работает метод главных компонент (PCA) на простом примере
Как работает метод главных компонент (PCA) на простом примере
  • habrahabr.ru
В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно. Математика вообще очень красивая и изящная наука, но порой ее красота скрывается за кучей слоев абстракции...
 

^GSPC est extrait de http://finance.yahoo.com, je pense que c'est fiable.

UNRATE, PAYEMS, GDP sont tirés de FRED (probablement https://fred.stlouisfed.org/) , c'est la partie délicate, merci pour l'avertissement.

Je préfère utiliser l'eurusd horaire plus tard.

*quelqu'un a frotté quelque chose, c'était une réponse au fait que tous ces indices gouvernementaux recalculent parfois et changent leurs valeurs historiques.

 
Vizard_:
Vous pouvez, mais je ne le dirai pas))
L'importance est calculée à partir du poids de la désespérance. C'est tout. Utiliser ou non,
si la réduction dimensionnelle est nécessaire, si l'on ne finit pas par jeter le bébé avec l'eau,
s'appliquer à l'abysse ou au prétraitement... une autre question...

Je ne fais pas le prétraitement d'une manière beaucoup plus simple en supprimant certaines données, ce qui, à mon avis, n'est pas bon...... Parce qu'il est nécessaire d'envoyer chaque signal à TC sans l'effacer. Il n'y a qu'une seule idée, celle d'amener la variable de sortie vers l'entrée. Ainsi, un certain élément d'ajustement :-) MAIS

si l'on tient compte du fait que la variable de sortie est contrôlée par la quantité de profit du CT, alors en changeant ce paramètre, dans tous les cas, il est possible de savoir quelle est la qualité de nos données d'entrée. HM.... Laissez-moi vous expliquer. Il y a une philosophie de sélection de la variable de sortie Un exemple simple nous avons deux signaux :

Le gain de Blue est de 1 pip. Dans mes conditions d'installation, il est dit de marquer d'une croix les signaux de plus de 50 pips. Ce signal bleu sera marqué comme 0, bien que le marché ait tendance à monter et que ce signal bleu puisse être marqué comme 1. En ajustant le paramètre de profit, nous incluons et excluons ainsi des éléments supplémentaires dans notre ensemble de sortie pour obtenir la capacité de généralisation maximale...... Cela peut se faire dans une fourchette de moins 100 pips d'écart. Avec la méthode de la force brute, cela prend un temps fou, même par incréments de 10, cela devrait s'exécuter au moins dix fois....... Quoi qu'il en soit, la question reste ouverte.

 
Mihail Marchukajtes:
Pouvez-vous nous en dire plus sur l'ACP ? Comment faites-vous pour trier les déchets de cette manière ?

Non seulement je suis trop paresseux pour trouver un lien pour vous dans ce fil, mais je n'en ai pas besoin.

Si vous aviez l'amabilité de parcourir ce fil. L'APC n'élimine pas les déchets comme ça - il y a une nuance. Il est donc logique de le rechercher.

 
Dr. Trader:

Le modèle que j'essaie de mettre à niveau maintenant - oui, j'apprends davantage à chaque nouveau bar. Pour être honnête, je ne vois pas un grand impact... Parfois, pendant des dizaines de barres d'affilée, le modèle reste le même qu'avant (mécanisme de protection contre l'overfitting du modèle). Mais si un banquier dit quelque chose de faux dans les nouvelles, et que le prix se trompe quelque part, on peut espérer que le modèle rattrapera tous les changements récents en quelques mesures. Il est inutile d'adapter le modèle à chaque bar, mais s'il existe un moyen de réagir rapidement aux changements, utilisons-le.


J'ai essayé à plusieurs reprises de faire passer une idée qui me paraît évidente : il n'existe pas d'outil unique qui puisse être utilisé sans ré-entraîner le modèle en cas de petite erreur.

Il faut aller dans le sens du grain : nettoyer les déchets évidents, mettre à l'échelle, peut-être Voh-Soh, sélectionner les prédicteurs, choisir un modèle..... et ensuite il s'avère que tout doit être jeté car la cible est totalement ratée.....

Dans ma pratique, il y a littéralement 3-5% d'erreur en moins à chaque étape. Et si, au départ, le modèle donnait une erreur de plus de 40 %, et qu'il était réentraîné, je parvenais à faire passer le modèle non réentraîné à 20 %. Environ six mois de travail.

 

OK, y a-t-il des experts en MQL ici ????. Puisque nous sommes tous ici :-)

Pouvez-vous me dire comment optimiser une variable pour que l'autre soit égale à 0 ? ? ??? Ou du moins proche de zéro .....

Optimisation générale d'une variable en fonction d'une autre variable....