L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 255

 
mytarmailS:

1. pourquoi normaliser manuellement ? il existe la fonction scale().

2. pourquoi la corrélation -1 et 1 est-elle bonne ? seulement si 1 est bon -1 est très mauvais, si je comprends bien l'idée, -1 est une corrélation inverse

3. avez-vous essayé de surveiller l'erreur d'un modèle entraîné dans une fenêtre glissante, et si cela ne vous convient pas, entraînez à nouveau le modèle et voyez ce qui se passe ?

4. et l'idée globale de pourquoi tout fonctionne si mal, le marché n'est pas stationnaire, nous devons élaborer un autre concept de formation des caractéristiques, peut-être passer complètement au paradigme des règles logiques, je pense que nous devrions nous éloigner des chiffres presque complètement, ou étudier l'analyse du spectre))))).

1) Je n'ai jamais pu utiliser la fonction scale(), elle se met à l'échelle et se centre au milieu de nulle part. Idéalement, il serait préférable d'utiliser le paquet Caret pour le prétraitement, il met tout à l'échelle/centre bien, mais l'utilisation d'un autre paquet serait trop lourde pour un exemple aussi simple.

2) une corrélation proche de zéro signifie qu'il n'y a pas de corrélation, c'est le pire des cas. Le bénéfice sur le test dans ce cas ne dit rien du bénéfice potentiel sur les nouvelles données.
-1 est le cas lorsqu'une grande précision lors de la formation donne systématiquement de mauvais résultats sur les nouvelles données. Mais en même temps, un résultat faible dans la formation signifiera un meilleur résultat sur les nouvelles données :) Cela peut se produire si le modèle est facilement adapté aux données et réentraîné, et qu'avec un résultat faible lors de l'entraînement, il n'a tout simplement pas assez de temps pour mémoriser les données et, d'une manière ou d'une autre, se retrouve miraculeusement dans le positif. Par exemple, la précision sur les données d'apprentissage peut varier de 0,9 à 1 et dans ce cas 0,9 sera "faible" et la précision sur les nouvelles données variera de 0,5 à 0,6 où 0,6 sera "élevé". En d'autres termes, le modèle présentant un résultat moins bon n'est pas réentraîné, il possède une meilleure logique de généralisation et, par conséquent, le résultat sur les nouvelles données est également meilleur.
Tout cela est beau en paroles, mais en réalité je n'ai jamais vu de corrélation négative stable. C'est plus confortable et plus facile d'aller vers +1.

3) Bien que je comprenne que le modèle ne me convient pas - un certain temps passera, pendant lequel il perdra tellement qu'un modèle normal ne fonctionnera pas alors. Vous pouvez commencer par négocier de nouveaux modèles sur un compte de démonstration, mais il se peut qu'ils soient obsolètes au moment où le modèle devient rentable et où je commence à le négocier sur un compte réel. Je ne l'ai pas essayé. Je ferais mieux de vérifier au préalable que l'ensemble de l'algorithme d'apprentissage fonctionne et donne des modèles constamment rentables, et de choisir quelque chose en quoi j'ai confiance pour trader sur le compte réel.
Si l'algorithme d'apprentissage est bon, il est préférable de mettre à jour un ancien modèle fonctionnel avec de nouvelles données que de créer de nouveaux modèles à partir de zéro.

4) L'ingénierie des fonctionnalités est bonne. J'utilise par exemple des indicateurs de mt5 plutôt que des prix nus.

 
Dr. Trader:
Et avec quelle précision votre bon modèle prédit-il la couleur d'une bougie de suivi sur de nouvelles données en conditions réelles ? Vous négociez sur le graphique quotidien, n'est-ce pas ?
 
mytarmailS:
Et avec quelle précision votre bon modèle prédit-il la couleur de la trace d'un chandelier sur de nouvelles données en conditions réelles ? Vous traitez sur le graphique quotidien, n'est-ce pas ?

Je suis en H1, la cible est la couleur de la prochaine bougie. La précision des prédictions n'est que de 55%-60%, mais c'est suffisant. Même dans une tendance, le prix ne monte pas toujours, mais rebondit constamment vers le haut et vers le bas sur les barres suivantes, de sorte que ces rebonds gâchent considérablement la précision. L'essentiel est que le modèle lui-même ne fluctue pas et qu'une fois entré dans la transaction, il y reste jusqu'à la fin de la tendance.

 
Dr. Trader:

L'essentiel est que le modèle ne s'agite pas tout seul, et qu'une fois qu'il est entré dans la transaction, il y reste jusqu'à la fin de la tendance. L'essentiel est que le modèle lui-même n'oscille pas et qu'une fois qu'il est entré dans la transaction, il y reste jusqu'à la fin de la tendance.

Y a-t-il un moyen de lisser la cible ?
 
mytarmailS:

Ce sentiment quand vous commencez à penser que vous comprenez le marché...

Ce sentiment quand une autre déception arrive (( :)
 

vidéo très intéressante.... sur la sélection des caractéristiques, les algorithmes et même un peu sur les marchés.

https://www.youtube.com/watch?v=R3CMqrrIWOk

 
mytarmailS:

vidéo très intéressante.... sur la sélection des caractéristiques, les algorithmes et même un peu sur les marchés.

https://www.youtube.com/watch?v=R3CMqrrIWOk

C'est vraiment intéressant. C'est dommage qu'il n'y ait pas grand chose sur les marchés en particulier, quelque chose comme "Si je commence à prédire les prix du pétrole, je vais probablement me faire tuer" :) (ma citation est inexacte, je l'ai écrite de mémoire).

La première demi-heure de vidéo - ici, Alexey en a parlé dans le fil de discussion. Même le code R était joint. Je ne peux pas le trouver maintenant, je dois feuilleter les premières dizaines de pages, et il y avait un lien vers son article à ce sujet sur le hbr.
Pour moi, cette méthode de sélection des prédicteurs pour le forex n'a malheureusement pas été utile, tous mes prédicteurs étaient trop peu informatifs, je pense que cet algorithme est adapté à des données plus stationnaires. Ou nous avons besoin de plus de nouveaux prédicteurs.

 

Messieurs, quelqu'un peut-il me donner un exemple de réseau neuronal fonctionnant sur une entrée avec des tableaux comme m1[1000,1000] m2[1000,1000] etc. Je m'excuse pour ma stupidité.

Je n'ai pas encore travaillé avec la neuronique, je veux m'entraîner. Je ne comprends pas vraiment comment on règle les paramètres. Je vous en serais très reconnaissant.

peut-être que quelqu'un a envisagé la méthode du prédicteur-correcteur

 
Top2n:

sur l'entrée avec des tableaux, par exemple m1[1000,1000] m2[1000,1000] etc.

Vous voulez alimenter deux tableaux, chacun avec 1000 exemples d'entraînement, et 1000 entrées pour le réseau ? Ça ne marchera pas, vous devrez les combiner en un seul. Ou vous voulez dire autre chose ?
 
Dr. Trader:
Vous voulez alimenter deux tableaux avec 1000 exemples de formation chacun et 1000 entrées pour le réseau ? Cela ne marchera pas, il faudra les fusionner en une seule. Ou vous voulez dire autre chose ?

Chaque tableau[][] est un ensemble d'informations de qualité unique, c'est-à-dire que pour chaque entrée, un tableau[][] distinct. Je veux alimenter beaucoup de tableaux, je suis prêt pour l'instant 4, je prévois d'en créer plus, chaque tableau décrit l'état du prix, il s'avère sous différents angles, c'est comme ça.

Chaque tableau contient 1000 lignes et 1000 colonnes, j'ai donc un tableau tridimensionnel, et la dimension K est la nouvelle dimension bidimensionnelle.
Raison: