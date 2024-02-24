L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 373

elibrarius:
Extrait de l'article de Reshetov expliquant le fonctionnement de son RNN.

"Cet article examine en détail le problème du surentraînement des réseaux neuronaux, identifie ses causes et propose une façon de résoudre le problème.

1. Pourquoi un réseau neuronal est-il recyclé ?

Quelle est la raison du recyclage des réseaux neuronaux ? En fait, il peut y avoir plusieurs raisons à cela :
  1. Le nombre d'exemples dans un échantillon d'entraînement n'est pas suffisant pour résoudre les problèmes hors échantillon.
  2. Les données d'entrée sont distribuées de manière inégale par le degré de corrélation aux données de sortie dans différents échantillons, ce qui est très souvent le cas lors du traitement de données non stationnaires. Par exemple, dans un échantillon d'apprentissage, la corrélation de n'importe quel paramètre d'entrée ou de plusieurs paramètres d'entrée par rapport aux valeurs de sortie est significativement plus élevée que dans un échantillon de test, ou pire, les coefficients de corrélation dans différents échantillons ont un signe différent. Cela peut être facilement vérifié en calculant les coefficients de corrélation pour tous les paramètres dans différents échantillons avant de former le réseau neuronal. Et pour se débarrasser de cet inconvénient, rien de plus simple : les exemples de formation sont distribués de manière aléatoire parmi les échantillons.
  3. Les paramètres d'entrée ne sont pas liés aux paramètres de sortie, c'est-à-dire qu'il n'y a pas de relation de cause à effet entre eux - ils ne sont pas représentatifs et il n'y a donc rien pour entraîner le réseau neuronal. Et la vérification des corrélations entre les données d'entrée et de sortie montrera une corrélation proche de zéro. Dans ce cas, vous devez chercher d'autres données d'entrée sur lesquelles former le réseau neuronal.
  4. Les données d'entrée sont fortement corrélées entre elles. Dans ce cas, vous devez laisser les données d'entrée présentant la corrélation maximale avec les données de sortie, en supprimant les autres données qui présentent une bonne corrélation avec les données restantes.
Toutes les raisons susmentionnées du surentraînement et les méthodes permettant de les éliminer sont connues de tous, car elles ont été décrites précédemment dans divers ouvrages ou articles sur la technologie des réseaux neuronaux. "


Seulement, il ne s'agit pas d'un réseau de neurones au sens propre du terme, mais d'un classificateur. C'est pourquoi il n'est pas réentraîné, mais les paramètres sont ajustés dans l'optimiseur. Rien n'empêche d'utiliser également le réseau neuronal dans l'optimiseur, avec un nombre différent de couches et une période différente de caractéristiques et même leur nombre, ce serait encore mieux.

Pour en savoir plus, consultez le site https://www.mql5.com/ru/articles/3264.

Oleg avtomat:

Bendat J., Pearsol A.

Analyse appliquée des données aléatoires : Traduit de l'anglais : World, 1989.

En. 126

EXEMPLE 5.4. VARIABLES ALÉATOIRES DÉPENDANTES NON CORRÉLÉES.



Deux variables aléatoires X et Y sont ditescorrélées si leur moment de corrélation (ou coefficient de corrélation, ce qui revient au même) est différent de zéro ; X et Y sont dites non corrélées si leur moment de corrélation est nul.
Deux quantités corrélées sont également dépendantes. En effet, en supposant le contraire, nous devons conclure que µxy=0, ce qui contredit la condition puisque
pour les quantités corrélées µxy ≠ 0.
L'hypothèse inverse n'est pas toujours vraie, c'est-à-dire que si deux variables sont dépendantes, elles peuvent être corrélées ou non. En d'autres termes, l'élan de corrélation de deux variables dépendantes peut ne pas être égal à zéro, mais peut aussi être égal à zéro.


Ainsi, la corrélation entre deux variables aléatoires implique qu'elles sont dépendantes mais la corrélation n'implique pas nécessairement la corrélation. L'indépendance de deux variables implique qu'elles ne sont pas corrélées, mais l'indépendance ne peut pas encore être déduite de la non-corrélation.

Dimitri:


1. personne n'analyse la corrélation - il s'agit du choix des prédicteurs.

2) Vous avez répété mon point de vue trois pages plus tôt :"La dépendance est un cas particulier de corrélation. Si deux variables sont dépendantes, alors il y a certainement une corrélation. S'il y a corrélation, il n'y a pas nécessairement dépendance."

3. l'entropie croisée, tout comme la corrélation, ne donnera pas de réponse par la présence d'une dépendance fonctionnelle.


C'est là que j'ai eu tort - je l'admets.

Si les variables aléatoires sont indépendantes, elles sont également non corrélées, mais on ne peut pas déduire l'indépendance de la non-corrélation.

Si deux variables sont dépendantes, elles peuvent être corrélées ou non corrélées.

 
Maxim Dmitrievsky:


Seulement, il ne s'agit pas d'un réseau neuronal au sens propre du terme, mais d'un classificateur. C'est pourquoi il n'est pas réentraîné, mais les paramètres sont ajustés dans l'optimiseur. Rien n'empêche d'utiliser également le réseau neuronal dans l'optimiseur, avec un nombre différent de couches et une période différente de caractéristiques et même leur nombre, ce serait encore mieux.

lire plus ici, il y a tout un cadre même https://www.mql5.com/ru/articles/3264

Cette citation se réfère exactement aux réseaux neuronaux au sens plein du terme, et ce sont ces problèmes qu'il tente de résoudre dans son RNN. Il ne s'agit pas du RNN mais du fait que la corrélation entrée-sortie est importante, et que la corrélation des entrées entre elles est néfaste, et je pense que cela peut s'appliquer aux NS et RNN conventionnels, ainsi qu'aux EA conventionnels.
elibrarius:
La citation ci-dessus se réfère exactement aux réseaux neuronaux au sens plein du terme, et voici les problèmes qu'il tente de résoudre dans son RNN

Oui, et ils sont résolus simplement en énumérant tous les paramètres possibles et en les comparant à l'avenir... on peut faire exactement la même chose avec NS. Son RNN est réentraîné de la même manière, nous choisissons simplement les paramètres stables les plus optimaux en comparant le backtest avec le forward... tout est exactement la même chose qu'avec NS, seulement dans le cas de NS nous devons choisir non pas les poids mais les entrées-sorties dans l'optimiseur.
 
Dimitri:

Si deux quantités sont dépendantes, elles peuvent être soit corrélées, soit non corrélées.

Vous l'avez finalement eu))) La corrélation ne donne qu'une dépendance linéaire et NS n'a rien à voir avec cela, aussi s'il vous plaît ne confondez pas "corrélation pour la régression non linéaire" et "corrélation non linéaire", la corrélation est :

Tout le reste n'est qu'alternatifisme et humanitarisme.

 
Alyosha:
Vous l'avez finalement eu))) La corrélation ne donne qu'une dépendance linéaire et NS n'a rien à voir avec cela, aussi s'il vous plaît ne confondez pas "corrélation pour régression non linéaire" et "corrélation non linéaire", la corrélation c'est ça :

Tout le reste est alternatif et humanitaire.


Encore une fois, quarante-cinq....

Quelle étrange personne vous êtes - au-dessus de votre post deux posts noir sur blanc il est dit que la présence ou l'absence de corrélation ne signifie pas qu'il y a une corrélation du tout et encore la corrélation "donne" quelque chose à quelqu'un.

Je commence à manquer de mains....

 
Dimitri:


Encore une fois - fortyfold....

Quelle étrange personne vous êtes - au-dessus de votre post deux posts noir sur blanc il est dit que la présence ou l'absence de corrélation ne signifie pas du tout corrélation et encore la corrélation "donne" quelque chose à quelqu'un.

J'ai un peu le moral dans les chaussettes. ....


Vous avez soutenu que :

Dimitri:


Toute la MO est basée sur le fait que les variables d'entrée devrait encorrélation avec la variable de sortie.

Sinon, il n'y a aucun intérêt à utiliser TOUS les modèles de MO.

En Data Mining, dans TOUS LES MODÈLES DE SÉLECTION DE VARIABLES, le mécanisme de corrélation maximale de la variable entrante et de la variable sortante est mis en œuvre :

Ils ont donc fait une grosse erreur et se sont ridiculisés.


SZZ "la présence ou l'absence de corrélation ne signifie pas du tout qu'il y a une dépendance" - encore une fois - une absurdité. La corrélation est exactement ce qui montre une dépendance linéaire, mais il existe des dépendances non linéaires que la corrélation ne montre pas.

Aliosha:


Vous l'avez déclaré :

C'est-à-dire qu'ils ont merdé, ils se sont mis dans l'embarras.


ZS "la présence ou l'absence de corrélation ne signifie pas du tout une dépendance" - encore une fois - un non-sens. La corrélation est exactement ce qui montre une dépendance linéaire, mais il existe des dépendances non linéaires que la corrélation ne montre pas.


J'aime quand quelqu'un roule scientifiquement quelqu'un :))
 
Aliosha:


ZS "la présence ou l'absence de corrélation ne signifie pas du tout une dépendance" - encore une fois - un non-sens. La corrélation montre une dépendance linéaire, mais il existe des dépendances non linéaires que la corrélation ne montre pas.

Il existe un exemple classique de fausse corrélation : le nombre de personnes se noyant dans les piscines américaines est directement et fortement corrélé au nombre de films mettant en vedette Nicolas Cage.

Il y a une corrélation - où est la GRANDE corrélation ?

