L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3084

 
Viktor Kudriavtsev #:

Bonjour à tous. J'essaie d'entraîner des Expert Advisors tirés d'une grande série d'articles sur les réseaux neuronaux sur ce site. J'ai l'impression qu'ils ne sont pas entraînables. J'ai essayé de poser des questions à l'auteur sous les articles, mais malheureusement il ne répond pas de manière pratique...(

Par conséquent, une question aux membres du forum - veuillez me dire combien il faut entraîner un réseau neuronal pour qu'il commence à donner des résultats (non aléatoires) ?

J'ai essayé tous les EA de l'article 27 au dernier - le résultat est le même - aléatoire. Je suis passé de 300 à 1000 époques d'entraînement, comme indiqué par l'auteur. Si l'Expert Advisor est juste avec des itérations, j'ai fait de 100 000 à 20 000 000 itérations et ainsi de suite 2-3 approches, toujours aléatoire.

Quelle quantité d'entraînement faut-il prévoir ? Quelle est la taille d'un échantillon d'entraînement suffisant (s'il est préconstitué) ?

PS : Des informations simples sur les réseaux neuronaux dans google read, en général avec les réseaux neuronaux sont familiers. Tous écrivent environ 100-200 époques et il devrait déjà y avoir un résultat (sur des images, des figures, des classifications).

N'avez-vous aucun résultat sur l'échantillon d'entraînement ?

Le cycle de ces articles n'est pas une solution prête à l'emploi - personne ne révélera la chose la plus précieuse dans l'apprentissage automatique - les prédicteurs. Avant d'essayer les méthodes proposées, vous devez donc développer un ensemble de prédicteurs susceptibles de décrire le comportement des prix.

 
Viktor Kudriavtsev #:

Bonjour à tous. J'essaie d'entraîner des Expert Advisors tirés d'une grande série d'articles sur les réseaux neuronaux sur ce site. J'ai l'impression qu'ils ne sont pas entraînables. J'ai essayé de poser des questions à l'auteur sous les articles, mais malheureusement il ne répond pas de manière pratique...(

Par conséquent, une question aux membres du forum - veuillez me dire combien il faut entraîner un réseau neuronal pour qu'il commence à donner des résultats (non aléatoires) ?

J'ai essayé tous les EA de l'article 27 au dernier - le résultat est le même - aléatoire. Je suis passé de 300 à 1000 époques d'entraînement, comme indiqué par l'auteur. Si l'Expert Advisor est juste avec des itérations, j'ai fait de 100 000 à 20 000 000 itérations et ainsi de suite 2-3 approches, toujours aléatoire.

Quelle quantité d'entraînement faut-il prévoir ? Quelle est la taille d'un échantillon d'entraînement suffisant (s'il est préconstitué) ?

PS : Des informations simples sur les réseaux neuronaux dans google read, en général avec les réseaux neuronaux sont familiers. Tous écrivent environ 100-200 époques et il devrait déjà y avoir un résultat (sur des images, des figures, des classifications).

Et où est-il écrit qu'ils ne doivent pas donner un résultat aléatoire ? L'abondance d'articles identiques suggère déjà une mauvaise direction.

L'apprentissage par renforcement n'est pas conçu pour de telles tâches, le champ d'application est tout à fait différent. Vous pouvez jouer avec.
 
Lilita Bogachkova #:

Oui,

mais le grand nombre de valeurs identiques me fait douter de la qualité globale des données.
Exemple : seq = ([5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5]) = [5,5,5,5,5,5,5,5][5] ; [5,5,5,5,5,5,5,5,5,5][5] ; [5,5,5,5,5,5,5,5,5,5][5] ....
Je ne vois pas l'intérêt d'alimenter le modèle avec de telles données d'entraînement ;

Je continue donc à éliminer toutes les données qui ne sont pas uniques.

Je peux me tromper, mais il me semble erroné d'alimenter également le modèle avec les données d'entraînement suivantes :

[1,2,3,4,5] [5] ;

[1,2,3,4,5] [6] ;

[1,2,3,4,5] [7] ;

[1,2,3,4,5] [8] ;

...

C'est de la foutaise

 
Aleksey Vyazmikin #:

Vous n'avez pas non plus de résultat sur l'échantillon d'entraînement ?

La série d'articles n'est pas une solution prête à l'emploi - personne ne vous révélera l'élément le plus précieux de l'apprentissage automatique - les prédicteurs. Avant d'essayer les méthodes proposées, vous devez donc développer un ensemble de prédicteurs susceptibles de décrire le comportement des prix.

Yes ne fonctionne pas non plus sur l'échantillon d'apprentissage. Il ne fonctionne nulle part. Et que sont les prédicteurs dans ce cas ? L'auteur décrit la prise en compte des paramètres du graphique sous la forme de chandeliers, du temps et de 4 indicateurs. Le modèle de réseau neuronal est également présent.
 
Maxim Dmitrievsky #:

où est-il écrit qu'ils ne doivent pas donner de résultats aléatoires ? L'abondance d'articles identiques suggère déjà une mauvaise direction.

L'apprentissage par renforcement n'est pas conçu pour de telles tâches, le champ d'application est tout à fait différent. Vous pouvez jouer avec.
L'auteur donne un graphique et des statistiques du testeur de stratégie à la fin de chaque article. Si les statistiques sont fictives, alors oui....
 
Viktor Kudriavtsev #:
Il ne fonctionne pas non plus sur l'échantillon de formation. Il ne fonctionne nulle part. Et que sont les prédicteurs dans ce cas ? L'auteur décrit la prise en compte des paramètres du graphique sous la forme de chandeliers, du temps et de 4 indicateurs. Le modèle de réseau neuronal est également présent.

S'il ne fonctionne pas sur l'échantillon d'entraînement, le problème vient probablement de votre côté. Les réseaux neuronaux prennent beaucoup de temps pour s'entraîner - ce qui n'est pas le cas des modèles arborescents.

Les prédicteurs peuvent être n'importe quoi, n'importe quel facteur affectant le prix avec un résultat probabiliste stable, oui, en option - des indicateurs.

L'auteur a commis quelques erreurs dans le code (critiques pour les cartes non Intel) - quelques versions des règles à la demande des utilisateurs.
 
Aleksey Vyazmikin #:

S'il ne fonctionne pas non plus sur l'échantillon d'apprentissage, il y a probablement un problème de votre côté. L'apprentissage des réseaux neuronaux prend beaucoup de temps, contrairement aux modèles arborescents.

Les prédicteurs peuvent être n'importe quoi, n'importe quel facteur affectant le prix avec un résultat probabiliste stable, oui, en option - des indicateurs.

L'auteur a commis quelques erreurs dans le code (critiques pour les cartes non-Intel) - quelques versions des règles à la demande des gens.

J'ai les derniers articles (à partir de GoExplore) et les articles 27 à 35 semblent compiler et fonctionner normalement. N'a pas fonctionné 36-38 est que dans le testeur formé. J'ai une carte Nvidia GTX 660 ti.

Quel pourrait être le problème de mon côté ? Mon sovtnik compile, fonctionne, le processus d'apprentissage (erreur et progrès sur le graphique) continue. Et quel est le montant de la dette ? L'auteur des articles écrit aussi beaucoup, il faut répéter les itérations de collecte d'exemples et d'entraînement, mais nulle part il n'écrit de chiffres au moins approximatifs. Par exemple, j'ai entraîné 500 époques, les premières transactions ont commencé à être négatives. Il faut au moins une certaine spécificité dans les chiffres. Sinon, ce n'est pas clair du tout, soit j'enseigne beaucoup et quelque chose ne va pas, soit je n'ai pas assez enseigné et il est trop tôt pour s'attendre à quoi que ce soit.

 
Viktor Kudriavtsev #:
À la fin de chaque article, l'auteur fournit un graphique et des statistiques provenant du testeur de stratégie. Si les statistiques sont fictives, alors oui....
Il s'agit de tests très modestes sur une courte période, et il est impossible d'en tirer des conclusions sans ambiguïté. Si cela ne fonctionne pas même sur l'entraînement, cela signifie qu'ils ont fait un gros gâchis :) L'approche elle-même est inadaptée, car le processus de formation est difficile à contrôler. Et si vous trouvez la bonne fonction de contrôle (récompenses), vous n'en avez plus besoin.
J'en ai essayé plusieurs, mais je n'ai pas réussi à obtenir des résultats stables.

En outre, cette méthode est plus complexe sur le plan informatique que l'optimisation génétique, mais elle n'est pas meilleure en termes d'efficacité. Elle peut être réalisée en une seule itération avec des résultats similaires. Sans les connaissances d'un expert dans le domaine du trading, rien de bon n'en sortira.
 
Maxim Dmitrievsky #:
Il y a des tests très modestes sur une courte période, on ne peut pas en tirer des conclusions sans ambiguïté. Si cela ne fonctionne pas, même sur un programme de formation, cela signifie qu'ils ont fait beaucoup d'erreurs :) L'approche elle-même n'est pas appropriée, car le processus de formation est difficile à contrôler. Et si vous trouvez la bonne fonction de contrôle (récompenses), vous n'en avez plus besoin.
.
J'ai essayé plusieurs méthodes, mais je n'ai pas réussi à obtenir des résultats stables.

Cette méthode est plus compliquée sur le plan informatique que l'optimisation génétique, mais elle n'est pas meilleure en termes d'efficacité. Elle peut être réalisée en une seule itération, avec des résultats similaires. Sans connaissances spécialisées dans le domaine du trading, rien de bon n'en sortira.
J'ai essayé de former des conseillers experts de cette série en utilisant des méthodes génétiques et évolutionnaires (articles 30 et 31). L'auteur dispose de 1000 époques dans les paramètres. La population est de 50 individus par époque si j'ai bien compris. Le meilleur résultat est affiché dans le journal lors de l'entraînement. Donc pour 200 époques ce meilleur résultat n'a pas changé par rapport au résultat initial. J'ai aussi mis la population de 100 individus et j'ai entraîné environ 150 époques. L'effet est le même. J'ai donc abandonné cette méthode et suis passé à des méthodes plus récentes.
 
Viktor Kudriavtsev #:
J'ai essayé d'entraîner des EA à partir de ce cycle en utilisant des méthodes génétiques et évolutionnaires (articles 30 et 31). L'auteur a 1000 époques dans les paramètres. La population est de 50 individus par époque, si j'ai bien compris. Le meilleur résultat est affiché dans le journal lors de l'apprentissage. Donc pour 200 epochs ce meilleur résultat n'a pas changé par rapport au résultat initial. J'ai aussi mis la population de 100 individus et j'ai entraîné environ 150 époques. L'effet est le même. J'ai donc abandonné cette méthode et suis passé à d'autres plus récentes.

C'est une perte de temps totale que de perdre du temps avec des modèles nouveaux, surtout s'ils sont complexes.

L'idéal en matière de radiofréquences est un modèle simple et très clair. Vous pouvez prendre deux ou trois modèles supplémentaires à partir de modèles anciens et bien testés, si vous envisagez d'obtenir le résultat final par le biais d'un ensemble de modèles (ce qui donne une réduction de l'erreur d'environ 5 %).

Mon scepticisme s'explique très simplement : notre principal ennemi n'est PAS la stationnarité des marchés financiers, c'est-à-dire que le théorème de la limite et toutes les statistiques qui en découlent - différentes corrélations, dispersions, etc. D'ailleurs, les estimations comme le RMSE.


C'est pourquoi il faut commencer par le prétraitement (datamining). Sans l'obtention d'un ensemble de prédicteurs ayant un lien suffisamment stable avec la cible (l'enseignant), il est inutile de parler de quoi que ce soit. C'est la qualité de cette connexion qui détermine l'erreur de prédiction et sa stabilité à différents moments des citations. Le modèle n'a rien à voir là-dedans. Si, avec RF, vous obtenez approximativement la même erreur de prédiction "en échantillon" et "hors échantillon", inférieure à 20 %, vous pouvez alors essayer le même ensemble de prédicteurs et viser à réduire l'erreur de prédiction grâce à des modèles plus avancés, à un ensemble de modèles, etc.

Il y a une autre condition : la preuve mathématique de la stabilité du lien entre les prédicteurs et la cible, c'est-à-dire la stationnarité du lien entre les prédicteurs et la cible avec l'obtention de la variance du lien entre les prédicteurs et la cible et la preuve d'une stabilité au moins approximative au sens de GARCH.

Et différentes "époques" et siècles de tests - rien, vous vous agitez tellement, vous semblez être dans le sujet, mais vous courez sur place.

Raison: