L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3286

 
Andrey Dik #:

Eh bien, cela ressemble déjà à l'opinion d'un professionnel (qu'elle soit juste ou non est une autre question).
et il n'y a aucune raison de s'en moquer.
C'est tout à fait exact, et c'est là le plus gros problème. En raison du manque de ressources pour un balisage correct (généralement le plus coûteux), ils ont même inventé l'apprentissage actif. Lorsque les algorithmes eux-mêmes essaient de baliser correctement un ensemble de données + l'aide d'annotateurs. Dans notre cas, il s'agit d'acheter ou de vendre.

Et qu'ensuite, ils trafiquent leurs propres erreurs de balisage. C'est tout simplement évident.
 
Maxim Dmitrievsky #:
Ci-dessus, j'ai parlé de matstat. Avant cela, j'ai parlé de kozul. Plus tôt encore, j'ai parlé des erreurs Oracle (erreurs de marquage), lorsque les données sont marquées d'une manière que vous ne comprenez pas. Ce qui ressort absolument de tout cela, c'est la prise de conscience du fait que les résultats varient en fonction du volume et de la durée de la formation. Cela dépend des données, qui ne sont ni fournies ni décrites.

C'est sur ce point que porte l'expérience - ce qui est le plus important, c'est le volume ou la chronologie.

L'accent est mis sur les données de citation, et non sur un simple échantillonnage accompagné d'autres observations indépendantes de la chronologie. Si le temps est important, les méthodes de fractionnement de l'échantillon, par exemple, telles que la validation croisée, doivent être utilisées avec prudence.

Le temps est important si le marché modifie son comportement de manière significative et irrévocable, ce qui devrait conduire à l'impossibilité d'obtenir un modèle acceptable lorsque l'on contrôle l'apprentissage à partir d'un échantillon qui diffère de manière significative dans le temps chronologique.

La question de la majoration elle-même est bien sûr importante, mais elle peut être mise entre parenthèses ici.

Si vous êtes très intéressé par le balisage, il est basé sur la stratégie de l'Expert Advisor, dont le code se trouve dans mon article.

J'ai utilisé les paramètres suivants :

А. Paramètres du testeur :

- Symbole : EURUSD

- Cadre temporel : M1

- Intervalle du 01.01.2010 au 01.09.2023

B. Paramètres de la stratégie CB_Exp EA :

- Période : 104

- Période : 2 Minutes

- Méthode de déplacement : Lissé

- Base de calcul du prix : Close price


Les prédicteurs sont les mêmes que dans cet Expert Advisor.

 
Andrey Dik #:

Je ne sais pas, mais c'est intéressant de le savoir.

J'en suis très heureux, ce n'est donc pas pour rien que j'exprime ici mes pensées à voix haute.

 
Aleksey Vyazmikin #:

C'est sur ce point que porte l'expérience : qu'est-ce qui est le plus important, le volume ou la chronologie ?

Il n'y a pas de problème de primauté. Il y a un problème de balisage. Tant que vous le mettez entre parenthèses, je mettrai vos efforts entre parenthèses.

 
Aleksey Vyazmikin #:

L'accent est mis sur les données de citation, et pas seulement sur un échantillon avec quelques autres observations indépendantes de la chronologie. Si le temps est un facteur essentiel, les méthodes de fractionnement de l'échantillon telles que la validation croisée doivent être utilisées avec prudence.

J'utilise Valking Forward pour les mêmes raisons.
Et oui, la taille de la courbe de train dépend fortement de la taille de la courbe. Par exemple, sur 20000 lignes, on trouve quelque chose sur la marche avant, mais sur 5000 ou 100000, c'est aléatoire.

 
Forester #:

J'utilise Valking Forward pour les mêmes raisons.
Et oui, la taille de la section du train est très importante. Par exemple, sur 20000 lignes, on trouve quelque chose sur l'avant, mais sur 5000 ou 100000, c'est aléatoire.

Mais vous pouvez imaginer pourquoi il en est ainsi, n'est-ce pas ? ) à cause d'un partitionnement incorrect et d'un hasard qui tombe dans l'intervalle où il est le plus correct :)

le mot "random" fait déjà allusion à matstat.
 
Maxim Dmitrievsky #:

Le problème n'est pas de savoir ce qui est le plus important. Il y a un problème de balisage. Tant que vous mettrez ce problème entre parenthèses, je mettrai vos efforts entre parenthèses.

Chacun voit le problème différemment. Et chacun cherche ses propres solutions. Je recherche la stabilité des données, quel que soit le balisage, et il s'agit d'une orientation différente, qui n'est pas en contradiction avec la vôtre.

Pour moi, la question la plus importante est de savoir comment estimer la stabilité avec une forte probabilité ou contrôler sa mesure avec une petite accumulation d'observations. Cela permettra de travailler avec n'importe quel type de marquage.

 
Aleksey Vyazmikin #:

Chacun voit les problèmes différemment. Et cherche ses propres solutions. Je recherche la stabilité des données, quel que soit le balisage , et il s'agit d'une orientation différente, qui n'est pas en contradiction avec la vôtre.

Pour moi, la question la plus importante est de savoir comment estimer la stabilité avec une forte probabilité ou contrôler sa mesure avec une petite accumulation d'observations. Cela permettra de travailler avec n'importe quel type de marquage.

Ce doit être une bonne idée de marquer les chats comme des chameaux et de chercher la stabilité dans ce domaine.

Je me suis habitué à ce que tout dialogue avec vous aboutisse à une impasse mentale.

 
Maxim Dmitrievsky #:

Ce doit être une tendance cool de marquer les chats comme des chameaux et de rechercher la stabilité.

Je me suis habitué à ce que tout dialogue avec vous aboutisse à une impasse mentale.

Quelle différence cela fait-il qu'il s'agisse de chats ou de chameaux si l'on peut évaluer leur utilité en dehors de la formation ?

Drôle de logique en effet.

 
Aleksey Vyazmikin #:

On s'en fout que ce soit des chats ou des chameaux si on peut évaluer leur utilité en dehors du dressage.

😀
Raison: