L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 952

 
Dr. Trader:

Pour le dernier fichier, j'ai eu ceci avec l'arbre :

2016, formation


y_pred

y_true-101
-113392388444472
010803767146029
17413376787415


2015, test :


y_pred

y_true-101
-19552392625429
011495721317509
18581403776835

lors de la prédiction de "-1" : -1 se produira en fait un peu plus souvent que 1. Mais le 0 sera le plus fréquent de tous, et tout cela se terminera probablement par des pertes. De même pour la classe "1".


Le problème de l'arbre est apparu. La génétique a choisi le paramètre d'arbre cp = 0, et cela donne à l'arbre la permission de faire un tas de branches. Malheureusement, nous aurions dû limiter ce paramètre à une petite valeur non nulle.

Est-il possible de représenter la figure en termes de probabilités, comme précédemment ? Peut-être y a-t-il des branches plus importantes sur les données de test ?

Dr. Trader:

Je ne pense pas qu'il y ait assez de prédicteurs dans les données pour classer "0". Besoin de quelques indicateurs de planéité par exemple.

En général, c'est mauvais avec l'arbre. Le bois de SanSanych est bien meilleur.


Mauvais paramétrage du modèle, et par conséquent, réentraînement.

Il n'a pris qu'un seul fichier 2016 (d'ailleurs en 2015 il y avait 1 prédicteur de moins - je l'ai corrigé, je peux le retélécharger), et cette année 2016 avait une tendance à la hausse !

L'arbre s'accroche aux données des TF supérieurs, et il y a essentiellement peu de statistiques sur eux, et à cause de cela il peut y avoir un kazoon sur l'histoire, quand le vecteur de mouvement global change (2015 en hausse et 2016 en baisse) ou qu'il y a un flat total (2017).

En ce qui concerne le plat, nous avons des objectifs qui déterminent l'entrée sur le marché à partir du plat ainsi que le retournement, pouvons-nous essayer de les séparer d'une certaine manière ?

Le plat est bien identifié par les prédicteurs de type Levl, le seul problème est que l'arbre ne peut pas les relier entre eux, du moins à un TF.

 

Vous avez fait un robot rentable là :)

Entrée en position longue - uniquement lorsque la prévision est de "1" (en bleu), dont >90% de profit (en vert).
Vente à découvert - uniquement en cas de prévision de "-1" (en rouge), dont >90% de profit (en vert).
Les prédictions de "0" signifient qu'il ne faut pas ouvrir de nouvelles positions et attendre un meilleur timing, donc la précision réelle n'a aucune importance avant une prédiction de cette classe.

Mais il est préférable, par exemple, d'entraîner la forêt sur le fichier 2015, et de la vérifier sur le fichier 2016. Il n'y a qu'une seule colonne manquante en 2015, elle devrait être supprimée en 2016 également, afin que le hochet ne soit pas confondu.

 
Aleksey Vyazmikin:

La figure peut-elle être représentée en termes de probabilités comme précédemment ?

Non, il s'agit d'un mode d'apprentissage différent de l'arbre, adapté uniquement à 2 classes. Ou pour la régression.

 
SanSanych Fomenko:

Il n'a pas un seul prédicteur qui se rapporte à sa variable cible - que du bruit. Et il s'assoit dans le rattle et au lieu de vérifier le bruit, il poste des dossiers avec des déchets ici.

Oui, les objectifs n'ont pas de lien clair avec les prédicteurs, ils montrent simplement le résultat financier de l'entrée sur le marché à un moment donné.

Pensez-vous que le résultat sera meilleur si la logique des entrées est liée aux indicateurs de certains des prédicteurs, c'est-à-dire que si nous entrons au croisement de МА, nous définissons le résultat (1 ou -1) et donnons des informations sur le fait du croisement de la MA dans les prédicteurs ?

 
Aleksey Vyazmikin:

L'arbre s'accroche aux données des TF supérieures, et il y a peu de statistiques sur celles-ci, ce qui peut conduire à un coup de théâtre dans l'histoire, lorsque le vecteur de mouvement global change (2015 en hausse et 2016 en baisse) ou qu'il y a un flat total (2017).

En ce qui concerne le plat, nous avons des objectifs qui déterminent l'entrée sur le marché à partir du plat ainsi que le retournement, pouvons-nous essayer de les séparer d'une certaine manière ?

Le plat est bien identifié par des prédicteurs comme Levl, le seul problème est que l'arbre ne peut pas les relier entre eux, au moins sur un TF.

Il est clair que nous disposons déjà de différents indicateurs plats, mais l'arbre ne peut les relier entre eux. Alors c'est probablement tout, c'est la limite des possibilités de l'arbre.

Hier, j'ai obtenu des résultats presque aussi précis, mais avec un nombre inférieur d'entrées dans les transactions. Ce que j'ai reçu aujourd'hui n'est pas beaucoup mieux. Quelque chose s'est mal passé et je vais réfléchir aux réglages qui peuvent être corrigés.

 
Aleksey Vyazmikin:

Oui, les objectifs ne sont pas clairement liés aux prédicteurs, ils montrent seulement le résultat financier de l'entrée sur le marché à un moment donné.

Pensez-vous que le résultat sera meilleur si la logique des entrées est reliée aux indicateurs de certains prédicteurs, c'est-à-dire que si nous entrons au moment du croisement de la MA, nous déterminons le résultat (1 ou -1) et si nous donnons des informations sur le fait du croisement de la MA dans les prédicteurs ?

Et c'est mon avis : un déchet à l'entrée est un déchet à la sortie ! Ce sont les premières lignes des manuels de statistiques.

 
Dr Trader:

Vous avez fait un robot rentable là :)

Une position longue ne serait qu'une prédiction de "1" (en bleu), dont >90% serait rentable (en vert).
Vente à découvert - uniquement en cas de prédiction de "-1" (en rouge), dont >90% de profit (en vert).
La prédiction "0" signifie qu'il ne faut pas ouvrir de nouvelles positions et attendre un meilleur timing, donc la précision réelle de cette classe de prédiction n'a pas vraiment d'importance.

Mais il est préférable, par exemple, d'entraîner la forêt sur le fichier 2015, et de la vérifier sur le fichier 2016. Il n'y a qu'une seule colonne manquante en 2015, elle devrait être supprimée en 2016 également, afin que le hochet ne soit pas confondu.

Je n'ai rien construit - j'ai pris un fichier prêt et j'ai construit randomForest, mais j'étais trop paresseux pour le diviser en deux fichiers. Alexey l'a fait pour moi et a montré un résultat génial, qui couvre complètement mes "réalisations".

 
Dr. Trader:

Oh, je vois, il existe déjà divers indicateurs plats, mais l'arbre ne sait pas comment les relier entre eux. Alors c'est probablement tout, c'est la limite des capacités de l'arbre.

J'ai eu presque les mêmes résultats hier en termes de précision, mais avec un plus petit nombre d'entrées dans les transactions. Ce que j'ai reçu aujourd'hui n'est pas beaucoup mieux. Quelque chose s'est mal passé, je vais examiner les paramètres qui peuvent être corrigés.

Oui, je pense que nous avons besoin d'un arbre qui peut être aidé - pour montrer les relations probables entre les prédicteurs et pour établir les conditions de comparaisons probables pour la prise de décision.

Voici comment expliquer à l'arbre que la tendance mondiale est à la hausse et à la baisse ? Bien sûr, je peux utiliser le même outil, dessiner un canal, faire un percentile, c'est-à-dire indiquer clairement où est dirigé le vecteur de tendance, mais l'arbre peut tout simplement ignorer ce prédicteur, alors qu'il devrait, à mon avis, diviser l'ensemble du groupe en au moins deux par vecteur de tendance global.

Je ne sais pas, peut-être devrions-nous ajuster (diviser en parties) l'échantillon de situations, nous entraîner dessus et ensuite identifier de force la même tendance globale dans le Conseiller Expert et écouter l'un ou l'autre arbre en fonction du vecteur.

 
SanSanych Fomenko:

Qu'est-ce que cela a à voir avec mon opinion : les ordures entrent, les ordures sortent ! Ce sont les premières lignes des manuels de statistiques.

Il ne s'agit pas de bêtises - l'entrée est en fait un ensemble de probabilités de résultats d'événements, ces probabilités sont influencées par des prédicteurs, et la sortie est le résultat de nombreux événements différents et indépendants, bien que le résultat puisse être le même. Je vais réfléchir à une entrée claire et supprimer toutes les variantes sans signal à l'entrée - il sera intéressant de voir le résultat. Bien que je ne puisse toujours pas obtenir de retour des participants ici - devrions-nous marquer l'entrée explicitement dans les prédicteurs, si différentes stratégies d'entrée sont utilisées ?

 

Nous cherchons tous des points d'entrée, mais peut-être devrions-nous essayer de chercher un appartement ?

Peut-être que quelqu'un a un indicateur/script pour détecter les plats sur l'historique ?

Je pense que nous pouvons prendre un canal de régression avec une plage de 100, le déplacer sur chaque barre et si la pente est supérieure/inférieure à X, nous pouvons considérer que la zone décrite par le canal est plate. Qu'en pensez-vous ?

Raison: