L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 235

 
Vizard_:
Je vois qu'ils ont déjà commencé à écrire des livres sur la r)))
allitebooks.com/automated-trading-with-r-2/
L'essentiel est de commencer à décrire dans des livres une méthode pour "gagner de l'argent", puis cette méthode a cessé de fonctionner ou n'a jamais fonctionné. Un indicateur, cependant. C'est-à-dire lorsque la description d'une méthode dans un livre rapporte plus d'argent que la méthode elle-même.
 
Vizard_:
Pour le bien du sport, j'ai un peu dépassé, je m'arrête là. Ressources libres un peu, et ne veulent pas du tout et n'étaient pas,

n'a soutenu que l'idée d'un "ticket d'entrée dans la branche". < 0,69, à vue de nez, ce n'est pas un gros problème pour s'en sortir. < 0.68 je ne sais pas, c'est un peu exagéré là)))

https://numer.ai


Dites-moi, quel modèle, comment avez-vous appris ?
 
lucky_teapot:
S'il vous plaît, dites-moi quel modèle, comment a-t-il été enseigné ?

L'erreur de prédiction de classe est inférieure à 30%. Il peut être bien inférieur à 30%, mais moins de 20% ne pourrait être atteint. Mais il y a de bonnes raisons de dire que le modèle n'est PAS surentraîné. L'important est qu'il ne soit pas surentraîné - un modèle surentraîné n'est pas du tout nécessaire, c'est un déchet dangereux.

Modèles : forêt aléatoire et ada. En général, le choix du modèle a peu d'effet sur le résultat, si tant est qu'il soit entraînable. Sur mes prédicteurs, nnet n'est pas entraîné du tout.

 
SanSanych Fomenko:

L'erreur de prédiction de classe est inférieure à 30%. Il peut être bien inférieur à 30%, mais moins de 20% ne pourrait être atteint. Il y a cependant de bonnes raisons de penser que le modèle n'est PAS réentraîné. L'essentiel est de ne pas être surentraîné - un modèle surentraîné n'est pas du tout nécessaire, c'est un déchet dangereux.

Modèles : forêt aléatoire et ada. En général, le choix du modèle a peu d'effet sur le résultat, si tant est qu'il soit entraînable. Sur mes prédicteurs, nnet n'est pas formé du tout.

Quel type de perte de poids avez-vous là ?
 
lucky_teapot:
Quel type de perte de poids avez-vous là ?
Qu'est-ce que le logloss ?
 
SanSanych Fomenko:

L'erreur de prédiction de classe est inférieure à 30%. Il peut être bien inférieur à 30%, mais moins de 20% ne pourrait être atteint. Il y a cependant de bonnes raisons de penser que le modèle n'est PAS réentraîné. L'essentiel est de ne pas être surentraîné - un modèle surentraîné n'est pas du tout nécessaire, c'est un déchet dangereux.

Modèles : forêt aléatoire et ada. En général, le choix du modèle a peu d'effet sur le résultat, si tant est qu'il soit entraînable. Sur mes prédicteurs, nnet n'est pas formé du tout.

SanSanych Fomenko:
Qu'est-ce que le logloss ?

Je suppose que vous parlez de votre score àhttps://numer.ai mais pas en logloss mais en termes de hashing (% d'erreur). Mais lelogloss est une chose délicate, vous n'avez pas seulement besoin de deviner la classe mais aussi la probabilité.

 
lucky_teapot:

Je comprends que vous parlez de votre jauge àhttps://numer.ai mais pas en logloss mais en ourlet (% d'erreur), mais lelogloss est une chose délicate, non seulement vous devez deviner la classe mais aussi la probabilité.

J'écris sur mon conseiller expert. Il a un modèle.

J'utilise des paquets et ils ont une estimation approximative, qui n'a rien à voir avec le logloss. En outre, les résultats des paquets peuvent être estimés par d'autres moyens..... Je ne me souviens pas des loglos.

Et la classe, dans les paquets que j'ai vus, est dérivée de la probabilité, c'est-à-dire qu'en réalité la probabilité est comptée et ensuite calibrée. C'est standard en deux pour deux classes, mais tu peux monter et diriger.

 
SanSanych Fomenko:

J'écris sur mon EA. Il y a un modèle dedans.

J'utilise des paquets et il y a une évaluation dans ceux-ci, à vue de nez, qui n'a rien à voir avec les loglos. En outre, les résultats des paquets peuvent être évalués par d'autres moyens..... Je ne me souviens pas des loglos.

Et la classe, dans les paquets que j'ai vus, est dérivée de la probabilité, c'est-à-dire qu'en réalité la probabilité est comptée et ensuite calibrée. C'est standard en deux pour deux classes, mais tu peux monter et diriger.

Je ne peux rien dire alors, il vous faut au moins un ensemble de données sur lequel vous avez obtenu ces résultats. Loglos je suis d'accord, pour notre cas ce n'est pas vraiment le bon choix, c'est un hommage à kaggle, non recyclé 20-30% d'erreur dans la précision, cela me semble très puissant, franchement j'ai du mal à le croire.

Pour les loglos, l'astuce est que par exemple pour deux classes si vous avez 0% d'erreur, alors les probabilités de réponse seront proches de 100% et 0%, {0,1,0,1....}. quand l'erreur est de 10%, elle affecte non seulement la probabilité des réponses incorrectes, mais aussi la probabilité des réponses correctes, donc ces réponses correctes, qui étaient 1 et 0, devraient maintenant être par exemple 0.8 et 0.2, quand l'erreur est de 45%, tout devrait osciller autour de 0.5 +- 0.1, donc le logloss serait optimal, une telle alchimie ....

 
Dr. Trader:

Je viens de regarder le profil de lucky_teapot, il y avait un fil de discussion sur le forum avec un lien vers un article. Je pense que le tout a été transféré du forum mql4.com, que j'ai à peine étudié, merci à MetaQuotes s'il l'a vraiment transféré de là.
L'article date de presque 9 ans, mais j'ai trouvé beaucoup de choses utiles que je peux aussi bien essayer maintenant. Je pense que j'ai même compris l'existence de l'espace de décalage dimensionnel, dont Alexei a déjà parlé plusieurs fois dans ce fil.
L'article lui-même, je le trouve très utile -https://www.mql5.com/ru/articles/1506

Je l'ai lu... J'ai été intéressé par une chose, l'auteur dit que l'on peut modifier un peu les données, augmentant ainsi l'échantillon et le modèle fonctionnera alors mieux, car la base de connaissances du modèle sera plus large...

Je travaille avec des écarts et les écarts sont toujours faibles par rapport à l'échantillon total.

Je pense que si nous tirons un échantillon de plusieurs millions et enseignons le modèle pour attraper les renversements, il y aura beaucoup d'exemples et je pense que le modèle de renversements est le même dans les deux marchés(je veux dire beaucoup de modèles) .

Et là, j'ai une autre question, ou plutôt une idée mais pas encore de solution...

Je pense que si nous séparons toutes les inversions de ces millions de valeurs et que nous ne laissons que celles-ci comme échantillon d'entraînement, le modèle n'apprendra que les inversions lui-même, c'est si rapide, mais lorsque nous devrons distinguer une inversion d'une non-inversion dans les nouvelles données, comment le modèle le fera-t-il s'il n'a aucune idée de ce qu'est une non-inversion ? ((.

 
mytarmailS:

Je l'ai lu... J'ai été intéressé par une chose, l'auteur dit que l'on peut modifier un peu les données, augmentant ainsi l'échantillon et le modèle fonctionnera alors mieux, car la base de connaissances du modèle sera plus large...

Je travaille avec des inversions et le nombre d'inversions est encore faible par rapport à l'échantillon total.


Qu'est-ce qu'un pivot ? Une barre comme dans ZZ ?

J'aime beaucoup l'idée (repêchée ici sur le fil) selon laquelle un renversement est considéré comme une certaine séquence de barres, après laquelle, dans le futur, il y aura un profit prédéterminé. Cette approche permettrait de réduire considérablement le déséquilibre entre les classes. C'en est une. Deuxièmement, la classe elle-même aurait une propriété prédictive claire.

Raison: