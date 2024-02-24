L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3332
Messieurs ! Vous ne mélangez pas le sujet ? Il serait bon de nettoyer 2-3 pages du hors sujet.
L'article d'Alexey a été publié il y a une heure, lisez-le.
Je pense que nous avons déjà discuté de sa quantification en son temps sous tous les angles. Je ne peux qu'ajouter à ce que j'ai dit précédemment que je suis heureux pour lui que cela lui ait rapporté au moins 200 dollars.
Merci, c'est agréable d'être content de ses revenus - c'est rare !
L'article est introductif - vous avez raison, tout ce que j'ai écrit là - je pense, et tellement clair.
La deuxième partie est à modérer, elle est un peu plus intéressante. Cependant, pour l'instant, j'ai renoncé à décrire ma propre méthode, et j'ai proposé une version simplifiée, qui a donné un petit effet sur les tests. Elle sera décrite dans la deuxième partie.
Mais c'est le cas lorsque les nouvelles idées ne prennent pas plus de 5 % du texte.
Revenez lire et commenter si vous le souhaitez.
Je ne sais pas de quel Diogène vous parlez, mais en ce qui concerne le trolling, nous sommes tous des enfants par rapport à Diogène de Sinope ou Diogène de Laertes.
Si vous regardez les dates de mon fil de discussion, de mon enregistrement sur la ressource et de celui d'aujourd'hui, cela deviendra plus clair. Deux ans après mon inscription, il y avait encore de l'espoir pour un dialogue constructif et utile sur le forum, et six ans et demi plus tard, il n'y a presque plus d'espoir. Pour le plaisir.
Pourquoi au hasard ?
Parcourez tous les points d'une classe et mesurez la distance avec tous les points de l'autre classe, en prenant la distance minimale.
Lorsque tout est obtenu, triez, supprimez jusqu'à la distance dont vous avez besoin, une paire à la fois. Si le point supprimé a été utilisé dans une autre paire, vous trouvez un nouveau point avec une nouvelle distance minimale, vous triez à nouveau et vous continuez.
Vous pouvez peut-être trouver une meilleure méthode. Peut-être sans trier - en supprimant simplement la distance requise.
Ugh, je ne comprends pas bien, je suppose :
Ai-je bien compris le prototype de l'algorithme ?
Je reviens sur le sujet avec un tel retard, parce que je suis un peu fasciné par l'idée que les feuilles dans les modèles CatBoost et dans d'autres ensembles d'arbres peuvent être fortement corrélées dans l'activation, ce qui fausse leur confiance pendant l'apprentissage, conduisant à une surestimation de la valeur de la feuille pour le modèle dans son ensemble.
1) On peut aussi utiliser une matrice, mais pas nécessairement, mais on trouve immédiatement pour chaque point de classe 0 le point le plus proche de classe 1, c'est-à-dire qu'on obtient d'emblée le point 2.
3) ne rien compter et ne pas faire référence à des clusters, il suffit d'enlever les paires de points les plus proches. Avec une distance inférieure au seuil, le seuil dans cet exemple serait de 0,6. Dans d'autres problèmes, nous devrons probablement le sélectionner.
Si un point supprimé de la classe 1 était associé à un autre point de la classe 0, il se retrouve sans paire et doit trouver un nouveau point le plus proche de la classe 1 (faites à nouveau un calcul ou utilisez une matrice, comme vous l'avez suggéré au point 1, si la mémoire est suffisante, je pense qu'une matrice de 1 million par 1 million ne tiendra pas dans une mémoire, jusqu'à 100 000 peut-être).
4) pas jusqu'à ce qu'il reste, mais jusqu'à la distance seuil. Si cette distance est très grande, il ne restera que les points d'une des classes, qui étaient initialement plus nombreux.
Mais comme je l'ai déjà écrit, je ne pense pas que cette élimination du bruit soit une bonne idée (voir https://www.mql5.com/ru/forum/86386/page3324#comment_50171043). Ce n'est pas comme si vous ne pouviez pas supprimer ce bruit lorsque vous faites des prédictions. L'arbre lui-même marquera les feuilles bruyantes en leur donnant une probabilité d'environ 50%, et prendra par exemple les feuilles non bruyantes avec une probabilité de l'une des classes >80% (ou autant que vous le souhaitez).
Les clusters n'ont rien à voir avec cela. Il s'agit simplement de supprimer les points les plus proches ayant des classes différentes qui se contredisent, c'est-à-dire le bruit. Ensuite, vous pouvez utiliser le clustering, ou l'arbre - ce que vous voulez pour vous entraîner.
Je n'arrive pas encore à me mettre ça dans la tête. Tout se passe dans un seul espace - dans la métrique d'un prédicteur, mais comment prendre en compte les autres ?
Quant à ce qu'il faut faire pour prédire, je pensais utiliser deux modèles - l'un qui détecte ce qui a été abandonné ou qui confirme que les données se trouvent dans la région de "regroupement", et l'autre qui travaille déjà sur ce qui reste.
https://www.mql5.com/ru/articles/9138
Personne ne s'en préoccupe depuis un an
J'ai écrit une douzaine ou une vingtaine d'algorithmes de ce type, dont certains sont bien établis. Celui de l'article n'est pas le meilleur en termes de stabilité des résultats, la première galette.
Il n'y a donc rien à discuter, car il n'y a rien de mieux pour l'instant.