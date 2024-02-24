L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 1236
Chers forestiers. Est-il nécessaire de procéder à un équilibrage des classes pour les arbres et les forêts (égaliser le nombre d'exemples de classes différentes) ?
Je suis en train de lire : Flach P. - Machine Learning. La science et l'art de construire des algorithmes qui extraient des connaissances des données - 2015
Plusieurs pages y sont consacrées à ce sujet. Voici l'essentiel :
Le point 1 noté dit que l'équilibrage est utile.
Mais il y a aussi le point 2, à partir duquel nous pouvons conclure qu'avec un grand échantillon, lorsqu'il y a suffisamment d'exemples d'une petite classe, alors l'échantillon pour celle-ci deviendra représentatif. Et puis l'équilibrage est inutile.
Combien d'exemples peuvent être considérés comme représentatifs de BP ?
Et puis il y a le para. 3. mais il est difficile de savoir si une telle correction existe dans l'implémentation particulière de l'arbre dans le programme choisi.
D'après moi, l'affarteur énonce la loi des grands nombres pour le MO.
En clair, si vous avez 10 observations dans la première classe et 6 dans la seconde, alors ajouter 4 dans la seconde modifiera le modèle (sans nécessairement l'améliorer), mais il ne sera toujours pas représentatif.
Combien d'exemples peuvent être considérés comme représentatifs de BP ? Je n'ai pas l'habitude d'utiliser moins de 10000, une petite classe doit avoir au moins 1000.
Oui, il regardait juste les exemples de 10 vs 8:2 vs 6:4. Mais nous avons beaucoup de données.
Combien d'exemples peuvent être considérés comme représentatifs de BP ?
HZ. J'ai pris le maximum, mais je travaillais sur des données quotidiennes pour les arbres et les forêts - un minimum de 2 ans.
Demandez à A_K - il a utilisé l'inégalité de Chebyshev pour déterminer l'optimum (si je me souviens bien), mais seulement pour des variables continues.
Essayez de partir du nombre de variables - au moins 100 pour chacune.
En général, si vous essayez de trouver un modèle "perpétuel", plus il y en a, mieux c'est. Si le "motif" est flottant, vous devez chercher la fenêtre optimale.
Même si nous allons en ajouter des milliers, et que le modèle peut aussi changer.
Et c'est peut-être vrai. Le marché, comme on dit, change, alors laissez le modèle changer aussi.
Je ne l'utilise pas encore, mais je m'apprête à le faire. Je suis encore en train de lire la théorie pour comprendre ses avantages et ses inconvénients. Je ne suis pas satisfait des résultats, j'ai donc décidé de travailler avec la forêt. Il me semble qu'il est mieux adapté à la BP.
Pour l'analyse BP, afin de gagner de l'argent.
Je ne l'utilise pas encore, mais je m'apprête à le faire. Je suis encore en train de lire la théorie pour comprendre ses avantages et ses inconvénients. Comme je ne suis pas satisfait des résultats, j'ai décidé de me lancer dans la sylviculture. Il me semble qu'il est mieux adapté à la BP.
Il y a deux ans, j'ai écrit ici à Maximka que la NS est un jouet comme une bombe nucléaire. Que si TOUT autre modèle donne des résultats au moins satisfaisants, il n'est pas recommandé d'utiliser NS - ils trouvent quelque chose qui n'existe pas et vous ne pouvez rien y faire.
Les arbres sont une bonne chose, mais il est préférable d'utiliser des échafaudages.