L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1236

 
Chers forestiers. Est-il nécessaire de procéder à un équilibrage des classes pour les arbres et les forêts (égaliser le nombre d'exemples de classes différentes) ?
 
elibrarius:
Chers forestiers. Est-il nécessaire de procéder à un équilibrage des classes pour les arbres et les forêts (égaliser le nombre d'exemples de classes différentes) ?

Non

 
Dimitri:

Non

Je suis en train de lire : Flach P. - Machine Learning. La science et l'art de construire des algorithmes qui extraient des connaissances des données - 2015

Plusieurs pages y sont consacrées à ce sujet. Voici l'essentiel :

Le point 1 noté dit que l'équilibrage est utile.

Mais il y a aussi le point 2, à partir duquel nous pouvons conclure qu'avec un grand échantillon, lorsqu'il y a suffisamment d'exemples d'une petite classe, alors l'échantillon pour celle-ci deviendra représentatif. Et puis l'équilibrage est inutile.
Combien d'exemples peuvent être considérés comme représentatifs de BP ?

Et puis il y a le para. 3. mais il est difficile de savoir si une telle correction existe dans l'implémentation particulière de l'arbre dans le programme choisi.

 
elibrarius:

Je suis en train de lire : Flach P. - Machine Learning. La science et l'art de construire des algorithmes qui extraient des connaissances des données - 2015

Plusieurs pages y sont consacrées à ce sujet. Voici l'essentiel :

Le point 1 noté dit que l'équilibrage est utile.

Mais il y a aussi le point 2, à partir duquel nous pouvons conclure qu'avec un grand échantillon, lorsqu'il y a suffisamment d'exemples d'une petite classe, alors l'échantillon pour cette classe deviendra représentatif. Et puis l'équilibrage est inutile.

Et puis il y a le para. Mais il est difficile de savoir si une telle correction existe dans l'implémentation particulière de l'arbre dans le programme choisi.

D'après moi, l'affarteur énonce la loi des grands nombres pour le MO.

En clair, si vous avez 10 observations dans la première classe et 6 dans la seconde, alors ajouter 4 dans la seconde modifiera le modèle (sans nécessairement l'améliorer), mais il ne sera toujours pas représentatif.

 
Dimitri:

D'après moi, l'affarteur énonce la loi des grands nombres pour le MO.

En clair, si vous avez 10 observations dans la première classe et 6 dans la seconde, alors ajouter 4 dans la seconde modifiera le modèle (sans nécessairement l'améliorer), mais il ne sera toujours pas représentatif.

Non pas grand, il a expliqué sur les petits nombres par 10 : 8:2 contre 6:4. Mais nous avons beaucoup de données.


Combien d'exemples peuvent être considérés comme représentatifs de BP ? Je n'ai pas l'habitude d'utiliser moins de 10000, une petite classe doit avoir au moins 1000.

 
elibrarius:
Oui, il regardait juste les exemples de 10 vs 8:2 vs 6:4. Mais nous avons beaucoup de données.


Combien d'exemples peuvent être considérés comme représentatifs de BP ?

HZ. J'ai pris le maximum, mais je travaillais sur des données quotidiennes pour les arbres et les forêts - un minimum de 2 ans.

Demandez à A_K - il a utilisé l'inégalité de Chebyshev pour déterminer l'optimum (si je me souviens bien), mais seulement pour des variables continues.

Essayez de partir du nombre de variables - au moins 100 pour chacune.

En général, si vous essayez de trouver un modèle "perpétuel", plus il y en a, mieux c'est. Si le "motif" est flottant, vous devez chercher la fenêtre optimale.

 
elibrarius:
Non pas grand, il a expliqué sur les petits nombres par 10 : 8:2 contre 6:4. Mais nous avons beaucoup de données.


Combien d'exemples peuvent être considérés comme représentatifs de BP ? En général, je n'utilise pas moins de 10000, une petite classe devrait avoir au moins 1000.

Même si nous allons en ajouter des milliers, et que le modèle peut aussi changer.

Et c'est peut-être vrai. Le marché, comme on dit, change, alors laissez le modèle changer aussi.

 
elibrarius:
Mais nous allons faire des ajouts par milliers, et le modèle pourrait alors changer aussi.

Utilisez-vous du bois pour le faire ?

 
Dimitri:

Utilisez-vous du bois pour le faire ?

Pour l'analyse BP, afin de gagner de l'argent.
Je ne l'utilise pas encore, mais je m'apprête à le faire. Je suis encore en train de lire la théorie pour comprendre ses avantages et ses inconvénients. Je ne suis pas satisfait des résultats, j'ai donc décidé de travailler avec la forêt. Il me semble qu'il est mieux adapté à la BP.
 
elibrarius:
Pour l'analyse BP, afin de gagner de l'argent.
Je ne l'utilise pas encore, mais je m'apprête à le faire. Je suis encore en train de lire la théorie pour comprendre ses avantages et ses inconvénients. Comme je ne suis pas satisfait des résultats, j'ai décidé de me lancer dans la sylviculture. Il me semble qu'il est mieux adapté à la BP.

Il y a deux ans, j'ai écrit ici à Maximka que la NS est un jouet comme une bombe nucléaire. Que si TOUT autre modèle donne des résultats au moins satisfaisants, il n'est pas recommandé d'utiliser NS - ils trouvent quelque chose qui n'existe pas et vous ne pouvez rien y faire.

Les arbres sont une bonne chose, mais il est préférable d'utiliser des échafaudages.

Raison: