L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1376

 
Aleksey Vyazmikin:

Pourquoi étudier moins de 10% de l'échantillon total, un échantillonnage plus important ne devrait-il pas conduire à une amélioration ?

Et pourquoi plus de 5 km ? Si vous ne pouvez pas vous entraîner sur eux, vous ne pouvez pas vous entraîner sur d'autres.

 
Aleksey Vyazmikin:

Pourquoi former moins de 10% de l'ensemble de l'échantillon, l'augmentation de l'échantillon ne devrait-elle pas conduire à une amélioration ?

Et un système surentraîné, où pensez-vous que cela mènera ?

 
Farkhat Guzairov:

Qu'en est-il d'un système recyclé, où pensez-vous que cela mènera ?

Plus l'échantillon est grand, plus il est difficile d'ajuster le modèle, en termes de nombre de feuilles/arbres requis.

 
Yuriy Asaulenko:

Par x - le numéro de transaction, par y - le montant du profit en pips .


C'est un 4 chiffres, ou un 5 chiffres ?

 
sibirqk:


C'est un 4-signes ou un 5-signes ?

Ce n'est pas du tout un signe).
 
Yuriy Asaulenko:
Ce n'est pas du tout un signe.))
Alors qu'est-ce que cela signifie - le profit en pps ?
 
sibirqk:
Qu'est-ce que cela signifie, alors, de mettre un bénéfice en pips ?
Il s'agit d'un outil d'échange. Il montre la possibilité de réaliser des bénéfices sur le système le plus simple. Le reste n'est pas encore important.
 
Vladimir Perervenko:

Ce n'est pas tout à fait ça. Vous avez par exemple train[2000, ] et test[500, ]. Vous vous entraînez sur train avec des poids d'exemple initiaux = 1.0, et vous faites que test[] prédit le modèle entraîné. En fonction de la qualité de chaque préfixe de test, vous lui attribuez un poids. Ensuite, on combine train et test et on forme un nouvel échantillon d'entraînement, on entraîne le modèle, on le teste et ainsi de suite jusqu'à ce que tous les échantillons d'entraînement aient des poids obtenus de cette manière. Vous pouvez leur appliquer un facteur de réduction pour les barres plus anciennes, mais je ne l'ai pas vérifié. Tout ceci est pour la classification bien sûr.

Vérifié avec ELM, donne de bons résultats.

Bonne chance

Je ne vois pas bien comment cela peut améliorer les performances du modèle sur les nouvelles données.

Par exemple, si la classe n'est pas définie correctement, nous mettons un poids décroissant, comme l'option extrême 0. Ainsi, dans la formation ultérieure, il sera égal à laisser tomber ces lignes de l'échantillon et sur un stage, tout ira bien avec une précision de 100%, sur les tests, qui de la même manière cercle de marquage - également tout ira bien. Mais avec des données totalement nouvelles, nous ne pourrons pas écarter des lignes et ce sera ce que le modèle est réellement capable de faire.

Ou vice versa, avez-vous augmenté le poids pour les mauvais exemples ?

 
elibrarius:

Je ne vois pas bien comment cela peut améliorer les performances du modèle sur les nouvelles données.

Par exemple, si la classe n'est pas définie correctement, nous mettons un poids décroissant, comme une variante extrême 0. Ainsi, dans la formation ultérieure, il sera équivalent de laisser tomber ces lignes de l'échantillon et tout ira bien avec une précision de 100% sur le plateau, sur les tests, que nous avons également marqués circulairement - tout ira bien aussi. Mais sur des données totalement nouvelles, nous ne pourrons pas écarter des lignes et il y aura déjà ce dont le modèle est réellement capable.

Ou avez-vous plutôt augmenté la pondération pour les mauvais exemples ?

Bien sûr, le déclassement est réservé aux "mauvais" exemples. Si vous relancez - c'est du boosting classique.

Il suffit de faire une expérience et de la vérifier.

Je ne le fais plus maintenant. Je supprime ou mets en évidence les exemples bruyants lors du prétraitement avant la formation.

Bonne chance

 
Yuriy Asaulenko:

Pourquoi avez-vous besoin de plus de 5 000 ? Si vous ne pouvez pas apprendre avec ça, vous ne pouvez pas apprendre avec plus.

Cela va dans les coffres des déclarations stupides.

Aleksey Vyazmikin:

Plus l'échantillon est grand, plus il est difficile d'ajuster le modèle, en termes de nombre de feuilles/arbres requis.

Exactement, plus il y en a, mieux c'est (moins de 100 000 euros, c'est du bruit), mais nous devons tenir compte du fait que le marché change, et la façon d'en tenir compte dans la formation est un grand secret.

Raison: