L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 351

 
Yuriy Asaulenko:

En fait, ce n'est pas juste, imho.

À mesure que le système devient plus complexe, la rentabilité et la stabilité devraient augmenter en même temps. En d'autres termes, à mesure que le système devient plus complexe, les propriétés des utilisateurs devraient augmenter.



Absolument PAS correct.

Les critères informationnels, qui y sont variés, visent à minimiser la complexité du modèle. Le dégrossissage du modèle est un outil très efficace contre le principal mal du trading - le surentraînement.


 

Maxim Dmitrievsky:

le paquet 'Smarket' n'est pas disponible (pour la version 3.4.0 de R) :(



L'enfer avec ça.

Il suffit de prendre la plus simple d'entre elles - une forêt aléatoire. Habituellement, nous obtenons des cours à la suite d'une formation. En réalité, l'algorithme donne la probabilité d'une classe à partir de laquelle on obtient une classe. En général, on divise la probabilité en deux avec deux classes.

Pourquoi ne pas diviser en classes : 0 - 0,1 est une classe et 0,9 - 1,0 en est une autre ? Et l'écart entre 0,1 et 0,9 est hors marché ?

C'est ce que j'ai vu dans l'article.

 
SanSanych Fomenko:


C'est complètement faux.

Les critères informationnels, qui y sont variés, visent à minimiser la complexité du modèle. Le dégrossissement du modèle est un outil très efficace pour lutter contre le principal mal du trading - le surentraînement (overfitting).

Je ne sais pas pourquoi ce n'est pas correct). Il découle de la deuxième phrase que nous parlons de la même chose.
 
Yuriy Asaulenko:
Je ne sais pas pourquoi c'est faux). Dès la deuxième phrase, nous parlons de la même chose.


Il y a un texte dans mon post qui n'est pas correct. Ensuite, vous révélez cette position.

La règle générale est la suivante : obtenir un excellent système en termes de rentabilité, puis le rendre pire en termes de rentabilité, dans l'espoir de gagner quelque chose de beaucoup plus important : la durabilité à l'avenir.

 
SanSanych Fomenko:


Il y a un texte dans mon post qui n'est pas correct. Vous exposez davantage cette position.

La règle générale est la suivante : obtenir un excellent système en termes de rentabilité, puis le rendre pire en termes de rentabilité, dans l'espoir d'obtenir quelque chose de beaucoup plus important : la durabilité à l'avenir.

Eh bien, plus la stabilité augmente, plus la rentabilité augmente, du moins en réduisant le nombre de transactions perdantes. Les entreprises rentables sont touchées dans une moindre mesure.

Si ce n'est pas le cas, alors il y a un problème avec l'informativité des prédicteurs. En tout état de cause, le rapport bénéfices/pertes ne devrait que croître avec une complexité croissante.

 
Yuriy Asaulenko:

La stabilité augmente, et la rentabilité aussi, du moins en réduisant le nombre de transactions perdantes. Les entreprises rentables sont touchées dans une moindre mesure.

Si ce n'est pas le cas, alors il y a un problème avec l'informativité des prédicteurs. Quoi qu'il en soit, le rapport bénéfice/perte doit croître avec la complication.


Vous êtes le mieux placé pour le savoir, bien que le monde entier soit d'un avis exactement opposé.
 
Yuriy Asaulenko:

La stabilité augmente, et la rentabilité aussi, du moins en réduisant le nombre de transactions perdantes. Les entreprises rentables sont touchées dans une moindre mesure.

Si ce n'est pas le cas, alors il y a un problème avec l'informativité des prédicteurs. En tout état de cause, plus la complexité augmente, plus le rapport bénéfices/pertes ne peut que croître.


Faa écrit la bonne idée, mais il l'énonce incorrectement.

Vous avez une série et un ensemble de prédicteurs. Vous divisez la série en trois parties : l'échantillon d'entraînement et l'avant (cas le plus simple).

Vous construisez, par exemple, 20 modèles.

Le fait est que la sélection d'un modèle dans la liste n'est pas effectuée par le meilleur sur l'échantillon d'entraînement et pas par le meilleur sur l'échantillon à venir. Un modèle est sélectionné qui donne les mêmes scores de qualité à la fois sur la formation et sur l'avant.

 
SanSanych Fomenko:

Vous êtes bien placé pour le savoir, même si le monde entier est exactement d'un avis contraire.
Le monde entier a une conception exactement inverse. Et dans tous les domaines d'activité. À propos, une augmentation du ratio bénéfices/pertes ne signifie pas que les bénéfices eux-mêmes augmentent, mais plutôt qu'ils diminuent. Le ratio bénéfices/pertes augmente.
 
Dimitri:


L'essentiel - la sélection d'un modèle dans la liste n'est pas basée sur le critère du meilleur sur l'échantillon d'entraînement et non sur le critère du meilleur sur l'avant. On sélectionne un modèle qui donne presque la même qualité sur l'échantillon d'entraînement et sur l'échantillon à venir.

Cela ne fait aucun doute. Seul le fonctionnement ou l'essai réel du système était visé.

 
Yuriy Asaulenko:

En fait, ce n'est pas juste, imho.

À mesure que le système devient plus complexe, la rentabilité et la stabilité devraient augmenter en même temps. En d'autres termes, à mesure que le système devient plus complexe, les propriétés des utilisateurs devraient augmenter.

En utilisant l'exemple du développement de la main :

1. Nous prenons une idée de trading simple et créons un TS simple, en optimisant le profit (les pertes peuvent être complètement ignorées).

2. introduire des restrictions qui minimisent le nombre de transactions perdantes. Bien sûr, une partie des transactions accidentellement rentables seront abandonnées et dans une partie des transactions rentables, le profit diminuera, mais les retraits diminueront également et, par conséquent, la somme des profits et des pertes augmentera.

Une complication supplémentaire n'entraîne qu'une augmentation des bénéfices, au moins en raison de la diminution du nombre de transactions perdantes.

Si le montant des profits et des pertes n'augmente pas à la suite d'une complication, nous devons faire quelque chose de mal. Par exemple, nous introduisons des conditions inefficaces.


C'est faux, vous êtes en train de créer un modèle de classification. Plus l'échantillon est grand, plus la généralisation est forte, le modèle devient plus stable en général et moins précis dans les particularités, donc moins rentable.

Si vous l'entraînez sur un petit échantillon, il peut être très précis sur un échantillon court, mais instable sur un grand échantillon.

Raison: