L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 99

 
DAFomenko:

La classification n'est pas une panacée ou un outil de création de graal.

La première chose que fait l'application de la classification est d'appliquer les outils aux problèmes auxquels les outils sont applicables. Par exemple, l'idée d'appliquer l'analyse spectrale aux marchés financiers a été discutée à de nombreuses reprises. Il s'agit apparemment d'un outil formidable, mais pour d'autres objets, ah, non, proposé à nouveau.

Deuxièmement. Cette classification est tout à fait applicable aux marchés financiers, mais elle présente de nombreux problèmes, comme il a été dit plus haut. Mais dans la classification, nous pouvons placer le problème principal - le problème du ré-entraînement (sur-entraînement) du TS. Qu'est-ce qui pourrait être plus important ? Il n'est pas agréable, bien sûr, d'être privé de l'illusion d'avoir son graal préféré, mais il faut choisir : le bonheur, c'est bien, mais la vérité, c'est mieux ?

Troisièmement. La classification pose la question de manière très précise : que prédisons-nous ? Comparons-le à l'AT. Nous prenons des indicateurs. Il s'agit toujours d'une barre [1]. La barre actuelle n'est pas utilisée. Qu'est-ce que cela signifie pour H1 ? Nous utilisons l'information sur la fraîcheur horaire pour prédire l'entrée sur le marché! Ceci dans le meilleur des cas.

C'est complètement différent dans la classification. Vous prenez la valeur actuelle de la variable cible et vous la faites correspondre aux données brutes de la veille - vous décalez la cible d'une ou plusieurs barres. Lorsque vous utilisez un modèle ajusté à ces données, vous prévoyez toujours de manière réaliste l'avenir lorsque la prochaine barre arrive.

PS.

Si vous comptez l'utiliser pour prédire des mouvements brusques du marché (nouvelles), vous réussirez si vous parvenez à générer une variable cible, et c'est un gros problème dans des cas beaucoup plus simples.

Je souscris à tout cela.

Je ne sais pas pour le spectre, je ne l'ai jamais utilisé.

Deuxièmement. La classification est tout à fait applicable aux marchés financiers, mais il y a beaucoup de subtilités, comme écrit ci-dessus. Mais lors de la classification, vous pouvez mettre le problème principal - le problème du ré-entraînement (overfitting) du TS. Qu'est-ce qui pourrait être plus important ? Il n'est pas agréable, bien sûr, d'être privé de l'illusion de posséder son graal préféré, mais il faut choisir : le bonheur, c'est bien, mais la vérité, c'est mieux ?

Là, là ! Nous n'avons qu'un seul problème : la sur-éducation. Et ça pèse sur tout le monde. Le revers de la médaille est la sous-éducation (et les mauvais résultats partout).

Je vous ai envoyé de magnifiques graphiques ici, dont celui de Monte Carlo. En fait, je suis arrivé à la conclusion que j'ai ajusté les données à un segment hors échantillon sans avoir entraîné le(s) modèle(s) sur celui-ci. Je semble avoir des modèles qui passent bien hors échantillon. Mais le problème est que tant que je ne peux pas voir le hors-échantillon, je ne peux PAS sélectionner un modèle de travail. C'est dommage.

 
Alexey Burnakov:


Là, là ! Nous n'avons qu'un seul problème : le recyclage.

Quant à moi, le problème, c'est juste l'autre chose, tu sais........
 
mytarmailS:
Je pense que le problème est tout autre, tu sais ........
C'est juste que ça implique beaucoup de choses. Et lorsque les données, les prédicteurs et les modèles sont prêts, la conception de l'expérience est mise en place. Il reste à vérifier si le modèle se réentraîne ou non, et il a effectivement tendance à se réentraîner. (Purement mon expérience.)
 
Yuri Evseenkov:

Je suis quoi, un docteur ? Voici l'écriture de Sanych :

"Nous discutons ici des prédictions basées sur la classification, qui ne prennent pas en compte l'état précédent pour prédire la barre suivante. Les prédictions (prévisions) basées sur la classification sont des prédictions basées sur des modèles. Et s'il y a eu des nouvelles dans le passé qui ont conduit à un changement qui ne suit PAS les valeurs précédentes (non extrapolées), alors la classification saisira ce changement comme tel et s'il y a un changement similaire dans le futur (pas exactement le même, mais similaire), il sera reconnu et une prédiction correcte sera faite. "

Je pense donc que cela vaut la peine de creuser dans cette direction :"la classification saisira un tel changement comme tel" .

Vous avez tout à fait raison au début. Finalement, des personnes sensées sont apparues dans la branche. Oui, la classification évalue un modèle concernant le vrai ou le faux, ou dit je ne sais pas, comme l'a suggéré Reshetov. Et le modèle lui-même a une composante prédictive ; ce n'est pas le modèle lui-même qui est important, mais la réaction du marché à celui-ci. Et si cette réaction est identique à celle de l'entraînement, le filet en tirera la bonne conclusion. Alors c'est comme ça : ....
 
Mihail Marchukajtes:
Enfin, il y a des personnes sensées dans ce fil.
Y avez-vous bien réfléchi ?
 
mytarmailS:
Avez-vous bien réfléchi à la question ?
Je le fais toujours. Penser mal ne fonctionne pas :-)
 
Mihail Marchukajtes:
Je fais toujours ça. Penser mal ne fonctionne pas :-)

pas du tout

 
Alexey Burnakov:

Je vous ai envoyé de beaux graphiques ici, y compris ceux de Monte Carlo. En fait, je suis arrivé à la conclusion que j'ai ajusté les données à un segment hors échantillon sans former le(s) modèle(s) sur celui-ci. Je semble avoir des modèles qui passent bien hors échantillon. Mais le problème est que tant que je ne peux pas voir le hors-échantillon, je ne peux PAS choisir un modèle de travail. C'est dommage.

Avez-vous essayé le comité ? Si gbm est entraîné plusieurs fois avec les mêmes paramètres sur les mêmes données, le résultat sur les nouvelles données sera légèrement différent à chaque fois. Si vous choisissez un modèle au hasard, vous aurez peut-être de la chance et la transaction se passera bien, ou peut-être pas, vous ne pouvez pas deviner de cette façon. Dans ce cas, vous devez former des dizaines (centaines ?) de modèles et le résultat final sera celui prédit par la majorité des modèles.

Par exemple : Sur le côté gauche se trouve la simulation des résultats commerciaux de 100 modèles. Vous pouvez voir qu'en prenant un seul modèle, vous avez presque 50% de chances de perdre.
Du côté droit, on négocie par décision du comité de ces modèles, sans hasard, tout est clair et presque stable vers le haut.

 
mytarmailS:

L'expérience est le critère de vérité - ne pensez pas, faites...

Je pense personnellement que l'analyse spectrale est plus prometteuse, mais ce n'est que moi...

Pourquoi ne pas y réfléchir d'abord ? Même un loup réfléchit s'il doit poursuivre un lièvre maigre ou non. Parfois, on gaspille plus d'énergie qu'on n'en gagne avec une proie.
 
DAFomenko:

La première chose que fait l'application de la classification est d'appliquer les outils aux problèmes auxquels les outils sont applicables. Par exemple, l'idée d'appliquer l'analyse spectrale aux marchés financiers a été discutée à de nombreuses reprises, tous les outils semblant formidables, mais pour d'autres objets, ah, non, encore une fois c'est proposé.

Deuxièmement. Cette classification est tout à fait applicable aux marchés financiers, mais elle présente de nombreux problèmes, comme il a été dit plus haut. Mais dans la classification, nous pouvons placer le problème principal - le problème du ré-entraînement (sur-entraînement) du TS. Qu'est-ce qui pourrait être plus important ? Il n'est pas agréable, bien sûr, d'être privé de l'illusion de posséder un graal bien-aimé, mais il faut choisir : le bonheur, c'est bien, mais la vérité, c'est mieux ?

Troisièmement. La classification pose la question de manière très précise : que prédisons-nous ? Comparons-le à l'AT. Nous prenons des indicateurs. Il s'agit toujours d'une barre [1]. La barre actuelle n'est pas utilisée. Qu'est-ce que cela signifie pour H1 ? Nous utilisons l'information sur la fraîcheur horaire pour prédire l'entrée sur le marché! Ceci dans le meilleur des cas.

C'est complètement différent dans la classification. Vous prenez la valeur actuelle de la variable cible et vous la faites correspondre aux données brutes de la veille - vous décalez la cible d'une ou plusieurs barres. En utilisant un modèle ajusté sur ces données, vous prévoyez toujours l'avenir de manière réaliste lorsque la prochaine barre arrive.

Si vous comptez l'utiliser pour prédire des mouvements brusques du marché (nouvelles), alors vous réussirez si vous pouvez générer une variable cible, ce qui est un gros problème dans des cas beaucoup plus simples.

Êtes-vous un parent de Sanych ?

Oui, je le suis. Le classificateur bayésien naïf, tel qu'il filtre les spams, fonctionnera-t-il ici ou non ?

Quant à la nouvelle, pas question ! Certaines nouvelles seront tellement recyclées dans toutes les crevasses que ce sera un véritable désastre. J'ai donné des exemples.

Raison: