L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3354

 
Aleksey Vyazmikin #:

Les probabilités du modèle sont données par les statistiques de l'échantillon d'apprentissage.

Par conséquent, sans un échantillon représentatif, elles ne sont pas précises, alors passez outre :)

Soit vous déterminez en quoi consiste le modèle et vous repondérez les feuilles selon l'algorithme que vous avez conçu....

Les probabilités du modèle sont données par la sigmoïde, pas par celle-ci. Pour des raisons de simplicité, vous prenez la voie et l'arbre, peu importe ce qu'il y a à l'extérieur. Et même là, vous obtenez un bégaiement.
 
Maxim Dmitrievsky #:
Les probabilités du modèle sont données par la sigmoïde, pas par ceci.

Oui, eh bien, quel nombre mettez-vous dans la fonction, d'où vient-il ?

 
Aleksey Vyazmikin #:

Oui, eh bien, quel chiffre mettez-vous dans la fonction, d'où vient-il ?

Allez-vous répondre à une question par une question ? Je connais la réponse définitive, le cas échéant.
 
Les résultats des modèles ne sont pas des probabilités de classe. Par analogie, la régression donne une valeur unique. Un classificateur fonctionne sur le même principe, il donne une valeur brute passée par une sigmoïde, et non une probabilité.

Comment obtenir la probabilité ?
 
Maxim Dmitrievsky #:
Comment vous êtes-vous rendu compte que le classificateur donne les bonnes probabilités ? Pas seulement des valeurs dans une fourchette. Lisez-vous ce qui vous est écrit ?

Si vous fixez un seuil de 0,8, 80 % des transactions seront-elles rentables ? Et s'il est de 0,51 ?

Il est presque certain que non. Vérifiez-le.

J'ai vérifié un grand nombre de fois. C'est la base du CT.

Encore une fois, s'il ne l'est pas, il est recyclé.

 
Maxim Dmitrievsky #:
Les résultats des modèles ne sont pas des probabilités de classe. Par analogie, la régression donne une valeur unique. Le classificateur fonctionne sur le même principe, il donne une valeur brute passant par une sigmoïde, et non une probabilité.

Comment obtenir la probabilité ?

En passant par la sigmoïde, nous obtenons la classe, et non la probabilité de la classe.

 
СанСаныч Фоменко #:

En passant par la sigmoïde, on obtient une classe, et non la probabilité de la classe.

Nous obtenons une valeur qui est appelée probabilité, mais qui en fait n'en est pas une.
 
СанСаныч Фоменко #:

Il l'a vérifié à de nombreuses reprises. C'est la base du CT.

Encore une fois, s'il ne l'est pas, il est réentraîné.

Je ne vous crois pas sur parole, il existe des tests pour cela.
 
Maxim Dmitrievsky #:
Allez-vous répondre à une question par une question ? Je connais la réponse sans ambiguïté, le cas échéant.
Maxim Dmitrievsky #:
Les résultats des modèles ne sont pas des probabilités de classes. Une analogie est la régression, qui donne une valeur. Un classificateur fonctionne sur le même principe, il donne une valeur brute passant par une sigmoïde, et non une probabilité.

Comment obtenir la probabilité ?

Savez-vous comment la valeur est obtenue dans les feuilles du modèle CB, pouvez-vous la reproduire ?

Le fait est que les probabilités sont estimées par l'histoire, mais seule une théorie avec un échantillon représentatif peut garantir qu'elles continueront à l'être. Nous ne disposons pas d'un tel échantillon. Par conséquent, tout ajustement dans ce sens n'apportera pas de précision sur de nouvelles données. La correction peut être pertinente parce qu'il y a des débris dans les feuilles, et c'est ce qu'il faut corriger en surestimant ou en sous-estimant le point de classification sigmoïde.

Ou encore, on ne sait pas très bien de quoi il s'agit.

Si vous avez trouvé quelque chose d'intelligent, n'hésitez pas à le partager :)

 
Aleksey Vyazmikin #:

Savez-vous comment est calculée la valeur des feuilles du modèle CB, pouvez-vous la reproduire ?

Le fait est que les probabilités historiques sont estimées, mais seule une théorie avec un échantillon représentatif peut garantir qu'elles continueront à l'être. Nous ne disposons pas d'un tel échantillon. Par conséquent, tout ajustement dans ce sens n'apportera pas de précision sur de nouvelles données. La correction peut être pertinente pour la raison que des débris se sont introduits dans les feuilles, et c'est cela qui devrait être corrigé, soit par la dépendance, soit par la sous-estimation du point de classification sigmoïde.

Ou encore, on ne sait pas très bien de quoi on parle.

Si vous avez trouvé quelque chose d'intelligent, partagez :)

J'espérais que quelqu'un irait au moins chercher l'astuce sur Google.

Même si vous avez des courbes de probabilité dans votre formation, de quelles nouvelles données pouvons-nous parler ? Et le bousting et le forrest pèchent beaucoup dans ce domaine. Bousting est trop confiant, Forrest ne l'est pas assez. À condition, bien sûr, que vous ayez l'intention d'utiliser le seuil.

J'ai moi-même observé que lorsque l'on augmente le seuil, la qualité des transactions ne s'améliore pas, même dans le cadre de la formation. Alors la probabilité de quoi le modèle renvoie-t-elle ? Rien :)

Dans l'image de Sanych, le bousting confiant, on peut voir sur la colonne du bord des valeurs aberrantes. Le creux devrait être plus lisse. Il s'agit d'un modèle surajusté.
Raison: