L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2215

 

Revenons à la question de la visualisation du modèle CatBoost, afin d'en analyser la perspective.

Voici à quoi ressemble le modèle sur l'échantillon d'entraînement :

L'axe des x est la valeur de probabilité de la fonction logistique, et l'axe des y est le pourcentage sur un intervalle de valeurs de 0,05 :

- Razdel(bleu) - toutes les valeurs de l'échantillon.

- Target=1(magnet) - valeurs de la cible 1

- Target=0(aqua) - valeurs cibles 0

- Balans+(bleu clair) - le résultat financier qui a conduit au profit comparé à tous les profits et pertes, cette valeur est mise à l'échelle pour s'adapter au graphique.

- Balans-(brick) - résultat financier qui a conduit à la perte concernant tous les profits et pertes, cette valeur est mise à l'échelle pour s'adapter au graphique

- Cercles - il s'agit de la valeur d'équilibre mise à l'échelle - nous nous concentrons sur une valeur nulle à partir de la valeur nulle de la coordonnée x - faite pour l'illustration.

Ligne verticale aqua - valeur maximale Cible=0

Ligne verticale de l'aimant - valeur maximale de Target=1

Ligne verticale en rouge - division conditionnelle de 0,5 pour la classification à 1 et par défaut 0 dans CatBoost - pour plus de clarté.

Je suppose que plus les lignes aqua et magnet sont éloignées de la ligne verticale rouge, plus le modèle est confiant dans la séparation des classes. Il est également intéressant d'observer les lignes d'équilibre, pendant la formation, elles sont également espacées des deux côtés - c'est particulièrement pertinent pour les modèles où les profits et les pertes peuvent avoir des valeurs différentes, ainsi, par exemple, un modèle peut bien filtrer les petites pertes mais perdre sur les grandes pertes, bien que selon la valeur de précision de la classification sera supérieure à 0,5.

Nous examinons ensuite l'échantillon de test

On peut voir que les lignes verticales - rouge et magnétite - se sont rapprochées, mais leur position relative n'a pas changé, ce qui est déjà bien (il se trouve que la magnétite est dans la zone de <0,5). Les lignes d'équilibre se sont rapprochées, ce qui est décevant. Il y a une zone de perte après la probabilité de 0,5, ce qui suggère que le modèle est de qualité insuffisante.

Nous pouvons ensuite examiner les résultats de l'échantillon test.

Sur le côté droit (probabilité supérieure à 0,5), la situation semble meilleure que sur l'échantillon de test, ce qui peut indiquer que l'échantillon de test est une occurrence rare et qu'il y avait peu d'exemples similaires lors de la formation, ou que le modèle n'est pas complètement formé. En faveur de cette dernière hypothèse est le fait qu'il y a des régions où la ligne d'équilibreBalans+, indiquant des résultats financiers positifs, croise la ligneBalans-, ce qui peut également être vu en regardant les cercles qui indiquent le delta entre le profit et la perte dans une certaine zone de probabilité, dans lazone de probabilité inférieure à 0,5.

Eh bien, regardons le solde de l'échantillon d'examen.

Vous pouvez clairement voir que le caractère du marché a changé, ce qui est visible sur les 2/3 du graphique - vous devez continuer à apprendre le modèle.

Et voici un exemple d'un modèle clairement mauvais

Déjà sur l'échantillon test, on peut voir un fort décalage de l'ensemble du corps vers la partie gauche, c'est-à-dire que le modèle sait très peu de choses sur l'échantillon - l'exhaustivité est faible, et le pic d'accumulation de la cible 1 est derrière la partie gauche de la probabilité. Il convient de noter qu'il y a toujours un gain sur l'apprentissage.

Regardons l'échantillon de test et d'examen.

Déjà sur l'échantillon test, nous pouvons voir que toutes les lignes en dehors de la probabilité 0,5 sont très proches, et sur l'échantillon test, nous pouvons voir comment les lignes d'équilibre ont échangé leurs places.

 
mytarmailS:


En gros, j'ai un réseau vide (je ne l'entraîne que pour qu'il puisse être initialisé, car il n'est pas auto-écrit, mais provient d'un paquet).


Je peux penser à n'importe quelle abstraction, n'importe quelle cible et écrire une fonction de fitness.

Ensuite, la génétique commence à modifier les poids du filet de sorte qu'à l'entraînement et au test, je (le filet) reçoive quelque chose de similaire à mon objectif.


Et c'est mille fois" plus profond que de créer les étiquettes et d'ajuster la régression ou la classification.

vous êtes revenu 2 ans en arrière quand nous condamnions l'entraînement des neurones avec l'optimiseur mt5

Et j'écrivais de tels robots. C'est une optimisation commune avec un tas de paramètres.

Vérifiez.

https://www.mql5.com/ru/articles/497

Нейронные сети - от теории к практике
Нейронные сети - от теории к практике
  • www.mql5.com
В наше время, наверное, каждый трейдер слышал о нейронных сетях и знает, как это круто. В представлении большинства те, которые в них разбираются, это какие-то чуть ли не сверхчеловеки. В этой статье я постараюсь рассказать, как устроена нейросеть, что с ней можно делать и покажу практические примеры её использования. Понятие о нейронных сетях...
 
Maxim Dmitrievsky:

vous êtes revenu 2 ans en arrière quand il y avait une condamnation de l'entraînement des neurones par l'optimiseur mt5

Et j'écrivais de tels robots. Il s'agit d'une optimisation courante avec de nombreux paramètres.

lire la suite.

https://www.mql5.com/ru/articles/497

J'ai essayé avec max profit, je peux l'entraîner avec autre chose.


Ecoutez, si vous n'êtes pas trop paresseux, essayez d'entraîner Catbust sur Max Profit, je ne suis pas sûr de savoir comment ça marche là-bas.

Vous devez alimenter les données X et la cible Y en même temps.

peut-être que toute cette "personnalisation" n'est qu'une modification cosmétique de fonctions existantes

 
Aleksey Vyazmikin:

Revenons à la question de la visualisation du modèle CatBoost, afin d'en analyser la perspective.

Je pense qu'il est préférable de publier ces grandes recherches dans un blog et d'en faire une copie ici. Six mois plus tard, vous ne le trouverez pas ici...
 
elibrarius:
Je pense que les grandes études comme celle-ci devraient être publiées sur le blog et copiées ici. Vous ne pourrez pas le trouver ici dans six mois...

Peut-être - je n'utilise pas de blog, donc ça ne m'a pas traversé l'esprit.

Je pense que je peux mettre tous ces points du graphique (20 par courbe) dans un échantillon et essayer d'apprendre - peut-être que de cette façon nous pouvons identifier avec une plus grande probabilité les modèles avec une stabilité potentielle.

 
Aleksey Vyazmikin:

Peut-être - je n'utilise pas le blog, donc cela ne m'a pas effleuré.

Je pense que je peux mettre tous ces points du graphique (20 par courbe) dans un échantillon et essayer d'apprendre - peut-être que de cette façon nous pourrons identifier avec une plus grande probabilité les modèles avec une stabilité potentielle.

Quelle sera la cible ? Comment noter chaque exemple ? Ou par auto-apprentissage ?
 
elibrarius:
Quel sera l'objectif ? Comment noter chacun des exemples ? Ou par auto-apprentissage ?

L'objectif serait le résultat financier du modèle sur l'échantillon d'examen.

 
mytarmailS:

J'essaie juste de faire un maximum de profit, je pourrais m'entraîner pour autre chose.


Ecoutez, si vous n'êtes pas trop paresseux, essayez d'entraîner Katbust sur le profit maximum, je ne suis pas sûr que ça marche là.

Vous devez alimenter les données X et la cible Y en même temps.

peut-être que toute cette "personnalisation" n'est qu'un changement cosmétique des fonctions existantes

trop paresseux pour écrire de nouvelles métriques... et ce ne sera certainement pas le profit maximum, mais quelque chose de plus significatif

par exemple, la stabilité de Lyapunov ))

 
Maxim Dmitrievsky:

trop paresseux pour écrire de nouvelles métriques pour l'instant... et ce ne sera certainement pas le profit maximum alors, mais quelque chose de plus significatif

comme la stabilité de Lyapunov ))))

Vous n'avez pas besoin d'un terrain plat, ni de densité))). Dans notre métier, c'est rare.

 
Aleksey Vyazmikin:

Revenons à la question de la visualisation du modèle CatBoost, afin d'en analyser la perspective.

Oui, les distributions montrent généralement tout. Vous pouvez les faire juste pour les signes - il n'y a pas de boosts et vous verrez immédiatement.

Raison: