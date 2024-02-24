L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 1534
Indicateurs de l'échantillon sur lequel la formation a été réalisée.
Qu'en est-il de l'échantillon en dehors de la formation ? Les six prochains mois par exemple ?
Vous avez donc un logloss de ~1, ce qui signifie que le modèle est totalement effrayé par ce qui se passe.
Je suis aveugle, où est le logloss négatif ? J'ai spécifié un logloss pour l'ensemble du modèle.
Voulez-vous trouver un logloss séparé pour une entrée individuelle ? C'est-à-dire la quantité d'information entre les valeurs de la feuille et les valeurs cibles ?
Je ne suis pas sûr que logloss soit la bonne chose, je veux trouver des informations de qualité et logloss recherche plutôt la quantité de l'ensemble du modèle, peut-être que la quantité fera aussi bien - je ne sais pas. Une idée de comment faire ?
La classe "ne fait rien" est clairement déséquilibrée par rapport aux autres, et c'est ce que j'ai écrit plus haut qui peut être un tel problème à cause du modèle à 3 classes. Le reste des indicateurs est déprimant.
Ouais, déséquilibré, mais qu'est-ce qu'on peut faire... Vous pourriez bien sûr faire deux échantillons - en divisant l'échantillon en vecteurs, mais là encore, certaines des informations qui pourraient être utiles seraient perdues. En général, je suis d'accord pour dire que l'échantillon n'est pas équilibré, mais je ne sais pas comment faire sans perdre d'informations. J'ai essayé de dupliquer les lignes avec un petit nombre de cibles, mais l'effet est négatif.
Non négatif, mais tend vers un, c'est-à-dire le maximum. Il devrait tendre vers zéro.
logloss montre la corrélation entre vos caractéristiques et la cible, en gros, c'est-à-dire que 0 correspond à une corrélation totale, c'est-à-dire qu'elles décrivent bien la cible. 1 correspond à l'absence totale de description, c'est-à-dire qu'elles ne sont absolument pas informatives. C'est un bon indicateur dans le sens où il nous dit s'il y a une corrélation quelconque. Vous n'obtenez aucune corrélation du tout.
Je ne sais pas, faites-en une classe normale de 2 et non de 3.
Et sur un échantillon en dehors de la formation, quoi ? Les six prochains mois par exemple ?
Et l'échantillonnage en dehors de l'entraînement, pour ainsi dire... Pas fait, formé pour environ le 1er mars 2019, j'ai décidé d'utiliser toutes les informations de 2014.
Mais, décidé de voir par moi-même ce que ces arbres donnent, l'a collé dans EA et a fait trois passages avec 3 arbres différents du 1er mars 2019 au 15 septembre 2019.
1. Première étape de séparation
2. Vingtième étape de séparation
3. Quarante-huitième étape de la division
Et, en général, je suis moi-même surpris que les trois modèles aient des résultats positifs !
Il est intéressant de noter que le 2e modèle est plus lisse, tandis que le 3e modèle a déjà du mal à se glisser dans le côté positif.
Il est intéressant de noter que la précision des modèles n'est pas beaucoup plus mauvaise, et qu'elle s'est même parfois améliorée. Le tableau ci-dessous présente les changements en pourcentage par rapport à l'échantillon d'entraînement.
Je ne peux pas me prononcer sur l'exhaustivité et la perte de logarithme - il faut prendre les indicateurs et faire l'échantillonnage.
Et oui, la plupart des modèles bouclent lors de la formation à zéro, car il y a vraiment une prépondérance de cette classe par rapport aux deux autres, et les zéros sont alors plus faciles à trouver - c'est ce qui gâche tout.
Je ne suis pas sûr que Logloss en multi-classe en soit un... En général, je n'arrive pas à trouver comment mettre en œuvre la formule moi-même - je ne comprends pas ces cryptages de sources publiques. Et j'aimerais voir le logloss, pas le final, mais pour l'ensemble de l'échantillon, comment il évolue et où il s'affaisse. Et comme je l'ai compris, c'est plus correct avec un échantillon équilibré...
Je ne veux pas me creuser la tête à ce sujet... les grandes entreprises comme Yandex font des choses. Ils disent : fais ça et tout ira bien. Fais-le et ne le fais pas tout seul. Vous vous noyez dans la rhétorique et les différentes approches.Il montre le changement au fur et à mesure qu'il avance dans la pente, en construisant des arbres.
Voilà ce que je reçois. Je viens de déplacer toute la logique du bot vers python, la forêt a été remplacée par boost. Je n'ai pas trouvé d'erreur, il semblerait qu'il n'y ait pas de coup d'œil. Selon les réglages, les acuras peuvent être augmentés jusqu'à 0,7-0,8, tout en réduisant le nombre de transactions.
L'échafaudage présente approximativement la même gamme d'erreurs, mais il ne s'agit pas d'acuras, mais d'erreurs de classification. Et il se comporte de la même manière en trayne, voire mieux. Mais c'est bien pire au test.
l'apprentissage :
L'apprentissage est 10 fois plus important
Qu'est-ce qu'il y a sur le chemin ? Des prix purs ?
incrémentsJe finirai le connecteur ce week-end et le mettrai à l'épreuve. Je prévois de télécharger le modèle sur le nuage et de récupérer les signaux à partir du terminal. J'envisage de placer le modèle dans le nuage et de récupérer les signaux à partir du terminal. Je peux vous envoyer le client sur MT5
