Y a-t-il un modèle dans ce chaos ? Essayons de le trouver ! Apprentissage automatique sur l'exemple d'un échantillon spécifique. - page 12

 
elibrarius #:

Choisissez-vous ces modèles en fonction de celui qui est le plus performant à l'issue du test ?

Ou bien, parmi les nombreux modèles les plus performants du test, y a-t-il aussi le meilleur modèle de l'examen ?

Plus précisément, la sélection s'est faite simplement sur la base du meilleur modèle à l'examen.

 
Aleksey Vyazmikin #:

En particulier, il y a eu une sélection simplement en fonction des meilleurs résultats à l'examen.

J'ai également été le meilleur à l'examen. Il n'y aura pas d'examen avant de passer à la négociation réelle. Ou plutôt, ce sera pour de l'argent réel....

Maintenant j'ai fait une sélection de signes en marchant vers l'avant (10000 à 5000 et un plateau comme le vôtre et un test), à l'examen les deux se confondent.

Il faut faire la sélection d'une manière ou d'une autre sur le test, pour que l'apprenabilité soit préservée sur l'examen.

 
elibrarius #:

J'ai également montré le meilleur lors de l'examen. Il n'y aura pas d'examen avant de passer à la négociation réelle. Ou plutôt, ce sera pour de l'argent réel....

Maintenant j'ai fait une sélection de signes par valking forward (10000 à 5000 et une trayne comme la tienne et un test), à l'examen les deux se confondent.

Il faut faire la sélection d'une manière ou d'une autre sur le test, pour que l'apprenabilité soit préservée sur l'examen.

Pour l'instant, on ne peut malheureusement qu'augmenter la probabilité d'une sélection correcte. C'est pourquoi j'envisage d'effectuer des transactions par lots, en sélectionnant de nombreux modèles à la fois, en espérant que la précision moyenne sera suffisante et que je pourrai obtenir un bénéfice moyen.

 
Il est nécessaire de trouver des caractéristiques qui fonctionnent parmi des centaines de milliers de vos caractéristiques, puis de comprendre pourquoi elles fonctionnent. Ensuite, il faut écrire différents CT sur ces caractéristiques, non pas en les forçant brutalement, mais en sélectionnant des hyperparamètres optimaux.
Sinon, il s'agira toujours d'un ajustement, lorsque vous devrez choisir parmi des centaines de modèles en fonction de l'examen.
Le plus important est de comprendre pourquoi les caractéristiques fonctionnent, au moins approximativement. Il est alors possible de les améliorer ou de leur apposer des étiquettes.

Empiler un tas de modèles peu clairs n'est pas non plus une bonne idée. En effet, vous devrez à nouveau entraîner tout un ensemble d'éléments inconnus.

Vous devez faire de la force brute avec la sélection des caractéristiques pour choisir les bonnes, puis méditer sur les raisons de leur efficacité. La suite des opérations sera alors plus claire. Bruteforce en soi est inefficace pour la préparation d'un CT, il doit être considéré comme un outil d'exploration.
 
Maxim Dmitrievsky #:
Il est nécessaire de trouver des caractéristiques qui fonctionnent parmi des centaines de milliers de vos caractéristiques, puis de comprendre pourquoi elles fonctionnent. Ensuite, il faut écrire différents CT sur ces caractéristiques, non pas en les forçant brutalement, mais en sélectionnant des hyperparamètres optimaux.
Sinon, il s'agira toujours d'un ajustement, lorsque vous devrez choisir parmi des centaines de modèles en fonction de l'examen.
Le plus important est de comprendre pourquoi les caractéristiques fonctionnent, au moins approximativement. Il est alors possible de les améliorer ou de leur apposer des étiquettes.

Empiler un tas de modèles peu clairs n'est pas non plus une bonne idée. En effet, vous devrez à nouveau entraîner tout un ensemble d'éléments inconnus.

Vous devez faire de la force brute avec la sélection des caractéristiques pour choisir les bonnes, puis méditer sur les raisons de leur efficacité. La suite des opérations sera alors plus claire. Bruteforce en soi est inefficace pour la préparation au CT, il devrait être considéré comme un outil exploratoire.
Je suis d'accord. La compréhension du processus peut être obtenue sous différents angles.)
 
Maxim Dmitrievsky #:
Il est nécessaire de trouver des caractéristiques qui fonctionnent parmi des centaines de milliers de vos caractéristiques, puis de comprendre pourquoi elles fonctionnent. Ensuite, il faut écrire différents CT sur ces caractéristiques, non pas en les forçant brutalement, mais en sélectionnant des hyperparamètres optimaux.
Sinon, il s'avérera toujours que le modèle est adapté, lorsque vous choisirez parmi des centaines de modèles en fonction de l'examen.
La chose la plus importante est de comprendre pourquoi les caractéristiques fonctionnent, au moins approximativement. Ensuite, elles peuvent être améliorées, ou les étiquettes qui leur sont associées peuvent être améliorées.

Ce n'est pas non plus une bonne idée d'emballer un tas de modèles obscurs. En effet, vous devrez alors réapprendre un tas de choses inconnues.

Vous devez utiliser la force brute avec la sélection des caractéristiques pour choisir les bons modèles, puis méditer sur les raisons de leur efficacité. La suite des opérations sera alors plus claire. Bruteforce en soi est inefficace pour la préparation au CT, il doit être considéré comme un outil d'exploration.

Le fait est qu'il est extrêmement difficile de comprendre la raison de l'efficacité des prédicteurs et que cela relève du domaine de l'interprétation du comportement du marché, ou avez-vous une approche plus fiable ? En outre, les prédicteurs fonctionnent en groupe parce qu'ils sont primitifs, et la manière de rassembler des prédicteurs qui fonctionnent en groupe n'est pas une question simple, si elle est stimulante - jusqu'à présent, la solution la plus évidente est d'utiliser un arbre de décision. Et pour construire des arbres de décision efficaces, il faut réduire considérablement l'échantillon et, mieux encore, n'alimenter que les prédicteurs dont on peut supposer qu'ils forment une relation efficace. La méthode de recherche de modèle peut s'avérer très utile, car le modèle n'utilise, en règle générale, qu'une partie des prédicteurs.

Ajustement ou non - je pense que toutes les actions d'ajustement des probabilités sont des ajustements. Par ailleurs, l'historique de la distribution de ces probabilités sur les prédicteurs peut être répété ou oublié pendant une longue période. Il est donc important de disposer d'une méthode permettant de déterminer la transition de ces étapes.

 
Aleksey Vyazmikin #:

L'entraînement de ce qui est appelé "out of the box" avec CatBoost, avec les paramètres ci-dessous - avec Seed brute force donne cette distribution de probabilité.

1. Échantillonnage de la formation

2. Sélection des tests

3. Échantillon d'examen

Comme vous pouvez le constater, le modèle préfère classer presque tout par zéro - il y a donc moins de risques de se tromper.

Alexey, la formation est essentiellement un ajustement, n'est-ce pas ?

 
Renat Akhtyamov #:

Alexei, la formation, c'est essentiellement de l'appareillage, n'est-ce pas ?

Essentiellement, oui.

L'optimisation dans un testeur consiste à modifier les métriques sur lesquelles l'algorithme fonctionne, et l'apprentissage dans les méthodes de MO (arbres et leurs variantes, NS) consiste à modifier l'algorithme en évaluant et en interprétant l'historique des métriques.

La symbiose serait épique.....

 
Renat Akhtyamov #:

Alexei, la formation, c'est essentiellement de l'appareillage, n'est-ce pas ?

Enseigner à des écoliers, c'est aussi adapter leurs connaissances à celles qui existent déjà.)

 
Aleksey Vyazmikin #:

C'est là le problème, la tâche consistant à comprendre la raison de la performance d'un prédicteur est extrêmement difficile et relève du domaine de l'interprétation du comportement du marché, ou avez-vous une approche plus solide ? En outre, les prédicteurs fonctionnent en groupe, car ce sont des primitives, et la manière de rassembler des prédicteurs qui fonctionnent en groupe n'est pas une question simple, si elle est stimulante - jusqu'à présent, la solution la plus évidente est l'utilisation d'un arbre de décision. Et pour construire des arbres de décision efficaces, il faut réduire considérablement l'échantillon et, mieux encore, n'alimenter que les prédicteurs qui forment vraisemblablement une relation efficace. La méthode de recherche de modèle peut s'avérer très utile, car le modèle n'utilise, en règle générale, qu'une partie des prédicteurs.

Ajustement ou non - je pense que toutes les actions d'ajustement des probabilités sont des ajustements. Par ailleurs, l'historique de la distribution de ces probabilités sur les prédicteurs peut être répété ou oublié pendant une longue période. Il est donc important de disposer d'une méthode permettant de déterminer la transition de ces étapes.

Petits groupes de 5 à 10 personnes pour s'entraîner.

Il est préférable d'en avoir de 1 à 3.

Si aucun d'entre eux ne produit quoi que ce soit, à quoi bon parler d'une connexion mythique entre eux ?

Raison: