Y a-t-il un modèle dans ce chaos ? Essayons de le trouver ! Apprentissage automatique sur l'exemple d'un échantillon spécifique. - page 16

 
Maxim Dmitrievsky #:

dans une situation normale, les semences n'ont pratiquement aucun effet, c'est l'algorithme qui compte. Si vous devez vous préoccuper des semences, c'est que les données sont déjà mauvaises.

la vérification des nouvelles données permet de résoudre les problèmes : s'il n'y a que 10 signes et non 1000, vous pouvez être sûr de votre choix dans une certaine mesure.

Je pense que la profondeur par défaut est de 6, cela n'affecte pas grand chose non plus, sauf pour les valeurs critiques.

La profondeur d'apprentissage a des effets différents, en fonction de la variabilité historique.

Oui, peut-être que pour les prédicteurs à 4 graines, cela n'a pas beaucoup d'effet. Les bêtises sont des idées fausses. C'est la graine qui détermine essentiellement le nombre de prédicteurs utilisés dans le modèle.

Tous les paramètres sont affectés. Je voulais juste dire que vous avez probablement un ordre de grandeur de plus de combinaisons que d'exemples. Avec 4 prédicteurs, je vois l'intérêt d'un modèle de 1 à 3 arbres CB, avec un taux d'apprentissage de 0,3 à 0,5, sinon le modèle est déjà adapté.

 
Aleksey Vyazmikin #:

Vous pouvez simplement essayer d'alimenter différents échantillons pour continuer à apprendre sur de nouvelles données. Même CatBoost semble pouvoir le faire. Il sait aussi comment fusionner des modèles, mais je n'ai pas cherché à le faire.

Il s'agit d'un gradient bousting...

ce qui signifie qu'il apprend à partir des erreurs du modèle précédent

et nous n'avons besoin de nous entraîner que sur un seul modèle, et plusieurs fois.

La seule différence entre les modèles est que les échantillons sont décalés dans le temps.

 
Renat Akhtyamov #:

c'est un gradient bousting.....

c'est-à-dire apprendre des erreurs de la précédente

et il suffit de s'entraîner sur un seul modèle, et plusieurs fois.

La seule différence entre les modèles est que les échantillons sont décalés dans le temps.

Mon cerveau n'arrive pas à traiter ce que vous avez écrit.

 
Aleksey Vyazmikin #:

Oui, peut-être que sur 4 prédicteurs, les semences n'ont pas beaucoup d'effet. Ces bêtises sont des idées fausses. En fait, la graine détermine le nombre de prédicteurs qui seront utilisés dans le modèle.

Tous les paramètres sont affectés. Je voulais juste dire que vous avez probablement un ordre de grandeur de plus de combinaisons que d'exemples. Avec 4 prédicteurs, je vois l'intérêt d'un modèle de 1 à 3 arbres CB, avec un taux d'apprentissage de 0,3 à 0,5, sinon le modèle est déjà adapté.

La graine n'affecte pas les endroits où il y a un optimum normal

+- court-circuit, cela n'a pas d'importance.

Vous pouvez l'ajuster un peu, mais ce n'est plus crucial.

 
Maxim Dmitrievsky #:

les semences n'ont aucun effet partout où il existe un optimum normal

+- court-circuit, il ne joue aucun rôle

On peut l'ajuster un peu, mais ce n'est pas crucial.

Où se trouve-t-il ?

 
Aleksey Vyazmikin #:

Et où se trouve-t-il ?

où les variations sur le thème des semences n'affectent pas beaucoup le résultat, je suppose )

 
Maxim Dmitrievsky #:

où les variations sur le thème des semences n'affectent pas beaucoup le résultat, apparemment )

Il est clair que ce n'est pas le cas pour nous...

 
Aleksey Vyazmikin #:

Manifestement, ce n'est pas le cas pour nous.

C'est une chose à laquelle il faut s'attendre.
 
Maxim Dmitrievsky #:
Eh bien, il y a quelque chose à attendre avec impatience.

C'est vrai. Mais nous parlons ici d'un monde idéal. Parfois, il vaut mieux s'adapter à celui qui existe déjà.

 
Maxim Dmitrievsky #:
Il s'agit de savoir s'il vaut mieux fouiller au hasard ou s'en tenir à des informations a priori fiables

A part les heures de début et de fin (sessions, calendrier), rien ne me vient à l'esprit. Que voulez-vous dire par là ?

Raison: