L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1304

 
Maxim Dmitrievsky:

10% d'erreur par test et trace pour ~10k exemples, augmente doucement avec l'augmentation

à cette erreur, les modèles ont commencé à travailler sur de nouvelles données

sur la validation autrement, il faut passer par les variantes.

Les algorithmes ne sont plus divulgués, ils ne font que communiquer.

Quelque chose de suspicieusement petit. Dans ses articles, même sur les zigzags, Perervenko n'y est pas parvenu.

Et il est également suspect que le test et le stagiaire aient 10% chacun, mais que la validation soit "différente". C'est à dire plus ou quoi ? Le pire doit être le test, pas la validation.

 
elibrarius:

Il y a quelque chose de suspicieusement petit. Pererwenko n'y est pas parvenu, même sur les zigzags de ses articles.

Et il est également suspect que 10% chacun sur le test et le stage, et la validation est "différente". Est-ce que c'est plus que ça ? Le pire doit être le test, pas la validation.

"Même sur les zigzags" ))))

le pire ne devrait être qu'une validation qui n'a pas été impliquée de quelque manière que ce soit, même indirectement, dans l'apprentissage.
 
Maxim Dmitrievsky:

"Même sur les zigzags" ))))

le pire ne peut être que la validation qui n'a pas été impliquée dans l'apprentissage de quelque manière que ce soit, même indirectement
Et pourquoi pas la section test ? Parce qu'elle "n'a pas participé à la formation de quelque manière que ce soit, même indirectement" ?
 
elibrarius:
Pourquoi pas le site d'essai ? Après tout, il n'est pas non plus "impliqué dans l'apprentissage de quelque manière que ce soit, même indirectement".

le test on est toujours indirectement impliqué dans l'apprentissage, prendre le même catbust... allez

 

А... ou nous appelons les parcelles différemment.

J'appelle

1 section de train
2 valide - c'est ce qui est utilisé dans de nombreux paquets pour le contrôle du processus d'apprentissage et pour l'arrêt précoce. Et ça s'appelle Valide.
3 test - pour évaluer le système avec de nouvelles données

Vous avez peut-être appelé la 2e section une section de test.

 
Maxim Dmitrievsky:

le test est toujours indirectement impliqué dans l'apprentissage, prenez catbust... allez

Catbust Je ne sais pas. Voici une citation de XGBoost

arrêts précoces
Si NULL, la fonction d' arrêt anticipé n'est pas déclenchée. Si elle est définie comme un nombre entier k, la formation
avec un ensemble de validation s'arrêtera si la performance ne s'améliore pas pour k
rondes.

 
elibrarius:

А... ou nous appelons les parcelles différemment.

J'appelle

1 jeu de données de formation
2 valide - c'est ce que beaucoup de paquets utilisent pour le suivi pendant l'entraînement et pour l'arrêt précoce. Elle s'appelle Valid.
3 test - pour évaluer le système avec de nouvelles données

Je vois que vous appelez la 2ème partie une partie test.

Je pense que c'est l'inverse, la validation est le nouveau...

Oui, eh bien, vous voyez l'idée.

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

--test-set

Une liste de fichiers d'entrée séparés par des virgules qui contiennent la description de l'ensemble de données de validation (le format doit être le même que celui utilisé pour l'ensemble de données d'entraînement).

Omis. Si ce paramètre est omis, l'ensemble de données de validation n'est pas utilisé.


)))) vous pouvez l'écrire comme vous le souhaitez, cela s'appelle

 
Maxim Dmitrievsky:

Je pense que c'est l'inverse, la validation est la nouvelle, où il est écrit

Oui, eh bien, vous voyez l'idée.

Je ne l'ai pas compris au début.
Car nous utilisons des termes différents.

Nous devrions nous en tenir à une seule terminologie.

 
elibrarius:

Au début, je ne l'ai pas compris.
Car nous utilisons des termes différents.

Nous devrions nous en tenir à la même terminologie.

Montrez-moi la documentation d'un paquet, où la deuxième section (qui est utilisée pour le contrôle de l'apprentissage et/ou l'arrêt précoce) est appelée test, et non validation.

Je vous ai montré ci-dessus, en voici d'autres

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
scie)
Globalement, confusion sur la terminologie
Raison: