L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2595

 
elibrarius #:

Il s'avère ensuite que vous devez vous entraîner sur une section aussi courte que possible. Ainsi, après le changement de motif, le nouveau motif commence à fonctionner plus rapidement.

Par exemple, si vous vous entraînez pendant 12 mois, après un changement de schéma dans 6 mois, le nouveau et l'ancien schéma seront à 50/50. Et après environ un an, il y aura une formation et des échanges sur le nouveau modèle. C'est-à-dire que pendant presque une année entière, le modèle a été négocié sur un modèle périmé et très probablement perdant.

Si vous vous entraînez pendant un mois, le motif réapprendra à fonctionner correctement dans un mois.

Ce serait bien de s'entraîner pendant une semaine... Mais il n'y a pas assez de données.

Ce n'est pas du tout la peine d'y aller pour une courte période, j'en suis sûr. Et les données manqueront pour les modèles et le risque de surajustement aux conditions du marché. Le concept d'adaptation semble bon, mais en raison du décalage (pendant l'accumulation des données, l'état peut déjà avoir changé), il n'est guère un graal. Plusieurs modèles peuvent être essayés en même temps - l'un est responsable des modèles à long terme, un autre/les autres des modèles à court terme (actuels), la solution est une fonction des solutions de tous ces modèles.

 
Aleksey Nikolayev #:
L'utilisation de la MO dans le commerce soulève des questions plus intéressantes. Par exemple, l'algorithme de détermination de l'intervalle d'histoire à prendre pour la formation. Il est peut-être possible de le définir par des méta-paramètres qui sont optimisés par validation croisée. Je dois lire Prado).

C'est probablement mieux de rouler vers l'avant, il y a toujours des OOS après le train. Sur SW, seule la première passe sera comme ça, d'autres utiliseront les données pré et post-trane pour le trane.

 
Replikant_mih #:

Ce n'est pas du tout la peine de s'en aller à court terme, j'en suis sûr. Et il y aura un manque de données pour les modèles et un risque de surajustement aux conditions du marché. Le concept d'adaptation semble bon, mais en raison du décalage (le temps que vous accumuliez les données, l'état peut avoir déjà changé), il n'est guère un graal. Vous pouvez essayer plusieurs modèles à la fois - l'un est responsable des modèles à long terme, un autre/les autres des modèles à court terme (actuels), la solution est une fonction des solutions de tous ces modèles.

Selon des expériences récentes sur 5000 lignes de M5 (environ 2 mois), il y a quelque chose d'intéressant. A 3000, c'est déjà mauvais. Mais c'est pour des puces spécifiques+cible prise. Peut-être y a-t-il un ensemble différent de caractéristiques et de cibles lorsque le modèle fonctionne après un entraînement sur une parcelle courte. Nous devrons expérimenter...
 
elibrarius #:
Selon des expériences récentes sur 5000 lignes de M5 (environ 2 mois) il y a quelque chose d'intéressant. A 3000, c'est déjà mauvais. Mais c'est pour les puces spécifiques + la cible prise. Peut-être y a-t-il un ensemble différent de caractéristiques et de cibles lorsque le modèle fonctionne après un entraînement sur une parcelle courte. Nous devrons expérimenter...

Cela dépend du nombre de fonctionnalités, j'aime avoir plus de fonctionnalités, généralement 5000 n'est pas suffisant, si vous avez jusqu'à 5 fonctionnalités, peut-être 5000 est ok.

 
elibrarius #:

Il s'avère ensuite que vous devez vous entraîner sur une section aussi courte que possible. Ainsi, après le changement de motif, le nouveau motif commence à fonctionner plus rapidement.

Par exemple, si vous vous entraînez pendant 12 mois, après un changement de schéma dans 6 mois, les nouveaux et les anciens schémas seront à 50/50. Et après environ un an, il y aura une formation et des échanges sur le nouveau modèle. C'est-à-dire que pendant presque une année entière, le modèle a été négocié sur un modèle périmé et très probablement perdant.

Si vous vous entraînez pendant un mois, le motif réapprendra à fonctionner correctement dans un mois.

Ce serait bien de s'entraîner pendant une semaine... Mais il n'y a déjà pas assez de données.

Il se peut alors qu'il n'apprenne pas assez, qu'il donne moins de bénéfices... c'est une sorte de question de sélection, je suppose. Parfois, l'échantillonnage à partir des distributions actuelles peut être utile pour les échantillons courts, comme dans les articles suivants
 
Replikant_mih #:

Pour le bruit, oui. Je n'y ai pas pensé en termes de sections de l'histoire avec et sans bruit, cependant. Et d'ailleurs, comment cela est-il compris avant la formation des modèles ? Comme, itérativement ? Vous entraînez toute la section, voyez où elle est la plus performante, laissez ces sections et n'entraînez d'abord que ces sections ? Cela donne lieu à la deuxième question que l'on peut qualifier de philosophique avant la validation expérimentale : est-il préférable que le modèle voie immédiatement différentes zones, y compris les zones bruyantes, mais s'entraîne en moyenne dans des données bruyantes ou s'entraîne sur des données plus propres, mais ne voit pas du tout les données bruyantes ?


Et qu'est-ce qui ne va pas avec les tailles géantes ? Outre l'augmentation du temps de calcul ?

Eh bien, comme s'entraîner sur la dernière histoire sur différentes longueurs de plateau et comparer comment les modèles ont fonctionné sur l'histoire précédente, s'ils cessent de fonctionner au même moment quelque part, alors c'est "l'horizon d'applicabilité dans le passé", en tenant compte de la dernière histoire. Vous ne savez pas comment cela se passera dans le futur, mais vous pouvez déterminer les critères d'arrêt du robot - s'il commence à trader moins bien que dans l'historique, par exemple.

Sur un échantillon long, une tendance générale qui apparaît sur des sous-échantillons peut disparaître. Si les régularités des sous-échantillons se contredisent, nous devrons apprendre uniquement à partir du bruit, ce qui réussit dans la plupart des cas :)
 
elibrarius #:

C'est probablement mieux avec un transitaire valking, il a toujours des OOS après le trine. Dans SW, seul le premier passage sera comme ça, le reste utilisera les données avant et après le train.

Il existe une série chronologique spéciale KV, à catbust par exemple. Mais alors l'ensemble de données ne peut pas être mélangé. Et si vous ne mélangez pas, c'est comme si vous vous adaptiez à des sections de longueur égale. Et si vous le mélangez, alors la formation est plus pour les signaux locaux, ne dépendant pas, grosso modo, des tendances changeantes. Qui sait ce qui est le mieux :)
 
Maxim Dmitrievsky #:
Et si vous ne mélangez pas, c'est comme si vous vous adaptiez à des sections alternées de longueur égale.
Je vais aussi faire du commerce de cette façon. La durée sera égale à une semaine. Une semaine d'échanges, un week-end d'entraînement. Et la marche en avant fait la même chose.
 
Foolishness
 
elibrarius #:

C'est probablement mieux avec un transitaire valking, il a toujours des OOS après trayn. Dans SW, seule la première passe sera comme ça, le reste utilisera à la fois avant et après OOS pour les données de suivi.

Je suis d'accord avec vous si vous répondez à la question "Comment faire du commerce sur la prochaine période ?". Si nous répondons à la question "Y a-t-il un modèle dans cette partie de l'histoire ?", alors le RPT est tout à fait applicable.

Raison: