L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2038

 
Maxim Dmitrievsky:

il n'y a pas à discuter, parce que dans n'importe quel cadre normal a fait et a montré, avec un minimum de code

nous ne discutons pas ici des modèles autodidactes, mais uniquement des modèles matures comme le catbust ou les réseaux neuronaux modernes

Ces histoires de souris avec des réseaux neuronaux mql ne sont même pas intéressantes à discuter, car le monde est très en avance, et chaque année, il double l'écart.

Supposons que vous me disiez : "J'ai tel et tel modèle sur tensorflow"... Je dis "bien, je peux faire le même modèle sur un Torch pendant 5 minutes et le vérifier. Et vous me dites que vous avez construit quelque chose en mql. Pourquoi ai-je besoin de cette information ? Comment suis-je censé la recréer ?

Pourquoi n'admettez-vous pas que j'ai un modèle quetensorfloat/torche mettra encore deux ans à construire et queje triplerai le rendement) ?

tiré d'un livre d'Edgar Peters, pas textuellement bien sûr - "Le commis/courtier passera un billet de cinq livres gisant dans une rue, parce que selon sa théorie des probabilités, il ne devrait pas être là...")

Bonne chance.



 
elibrarius:

Plus il y a de lignes, plus la profondeur est nécessaire.
S'il y a des gigaoctets, alors des millions de lignes. À la profondeur 6, la feuille finale sera de 1/64e du nombre total d'exemples/chaînes, c'est-à-dire des dizaines de milliers si l'entrée est de plusieurs millions.

CB construit donc des ensembles, c'est-à-dire que la coupe se fait dans les deux sens, et le découpage dépend du nombre d'arbres ; en général, ils recommandent une profondeur maximale de 10.

 
dr.mr.mom:

pourquoi n'admets-tu pas que j'ai un modèle quis'étend sur quelques années de plus et que je triple l'écart, pourquoi ne l'admets-tu pas ?)

c'est déjà une déprime de parler, malheureusement

 
Aleksey Vyazmikin:

CB construit donc des ensembles, c'est-à-dire que la coupe se fait dans les deux sens, et le traçage dépend du nombre d'arbres ; en général, ils recommandent une profondeur maximale de 10.

Apparemment, ce n'est pas une recommandation pour des millions de lignes. Essayez 15.

 
elibrarius:

Apparemment, ce n'est pas pour des millions de lignes de conseils. Essayez 15.

Cela ne concerne que les très grands échantillons en largeur et en profondeur.

Je dis que l'apprentissage est facile, mais les modèles détectés par l'apprentissage ne sont pas confirmés sur l'échantillon de contrôle.

 
Aleksey Vyazmikin:

Cela ne concerne que les très grands échantillons en largeur et en profondeur.

Je dis que l'apprentissage est facile, mais les modèles détectés dans l'apprentissage ne sont pas confirmés dans l'échantillon de contrôle.

À mon avis, le nombre de colonnes n'est pas si important pour la profondeur. Ce n'est que pour un grand nombre de rangs que vous devez augmenter la profondeur. Quant aux colonnes, vous pouvez en avoir jusqu'à un million. Elles seront toutes vérifiées et seules les meilleures seront sélectionnées.
 
Igor Makanu:

il n'y a généralement aucun problème avec l'analyse des informations sur le marché... à l'exception de l'avidité du chercheur, qui croit que le marché ne donne des informations qu'à lui et qu'il doit traiter toutes les données, c'est-à-dire qu'ici la tâche est formalisée comme la recherche d'un modèle répétitif, les autres données devant être écartées (non utilisées).

Avec la décision est triste - de générer TS qui passera le test et l'avant est possible, mais de trouver des liens entre les statistiques du testeur de stratégie et le temps de persistance de TS ou la possibilité de déterminer la conformité de TS avec le contexte du marché - c'est le problème.

c'est-à-dire que, comme vous l'écrivez, le problème se situe dans le futur.


Je pense qu'en général nous avons fait quelques progrès dans la formalisation du problème,

En principe, il n'est pas difficile de faire un déchargement des statistiques de test et d'essayer d'entraîner NS en Python,

La détermination du contexte du marché est, comme vous l'avez écrit, uniquement une décision du trader, c'est-à-dire que je doute qu'elle puisse être formalisée, algorithmée ou étudiée.

Avec les atomes, c'est plus simple à deux niveaux : la matière, les molécules, les atomes dans les matières inorganiques et la matière, les grosses molécules et les nombreux atomes dans les matières organiques. Dans l'analyse du marché de l'État, les entités commerciales sont des personnes, et les personnes sont plus compliquées que les atomes et leurs composants.

 
elibrarius:
A mon avis, le nombre de colonnes n'est pas si important pour la profondeur. Seul un grand nombre de rangs devrait augmenter la profondeur. Mais les colonnes peuvent être au nombre d'un million. Elles seront toutes vérifiées et seules les meilleures seront retenues.

Au total, le résultat est le suivant - 2 arbres au total

La métrique

Évaluer l'importance des prédicteurs selon la méthode choisie

Vous trouverez ci-joint un modèle C++ et bin ainsi qu'une table de quantification.

Il me semble que soit l'échantillon doit être mélangé, soit c'est le maximum - confus par la différence de métrique entre les échantillons de test et d'examen.

Dossiers :
model.zip  19 kb
 
Valeriy Yastremskiy:

Avec les atomes, c'est plus facile à deux niveaux : la matière, les molécules, les atomes dans les matières inorganiques et la matière, les grosses molécules et les nombreux atomes dans les matières organiques.

C'est exactement ça, mais tant que vous considérez des atomes, et dès que vous décidez de considérer un réseau cristallin, "c'est fini" - dans la plupart des cas, il est très difficile de résoudre le problème, j'ai lu une fois, par la façon dont ils utilisent les réseaux neuronaux - on obtient des résultats plus rapides du processus de modélisation

C'est la même chose avec les marchés, si on regarde un ou deux ticks, il n'y a pas beaucoup de variantes - soit à la hausse, soit à la baisse, tout se complique si on passe aux études "ici ils ont ouvert un ordre, et ici ils l'ont fermé" ;)))

Valeriy Yastremskiy:

Dans l'analyse du marché des États, les entités commerciales sont des personnes. et les personnes sont plus complexes que les atomes et leurs constituants. certainement plus complexes que la chimie organique.

Oui, c'est une structure vivante, mais elle a un modèle comportemental - qu'on l'appelle modèle ou contexte de marché, ce n'est pas le sujet.

vous pouvez étudier le comportement sur l'histoire, maintenant c'est à vous de décider ce qu'il faut faire dans le futur.

 
Aleksey Vyazmikin:

Voici le résultat global - 2 arbres au total

Métrique

Estimation de l'importance des prédicteurs selon la méthode choisie

Ci-joint le modèle C++ et bin, et la table de quantification.

Il me semble que soit l'échantillon a besoin d'être mélangé, soit c'est le maximum - confus par la différence de métriques entre l'échantillon du test et celui de l'examen.

Le brassage au sein d'un train ou d'un test est possible mais n'a aucun sens, et le brassage entre le train et le test ne l'est pas. Les avez-vous mélangés là par hasard, quelque chose de très bon résultat pour le test avec l'examen.

La différence est que le marché n'est pas toujours le même, mais qu'il change. L'essentiel est le bénéfice moyen).

Raison: