L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2427

 
Aleksey Vyazmikin:

Eh bien, puisque je fais un script pour préparer les données, je dois quand même faire un fichier listant les colonnes exclues, qui incluent :

1. Colonnes avec des prédicteurs corrélés (au fait, comment choisir la colonne à abandonner, disons 5 prédicteurs corrélés ?)

2. Colonnes écartées du premier fichier-tableau, à l'exception de la colonne avec la cible.

De plus, la colonne avec l'étiquette cible doit être écrite dans le fichier, de préférence recherchée par le nom de la colonne.

La structure du fichier est la suivante

Que cela devienne votre devoir)...
Le code a tout ce qu'il faut pour cela.
Pour les questions, il y a le site stackowerflow et d'autres ...
Ne torturez pas le vieil homme))
 
Aleksey Vyazmikin:

Je dois sélectionner les bons prédicteurs en moins de temps. Passer à nouveau par les prédicteurs revient à multiplier par cent le temps de traitement. Ma méthode est basée sur la logique selon laquelle un bon prédicteur (y compris un prédicteur adapté à une méthode d'apprentissage particulière) sera requis par le modèle à tous les intervalles d'échantillonnage, ce qui élimine l'ajustement à la zone d'échantillonnage.

Afin de l'avoir sur tous, nous devons procéder à une validation croisée. Et vous ne vérifiez que par un test ou un examen.
Si vous effectuez une validation croisée sur 10% d'un échantillon, vous devez vous entraîner 10 fois, pas des centaines. Et si vous faites 20%, vous devez l'enseigner 5 fois.

 
elibrarius:

Vous devez procéder à des vérifications croisées avec la validation pour être en mesure de tout faire. Et vous ne vérifiez qu'avec un test ou un examen.
Si vous effectuez une validation croisée sur 10% de l'échantillon, vous devez vous entraîner 10 fois, et non des centaines. Et si c'est 20%, alors 5 fois.

Je divise l'échantillon en 8 sections et je construis 100 modèles différents pour chaque section, puis j'analyse les modèles et je vois quels prédicteurs ont été demandés - cela signifie qu'ils ont été utilisés pour trouver un modèle, je fais la moyenne de la valeur estimée, puis j'utilise les prédicteurs restants pour former l'échantillon entier. La logique derrière cela est qu'une fois que les modèles de ces prédicteurs ont été trouvés dans une zone particulière, alors le modèle sera capable de généraliser ces prédicteurs de manière uniforme sur l'ensemble de l'échantillon, plutôt que d'ajuster pour les zones de l'échantillon comme c'est généralement le cas.

Votre méthode construit le modèle sur une petite partie de l'échantillon, les modèles seront construits différemment sur chaque partie de l'échantillon, parce que les meilleurs prédicteurs seront sélectionnés en fonction de la zone de formation particulière, et compte tenu du fait que l'échantillon n'est pas parfait (représentatif), nous pouvons dire que cette méthode n'étudie qu'une partie des informations disponibles qui peuvent ou non se répéter à l'avenir, ma méthode permettra d'apprendre plus d'informations sur le marché et le surentraînement sera moindre. De plus, si dans CatBoost on ne fixe pas la table quantique, alors chaque fois que la formation générale se fera sur des prédicteurs différents à cause des différentes constructions des tables quantiques pour le site concret de l'échantillon.

 
mytarmailS:

maintenant la réponse à la première question

Je ne sais pas ce qui ne va pas - ça jure.

Error in get.findCorrelation(data = df1, not.used.colums = c("Target_100_Buy",  : 
  could not find function "get.findCorrelation"
 
Aleksey Vyazmikin:

Je ne sais pas ce qui ne va pas - ça jure.

Exécutez le code pour créer une fonction, puis la fonction elle-même.
 
mytarmailS:
Exécuter le code de création de la fonction et ensuite la fonction elle-même

Ça a marché, merci.

mytarmailS:
Que ce soit votre devoir)...
Le code a tout pour lui...
Il y a stackowerflow et d'autres sites pour les questions...
Ne torturez pas un vieil homme))

Je ne pourrais utiliser que des exemples concrets pour le comprendre, sinon je ferais mieux de résoudre le problème en MQL.

 
Le sujet de forum le plus mystique maintenant avec la communication télépathique.
Ils ont, après tout, entraîné la machine - la machine leur a donné des superpouvoirs.


 
Compte_:
Le fil de discussion le plus mystique du forum maintenant avec la communication télépathique.
Ils ont, après tout, entraîné la machine - la machine leur a donné des superpouvoirs.


Oui, je pensais que j'imaginais des choses :-) Eh bien, c'était une bonne discussion, et surtout instructive :-)
 
Personne n'a jamais admis quel type de machine est enseigné ici ou ce que...
 
Vladimir Baskakov:
Personne n'a admis quel type de machine est enseigné ici et ce que...

Je me demande aussi pourquoi chaque épouvantail qui vend sa misérable machine à calculer les moyennes pense qu'il est de son devoir de se promouvoir dans ce fil, est-ce une initiation ou quoi ? ))

Raison: