L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 803

 

Quelle est la meilleure façon d'équilibrer les classes, qui utilise quelles méthodes ?

Je voudrais également vous demander quels sont les prédicteurs que vous jugez intéressants, puis-je le prendre comme une note personnelle).

 
forexman77:
Quelle est la meilleure façon d'équilibrer les classes, qui utilise quelles méthodes ?

Il existe des fonctions

 caret:: downSample() - обрезает большой класс до меньшего

downSample échantillonnera aléatoirement un ensemble de données de sorte que toutes les classes aient la même fréquence que l'ensemble de données.

classe minoritaire. upEchantillons avec remplacement pour rendre les distributions des classes égales.

 caret:: upSample() - добавляет меньший класс до большего


En général, je recommande de regarder dans caret : il peut être utilisé comme un tutoriel "what-if" - il contient des outils pour le cycle complet :

  • la préparation des données brutes,
  • Sélection de prédicteurs (outils très cool),
  • moins de 200 modèles (modèles de régression et de classification) et
  • évaluation du modèle (rien à voir avec un testeur).

Vous pouvez obtenir des designs assez industriels.



PS.

Je pense que personne ne révélera les prédicteurs - c'est le plus important, et les modèles sont une question de technique et d'assiduité.

 
SanSanych Fomenko:


Je pense que personne ne révélera les prédicteurs - c'est le plus important, et les modèles sont une question de technique et de diligence.

Eh bien, je posais juste une question stupide. Après tout, ils créent des branches stupides, "comment tripler le dépôt", "dites-moi un conseiller expert qui gagne de l'argent", etc.

Mais, je veux des conseils avec des indicateurs, c'est clair, c'est la première chose qui me vient à l'esprit. Mais voici quelque chose d'inhabituel, où peu de gens ont creusé.

 
forexman77:

Eh bien, c'était juste une "course folle". Après tout, ils créent des branches stupides, "comment tripler le dépôt", "dites-moi un conseiller expert qui gagne de l'argent", etc.

Mais, j'ai besoin de conseils pour les indicateurs, c'est clair, c'est la première chose qui me vient à l'esprit. Mais voici quelque chose d'inhabituel, où peu de gens ont creusé.

Prenez les filtres numériques de la dernière partie de l'article. Il sera utile, je pense, de lire également toutes les parties précédentes.

Bonne chance

 
SanSanych Fomenko:

Il existe des fonctions

downSample échantillonnera aléatoirement un ensemble de données de sorte que toutes les classes aient la même fréquence que l'ensemble de données.

classe minoritaire. upEchantillons avec remplacement pour rendre les distributions des classes égales.


En général, je recommande de regarder dans caret : il peut être utilisé comme un tutoriel "what-if" - il contient des outils pour le cycle complet :

  • la préparation des données brutes,
  • Sélection de prédicteurs (outils très cool),
  • moins de 200 modèles (modèles de régression et de classification) et
  • évaluation du modèle (rien à voir avec un testeur).

Vous pouvez obtenir des designs assez industriels.



PS.

Je ne pense pas que quiconque divulguera les prédicteurs - c'est le plus important, et les modèles sont une question de technique et d'assiduité.

Les modèles sont créés à partir d'éléments prêts à l'emploi, alors qu'ici vous pouvez les créer de toutes pièces.

 
forexman77:

Eh bien, c'était juste une "course folle". Après tout, ils créent des branches stupides, "comment tripler le dépôt", "dites-moi un conseiller expert qui gagne de l'argent", etc.

Mais, j'ai besoin de conseils pour les indicateurs, c'est clair, c'est la première chose qui me vient à l'esprit. Mais voici quelque chose d'inhabituel, où peu ont creusé.

Dans le cas le plus simple, j'utilise comme prédicteurs un ensemble de barres - valeur intégrale calculée par une formule donnée, qui est déposée comme donnée d'entrée lors de la formation.


L'équilibrage se fait par échantillonnage à partir du marqueur de fin de formation, profondément dans l'historique, dans une boucle, jusqu'à ce que le nombre d'échantillons atteigne un nombre défini et soit comparé.

 
Ivan Negreshniy:
Dans le cas le plus simple, j'utilise un ensemble de barres comme prédicteurs - une valeur intégrale calculée par une formule donnée, qui est utilisée comme donnée d'entrée dans la formation.

En fait, le meilleur prédicteur est la série de prix elle-même. Tout traitement constitue une perte et un retard d'information. Et si l'on considère que nous ne savons pas vraiment de quel type d'information nous avons besoin, alors...

Je travaille avec 1m et un retard même de 30s est fatal au système. Et même des indicateurs très simples donnent un retard de 1 à 3 m.

Même si vous travaillez sur une échelle horaire, le délai sur les indicateurs sera de 1-3 h). Par tous les moyens 1-3 bougies, peu importe comment vous le présentez.

ZSY2 Un autre avantage des séries temporelles - nous n'avons pas besoin de prendre des prédicteurs. Apprenez simplement à utiliser la BP elle-même en tant que telle.

 
Yuriy Asaulenko:

En fait, le meilleur indicateur est la fourchette de prix elle-même. Tout traitement constitue une perte et un retard d'information. Et quand on considère que nous ne savons pas vraiment de quel type d'information nous avons besoin, alors...

Je travaille avec 1m et un retard même de 30s est la mort du système. Et même des indicateurs très simples donnent un retard de 1 à 3 m.

Même si vous travaillez sur une échelle horaire, le délai sur les indicateurs sera de 1-3 h). Par tous les moyens 1-3 bougies, peu importe comment vous le présentez.

ZSY2 Un autre avantage des séries temporelles - nous n'avons pas besoin de prendre des prédicteurs. Apprenez simplement à utiliser la BP elle-même en tant que telle.

Comment ne pas répondre par une phrase comme celle-ci. Le graphique horaire peut être visualisé à la loupe 15m, 5m 1m. Messieurs, c'est triste.

 
Uladzimir Izerski:

Comment ne pas répondre avec une phrase comme celle-ci. Le graphique horaire peut être visualisé à la loupe 15m, 5m 1m. C'est triste, messieurs.

Ne sois pas triste, je sais.) Mais si vous êtes à l'aise, vous pouvez continuer.

 
Dites-moi s'il vous plaît, est-il suffisant de rechercher la corrélation avec les données cibles au stade initial pour sélectionner les données, si oui, quel seuil de corrélation doit être utilisé ?
Raison: