L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 1782
Qu'est-ce que vous partagez ? Et qu'est-ce qui ne vous convient pas dans les augmentations ? Il s'agit essentiellement de vitesses ajustées en fonction du temps. Mais il n'y a pas moyen que je puisse le faire sans moyenne. Mais si vous commencez à prendre en compte les moyennes, vous vous retrouvez rapidement dans un labyrinthe. Il doit y avoir un juste milieu quelque part. Sur le dernier tic, la barre n'est pas suffisante, et un peu plus est épais.
2 ou plusieurs prieurs avec des décalages différents, pour un nombre différent de clusters.
Comme il n'y a pas de dépendance fonctionnelle entre la paire d'incréments, le nuage est stupidement divisé en deux, etc. Nous avons besoin de quelque chose de plus strict que les incréments. Peut-être devraient-ils être transformés d'une manière ou d'une autre.
2 incréments ou plus avec des décalages différents, sur un nombre différent de clusters
Je ne comprends pas la paire d'incréments. Sur les 2 dernières mesures ou autre chose ?
J'ai encore une idée dans le sens des vitesses et des moyennes aussi. Bien, les systèmes devraient être formés sur différentes TF, sur l'interaction de différentes TF, et il devrait y avoir des conneries de tic-tac, c'est-à-dire qu'il devrait également y avoir un comportement de tic-tac lorsque le TS prend des décisions.
Les différentes TF ne font que pondérer les signes qui s'éloignent de l'état actuel. Semko a son propre système, mais j'aime encore mieux TF, il y a la régularité et une certaine considération des extrêmes.
J'y ai pensé. Nous plaçons des ordres sur le nuage de prix et donc le drawdown sera négatif 99% du temps. Mais comment pouvons-nous estimer que nous ne nous sommes pas trompés ? En utilisant les extrema les plus proches, si les extrema les plus proches sont négatifs, nous pouvons clôturer sans perte.
Que nous pouvons mesurer sur quelques barres récentes et un historique de 120 barres. Sur un mois, cela fait 10 ans. Assez, semble-t-il.
Mach 2, 14, 30, 120, 480 vitesses et trouver les aigus et les inflexions
Écarts entre les traits adjacents et recherche de maxima et de coudes
Différences maximales de prix par rapport aux Mashas, mais ce sont généralement les véritables extrêmes de prix.
Temps de tendance moyen, avec mise en évidence des maxima et minima
Des différences moyennes dans les tendances, à la Donchian.
Et il est possible de diviser les tendances en flux et en durées.
Le temps moyen des tendances dans l'appartement. Les tendances des TF inférieurs dans les TF supérieurs.
La durée moyenne des tendances.
Et il semble que différents paramètres deviennent significatifs en fonction des autres. Et le lien n'est pas évident. C'est la première chose qui vient à l'esprit pour relier le TF inférieur au TF supérieur, mais il est clair que cela ne suffit pas. Et je ne trouve pas encore de logique dans les liens.
Le temps est un indicateur de la volatilité, qui est saisonnière dans le temps, il y a des heures de trading actif et des heures de trading passif.
Je suis d'accord, je ne l'ai pas pris en compte.
Oui, vous pouvez la sauvegarder mais pour enseigner le modèle il faut charger cette matrice dans l'environnement, et ce sera la fin de tout cela ;)) ou plutôt avant, au stade de la formation de la matrice avec les prédicats.
Essayez CatBoost. En tout cas, je peux l'entraîner et nous verrons le résultat.
Wow un concert n'est pas petit, je me demande combien de signes vous avez ?
566 dans cet échantillon.
Qu'est-ce que l'arbre génétique ?
1) simple )
2) comment c'est ? Et comment ajuster les prédicteurs pour la ZZ ?
3) Eh bien, vous avez un chandelier comme l'ouverture ou quelque chose comme ça, il est déjà déformé, parce qu'ils devraient être par des clowes, et ici immédiatement beaucoup de confusion, les signes de construire comment, comment faire la cible, etc (douleur inutile), si vous changez quelque chose pour vous-même, vous devriez toujours laisser l'original pour les autres)
Le script en R, qui construit un arbre à l'aide d'un algorithme génétique, en sélectionnant les scissions. Je ne suis pas vraiment versé dans ce domaine - le travail de Doc.
2. J'utilise des prédicteurs basés sur la ZZ, évidemment ils sont plus efficaces si eux et la cible sont calculés sur la même ZZ.
3. Je ne connais pas son OHLC au début de la mesure, c'est donc ainsi que je l'ai noté - comme cela se passe dans la vie réelle.
En résumé, dois-je le refaire ou est-ce inutile ?
Le catbust n'aidera pas, le problème est la taille des données, je ne serai même pas capable de créer des traits, vous n'arriverez même pas à vous entraîner...
Faites l'échantillon de 50k, qu'il soit petit, qu'il ne soit pas sérieux, qu'il soit plus possible de se surentraîner, ..... ..., ... La tâche est de faire un robot pour la production, mais juste un effort conjoint pour réduire l'erreur, et puis les connaissances acquises peuvent être transférées à n'importe quel outil et le marché, 50k est tout à fait suffisant pour voir quels sont les signes qui signifient vraiment quelque chose.
3. Au début de la barre, je ne connais pas son OHLC, alors je l'ai noté - comme cela se passe dans la vie réelle.
Si vous ne connaissez pas l'OHLC, vous n'avez pas besoin de l'écrire. Pourquoi déplacer tout l'OHLC ? Personne ne fait cela, il suffit de décaler ZZ d'un pas, comme pour regarder dans le futur d'un pas pour la formation et c'est tout. Je voudrais vous demander si vous avez lu l'un des articles de Vladimir Perervenko sur le deer-lining, s'il vous plaît lisez-les, ils sont très inconfortables quand nous avons déjà établi la manière optimale de traiter les données et tout le monde est habitué à eux, et quelqu'un essaie de faire la même chose mais d'une manière différente, c'est un peu insensé et ennuyeux, et provoque de nombreuses erreurs chez les personnes qui essaient de travailler avec les données de cet auteur.
Si après tout cela vous voulez toujours faire quelque chose, j'ai les exigences suivantes
1) les données 50-60k pas plus, de préférence un fichier, il suffit de convenir que le n de la dernière bougie sera le test
2) Les données, de préférence sans colle, afin de pouvoir prendre en compte non seulement les derniers prix, mais aussi le support et la résistance, ce qui est impossible avec des colles.
3) la cible devrait déjà être incluse dans les données
4) données au format date,heure,o,h,l,c, cible
Ou dois-je créer un ensemble de données ?
Deux séries temporelles avec des décalages différents. Vous pouvez regrouper tout ce que vous voulez, mais vous vous retrouvez alors à nouveau coincé dans une incompréhension du sujet, de ce qui est regroupé et pourquoi. Je n'ai pas vu d'exemples réussis sur Internet. Au fait, je voulais allouer des clusters au lieu de composants saisonniers, et j'ai oublié, j'ai commencé à mettre du MO... Uy... alors ce serait une étude différente.
Ça arrive, la logique n'a pas de patience pour les conneries )))) .... Il y a des problèmes de compréhension jusqu'à présent. Il n'y a que le moyennage, l'éclaircissement et l'AG avec apprentissage sur des données assez courtes. Je n'ai pas non plus vu de travaux sur la séparation des caractéristiques des séries. D'une part, l'analyse des séries pour différentes TF devrait être identique. Il devrait y avoir des critères pour passer à une TF inférieure. Par exemple, si des tendances avec un écart et une vitesse suffisants sont déterminées sur le TF inférieur, il est alors possible de s'y diriger contre la tendance du TF supérieur. Mais c'est de la logique. Nous devrions en quelque sorte regrouper les caractéristiques et examiner les différents comportements des séries. Si du contraire à résoudre.
À la centrale nucléaire, nous avons examiné 19 paramètres. Ils avaient un tableau de 3 à 7 paramètres lorsque la zone est rouge et que les barres doivent être retirées. Il n'y avait pas non plus un seul paramètre et ils n'étaient pas liés entre eux. La nôtre est différente bien sûr, mais l'échelle de temps est trop grande, et il n'y a pas, ou pas toujours, de lien entre le tic-tac et le comportement mensuel. En général, nous devrions examiner la relation entre les paramètres et la durée de cette relation.
Je ne passe pas devant un bombardier avec une tête nucléaire sans faire une blague :)
En général, l'idée est d'examiner une série de 120 barres et d'en tirer quelque chose dans différentes variantes. Il n'est pas bon de mesurer et de former sur les états actuels.
Que pouvez-vous faire sans eux, dans cette région sauvage)))). La merde nucléaire, c'est là que tout a commencé, calculatrice de probabilité avec moyennes, rétroaction et bayésienne, le critère de confiance, c'est quelque chose)). Apparemment, les mêmes paramètres devront d'abord être sélectionnés manuellement. Beaucoup d'entre eux aussi.
Quels sont les états actuels ? S'il s'agit de clusters, il suffit de balayer les statistiques sur les nouvelles données. S'ils sont identiques, vous pouvez construire CA.