L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2066

 
Aleksey Vyazmikin:

Je ne sais pas comment expliquer :)

J'ai pris cette fonction

Essayez XOR
 
Aleksey Nikolayev:

La recherche de modèles intrajournaliers est entravée par les fluctuations de la volatilité intrajournalière. Nous devons nous débarrasser d'eux d'une manière ou d'une autre. Méthodes possibles :

1) Réajustement des incréments pour tenir compte de la volatilité intrajournalière.

2) Passez à un nouveau moment intraday, dans lequel la variance croît uniformément.

3) Utilisation d'un motif en zigzag. Les valeurs des genoux ne dépendent pas des fluctuations de la volatilité. Les tops temporels dépendent bien sûr de la volatilité (ils sont plus fréquents lorsque celle-ci est élevée), mais lorsqu'on passe à un temps uniforme, ces clusters disparaissent.

Le point 1 est-il suffisant ? Ou est-ce que le 2 doit aussi l'être ? Qu'est-ce que c'est ? Expliquer.
 
elibrarius:
C'est quoi une pré-analyse ? Vous saisissez les modèles et les comparez - avec et sans cette fonction.

Analyse des données au moyen d'un matstat, et dans un sens plus étroit, pour trouver des différences utiles entre le prix et le SB. La principale différence avec la MO est que les modèles sont formulés de manière explicite et avec un petit ensemble de paramètres.

 
elibrarius:
Essayez XOR

Je vais en essayer d'autres, peut-être plus tard. En général, je pense que nous devrions faire du clustering et tirer des clusters similaires une chaîne à la fois, sinon la qualité de l'apprentissage diminue de toute façon.

 
elibrarius:
Le point 1 est-il suffisant ? Ou est-ce que le 2 doit aussi l'être ? Qu'est-ce que c'est ? Expliquer.

Il est peut-être plus facile de l'expliquer par un exemple d'application.

Le point 1) est un test de l'hypothèse de persistance-antipersistance des fluctuations diurnes. Il s'agit d'une vérification de la tendance du prix à se maintenir ou vice versa - à changer de direction en fonction du moment de la journée. Pour cela, vous devez connaître la corrélation.

Points 2) et 3) - vérifier l'hypothèse selon laquelle les renversements de prix "se produisent à l'heure" et qu'il est préférable de le faire au "bon" moment.

Point 3) - recherche des moments plats (tendance) de l'heure du jour par l'étude de la distribution empirique des longueurs de zigzag.

 
Aleksey Nikolayev:

Il peut être plus facile de l'expliquer par un exemple d'application.

point 1) - tester l'hypothèse de la persistance-antipersistance des fluctuations diurnes. Il s'agit d'une vérification de la propension du prix à se maintenir ou vice versa - à changer de direction en fonction du moment de la journée. Pour cela, vous devez connaître la corrélation.

Points 2) et 3) - vérifier l'hypothèse selon laquelle les renversements de prix "se produisent à l'heure" et qu'il est préférable de le faire au "bon" moment.

Point 3) - recherche des moments plats (tendance) de l'heure du jour par l'étude de la distribution empirique des longueurs de zigzag.

Dans quelques mois, il est fait référence uniquement au jour du mois ou au jour de la semaine également. Par code uniquement au moment de la période étudiée.

 
Aleksey Vyazmikin:

Je vais en essayer d'autres, peut-être plus tard. En général, je pense qu'il est nécessaire de faire des regroupements et d'extraire une ligne de chaque groupe similaire, sinon la qualité de l'apprentissage diminue de toute façon.

Chaque feuille de l'arbre est un cluster. Et pas seulement en termes de nombre de caractéristiques, mais aussi en termes de meilleure séparation des classes.
 
elibrarius:
Chaque feuille de l'arbre est un cluster. Et pas seulement en termes de nombre de caractéristiques, mais aussi en termes de meilleure séparation des classes.

C'est correct, mais si on enlève ces chaînes, qui sont déjà beaucoup dans les feuilles, il y en aura un peu moins (classe "0"), et la qualité ne devrait pas baisser, tandis que les indicateurs relatifs pour "1" seront plus nombreux, et donc le modèle pourra tenir compte de ces options feuilles dans la recherche, ce qui statistiquement n'était pas fait correctement auparavant.

Une autre option consiste à supprimer les feuilles uniques, qui peuvent nuire à l'apprentissage.

 
Valeriy Yastremskiy:

Dans quelques mois, la référence est seulement au jour du mois ou au jour de la semaine, aussi. Par code, seulement le temps dans la période étudiée.

Pour les périodes de plus d'un jour, il y a le problème de séparer l'influence du contexte des nouvelles de la périodicité. Je ne comprends pas vraiment comment le problème peut être résolu.

 
Aleksey Nikolayev:

Pour les périodes de plus d'un jour, il y a le problème de séparer l'influence du contexte des nouvelles de la périodicité. Je ne vois pas vraiment comment on peut le résoudre.

Je comprends pour la journée, je suis d'accord. La question porte sur le jour de la semaine. Le temps dans la période de calcul de la moyenne, les jours, n'est pas lié au jour de la semaine initialement. Vous pouvez d'abord faire une liaison avec le jour de la semaine pour détecter la répétabilité intra-hebdomadaire, en tenant compte de l'heure de la journée. Vous avez un lien uniquement avec l'heure du jour du mois.

Raison: