L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1383

 
elibrarius:

Je n'applique pas la division (P[i] / P[0]), mais la soustraction (P[i] - P[0]), c'est-à-dire pas une variation de prix relative, mais absolue. J'élimine au préalable les valeurs aberrantes (1% en quantité de la plus grande et de la plus petite valeur).

Le fractionnement donne-t-il un avantage quelconque ? J'utilise actuellement une forêt qui ne nécessite pas de normalisation ni de mise à l'échelle.

Vous faites le déplacement mais pas la mise à l'échelle.
 
Yuriy Asaulenko:
Vous effectuez un déplacement, mais pas un changement d'échelle.
Oui. Les arbres/forêts n'ont pas besoin d'être redimensionnés non plus.


C'est-à-dire qu'il n'y a pas beaucoup d'avantages à diviser plutôt qu'à soustraire. Sauf dans le cas du logarithme, qui rendra les données plus proches d'une distribution normale, comme l'a dit Alexey Nikolaev. Mais dans ce cas, je ne vois pas non plus d'avantages - l'arbre fera des divisions non pas par un niveau, mais par un autre - c'est-à-dire qu'il s'adaptera à n'importe quelle distribution. L'arbre étant essentiellement une simple mémorisation.

 
Prenez le prix en pourcentage des 100 derniers prix. faux ?
 
Evgeniy Chumakov:
Prenez le prix en pourcentage des 100 derniers prix. faux ?
Ceci est similaire à la division
 

Le graphique doit être divisé verticalement en niveaux, en morceaux identiques ou non, et chaque morceau doit être nomrrmé dans un intervalle.

Le graphique doit être divisé en niveaux, en morceaux égaux ou peut-être pas égaux verticalement, et chaque morceau doit être normalisé à une fourchette, c'est-à-dire analogue aux niveaux de prix normaux. Si nous ne normalisons pas l'ensemble de la série ou la fenêtre glissante, nous perdrons à nouveau des informations très importantes.

Mais en divisant en niveaux, nous sommes confrontés à un autre problème - lorsque le prix se trouve dans les conditions limites ou si nous prenons un grand nombre de prix récents pour la formation, certains d'entre eux se trouvent sur un "niveau", les autres sur un autre. Je n'ai pas encore trouvé comment le faire.

Je pourrais avoir besoin de mettre en miroir les niveaux les uns par rapport aux autres afin de faciliter les transitions entre eux.

il est naturel que le graphique non converti soit toujours le plus informatif. Vous devez donc être très prudent lors de toute conversion - la qualité du modèle se dégradera proportionnellement à votre ignorance. D'où toutes les histoires sur l'erreur de 50 % qui est normale et autres absurdités, le modèle n'apprend tout simplement rien de ces "caractéristiques".

 

C'est quelque chose de compliqué, je ne sais pas pourquoi et je ne sais vraiment pas comment faire.

Yuri se débrouille bien avec des incréments simples aussi.

 

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

cela n'a aucun sens - chaque hotchain suivante contient la moitié de l'information utile de la précédente, c'est-à-dire qu'elles, 1 : sont fortement corrélées, 2 : la hotchain avec le plus grand retard contient toute la variance de la hotchain précédente, c'est-à-dire qu'elles ne donnent aucun incrément d'information

le résultat sera le suivant : l'importance du rendement avec le plus grand décalage sera la plus grande (plus de variance, plus de gain d'information), et ce rendement contient toute la variance des autres caractéristiques.

 
elibrarius:

Yuri se débrouille bien avec des augmentations simples aussi.

ce n'est pas possible parce que ça ne l'est jamais.

 
elibrarius:

Quelque chose que vous avez inventé est compliqué, on ne sait pas pourquoi et on ne sait vraiment pas comment le faire.

Imaginez la situation.

Le prix sur le marché reflète l'équilibre de l'offre et de la demande, principalement à différents moments historiques.

Vous vous en tenez à une section normalisée limitée de l'histoire en tant que caractéristique, qui ne reflète que la situation actuelle.

votre modèle fusionne différents moments historiques en un seul flux impersonnel normalisé (toutes les situations de marché sont assimilées les unes aux autres), qui ne contient plus aucune séquence historique ni aucun prix juste.

Vous vous retrouvez avec une pile de modèles normalisés identiques, qui se chevauchent lorsque l'on augmente la profondeur de l'historique, ce qui conduit à une erreur de 50/50. Vous n'apprenez rien au modèle et vous jetez les informations les plus importantes déjà pendant le prétraitement, parce que vous faites tout de manière incorrecte, c'est-à-dire en suivant des livres, conçus pour des tâches absolument différentes et décrivant des processus complètement différents.

Un devis n'est pas un signal, c'est un processus complètement différent et ne doit pas être traité de cette façon. Yuri est radiophysicien, par exemple, et n'a donc rien d'autre à faire.

Dans ce type de formation, on tient compte du temps, mais pas du prix. Le niveau de prix (supérieur/inférieur) sur le marché est encore plus important que le temps, car il reflète l'équilibre entre l'offre et la demande, lequel reflète toutes les informations de base du marché.
 
Maxim Dmitrievsky:

Imaginez la situation.

Le prix sur le marché reflète l'équilibre entre l'offre et la demande, le plus souvent à des moments historiques différents.

Vous vous en tenez à une section normalisée limitée de l'histoire en tant que caractéristique, qui ne reflète que la situation actuelle.

votre modèle fusionne différents moments historiques en un seul flux impersonnel normalisé (toutes les situations de marché sont assimilées les unes aux autres), qui ne contient plus aucune séquence historique ni aucun prix juste.

Vous vous retrouvez avec une pile de modèles normalisés identiques, qui se chevauchent lorsque l'on augmente la profondeur de l'historique, ce qui conduit à une erreur de 50/50. Vous n'apprenez rien au modèle et vous jetez les informations les plus importantes déjà pendant le prétraitement, parce que vous faites tout de manière incorrecte, c'est-à-dire en suivant des livres, conçus pour des tâches absolument différentes et décrivant des processus complètement différents.

Un devis n'est pas un signal, c'est un processus complètement différent et ne doit pas être traité de cette façon. Yuri est radiophysicien, par exemple, et n'a donc rien d'autre à faire.

Dans ce type de formation, vous tenez compte du temps, mais pas du prix. Le niveau de prix (supérieur/inférieur) sur le marché est encore plus important que le temps, car il reflète l'équilibre entre l'offre et la demande, lequel reflète toutes les informations de base du marché.

C'est dommage que vous ne puissiez pas donner un "j'aime".

Raison: