L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2512

 
Aleksey Vyazmikin #:

Comment ça se fait ? Je pense la même chose à propos de la recherche dans une grille, donc je suis intéressé par une technique qui a déjà été mise en œuvre.

Parfois, comme une béquille, elle peut rapprocher une stratégie d'une espérance mathématique négative.

Je m'intéresse aux métriques, et parfois à l'évaluation d'un modèle non pas en fonction du profit, mais de la dynamique des prédictions de classe correctes. Il s'agit essentiellement du même équilibre, mais le changement est fixe. Le point est que la stratégie peut être influencée non seulement par la précision de la classification mais aussi par les fluctuations de la volatilité du marché, et nous devons examiner la dynamique de la précision de la classification sans expression monétaire.

Je viens de rassembler toutes mes cibles, attributs. Les variables de conception étaient les paramètres des attributs, la cible. J'ai formé un trio de 2 indicateurs + un indicateur cible et l'ai entraîné avec un katbust. Je les ai sélectionnés en utilisant la précision d'apprentissage maximale sur l'échantillon test. J'ai filtré les trios sélectionnés en fonction de la possibilité de la cible à donner des signaux adéquats pour le trading.

En conséquence, j'ai trouvé 5 trios de signes + la cible 1. Mais comme je l'ai déjà montré, une précision de prédiction de 93% pour une cible donnant un bon signal pour le trade n'est pas suffisante. D'ailleurs, j'ai essayé de m'entraîner avec des ensembles de données sur les trios trouvés, des réseaux de neurones entièrement connectés de configuration différente, la forêt aléatoire et j'ai obtenu +- la même précision d'entraînement sur un échantillon de test et les mêmes résultats de test.

Bonne idée, merci, je vais essayer de la terminer.

 
Aleksey Vyazmikin #:

Je négocie des minutes, un marché rapide, donc je sais qu'en une seconde le prix peut varier plus que ce que j'ai prévu mathématiquement.

Je ne sais pas comment on peut échanger des minutes... Il y a beaucoup de bruit, et en augmentant la fenêtre de calcul de la moyenne pour lisser le bruit, on obtient une image plus proche d'une période plus élevée.

Pouvez-vous nous donner un indice, quel est le sens du trading sur des échelles de temps de 1 minute ? Peut-être que je ne comprends pas quelque chose ?

 
iwelimorn #:

Bref, tout cela en vain, avec MO le marché ne peut être dupé.

On a trouvé les traits et la cible, dont la distribution des classes est présentée dans la première figure.

La précision des modèles katbust de test et d'entraînement formés à l'aide de cet ensemble de données était de 93 %.

La deuxième figure montre le graphique de la balance et des fonds propres du commerce cible :

La troisième figure montre le graphique du solde et de l'équité de la négociation sur les signaux du modèle katbusta formé :

Alors, mesdames et messieurs, dispersez-vous.

Le travail que vous faites est très proche de moi.

Pourriez-vous faire ce qui suit :

  • diviser chaque caractéristique en plusieurs vecteurs proportionnellement au nombre de classes, c'est-à-dire que s'il y a 2 classes, on obtient 2 vecteurs
  • dessiner un histogramme combiné des vecteurs qui appartiennent au même prédicteur sur le même axe dans la même figure.



 
Au fait, le boosting de gradient se comporte de manière erratique pour une raison quelconque. Probablement un surentraînement dû au fait d'essayer d'être parfait au détriment du renforcement.
 
SanSanych Fomenko #:
Au fait, le boosting de gradient se comporte de manière erratique pour une raison quelconque. Très probablement recyclé parce qu'il essayait d'être parfait au détriment de la stimulation.
Oui, ils se recyclent tous, nous avons une entrée presque aléatoire.
 
iwelimorn #:

Je viens de rassembler tous mes attributs de cible, de cible. Les variables de conception étaient les paramètres du trait, la cible. J'ai formé un trio de 2 attributs + un attribut cible et je les ai entraînés avec un catbust. Je les ai sélectionnés en utilisant la précision d'apprentissage maximale sur l'échantillon test. J'ai filtré les trios sélectionnés en fonction de la possibilité de la cible à donner des signaux adéquats pour le trading.

En conséquence, j'ai trouvé 5 trios de signes + la cible 1. Mais comme je l'ai déjà montré, une précision de prédiction de 93% pour une cible donnant un bon signal pour le trade n'est pas suffisante. A propos, j'ai essayé de former des réseaux neuronaux full-link de configuration différente par les trios trouvés, la forêt aléatoire et j'ai obtenu +- la même précision de formation sur un échantillon de test et les mêmes résultats de test.

Etes-vous sûr qu'il est correct d'entraîner différentes cibles dans le même échantillon ? Après tout, les signaux doivent être comparables, par exemple un renversement de tendance et l'entrée dans la tendance à partir d'une position plate suggèrent des ensembles d'indicateurs différents pour les prédicteurs.

Il y a des questions sur le catbust :

- Utilisez-vous seulement deux échantillons, n'utilisez-vous pas l'examen en une seule fois ?

- Combien d'arbres y a-t-il dans le modèle ?

- Utilisez-vous le halting pour apprendre à partir d'un échantillon de test ?

- quel est le taux d'apprentissage ?

- La classe 1 est-elle responsable de la direction de l'entrée, ou du signal avec une direction déjà définie ?

iwelimorn #:

Bonne idée, merci, je vais essayer de la finaliser.

Vous êtes les bienvenus :) Il est également utile d'examiner les bénéfices et la précision par distribution de probabilité.


iwelimorn #:

Je ne peux pas imaginer comment on peut travailler sur des minutes... L'augmentation de la fenêtre de calcul de la moyenne pour lisser le bruit donne une image proche d'une période plus élevée.

Pouvez-vous nous donner un indice, quel est le sens du trading sur des échelles de temps de 1 minute ? Peut-être que je ne comprends pas quelque chose ?

Je trade Si - tout se passe de manière assez technique là-bas, et il y a plus de signaux à apprendre.

En fait, j'utilise des informations provenant de plusieurs TF, de nombreux niveaux horizontaux dans les prédicteurs, et les minutes permettent simplement de réagir plus rapidement à un événement qui affecte le prix dans mon esprit.

 
SanSanych Fomenko #:
Au fait, le boosting de gradient se comporte de manière erratique pour une raison quelconque. Il est probable qu'il se surentraîne en essayant d'atteindre un idéal au détriment de la stimulation.

Je viens de faire une expérience sur ce sujet, pour l'instant avec un seul échantillon, mais le fait est que l'augmentation du taux d'apprentissage a un effet positif sur le résultat, car il y a plus de généralisation, ce qui, lorsqu'il n'y a pas de réponse correcte à toutes les questions et que l'échantillon n'est pas représentatif, est plus efficace que l'ajustement sur l'historique pour chaque exemple.

 
Aleksey Vyazmikin #:

Essentiellement, j'utilise les informations de plusieurs TF, beaucoup de niveaux horizontaux dans les prédicteurs,

Comment utilisez-vous les niveaux horizontaux ? La distance du prix actuel à la centaine, 500, 1000 la plus proche ?

 
elibrarius #:

Comment utilisez-vous les niveaux horizontaux ? Distance du prix à la centaine, 500, 1000 près ?

J'essaie de ne pas utiliser de points - j'utilise des pourcentages. Si j'ai une grille pour la journée (disons ATR), j'y mets les prédicteurs et le prix ouvert de la barre actuelle, afin de savoir où se trouve le prix par rapport au niveau, de préférence marquer les événements de franchissement de niveau, il y a combien de temps....

 
elibrarius #:
Ils sont tous surentraînés, nous sommes presque aléatoires sur l'entrée.

Lacovariance et la corrélation sont toujours là... (semble être aléatoire).

Si nous ne savons pas combien de composants de base il faut respecter dans la pratique, certaines règles empiriques s'appliquent.

Après tout, c'est seulement

Qu'est-ce que la modélisation prédictive ? La modélisation prédictive est un processus probabiliste qui nous permet de prévoir des résultats en fonction de certains prédicteurs. Ces prédicteurs sont essentiellement les fonctions qui entrent en jeu pour déterminer le résultat final, c'est-à-dire le résultat du modèle.

C'est une question de goût personnel quant aux prédicteurs et aux étiquettes que nous choisissons et à l'algorithme que nous utilisons... - si nous considérons initialement que le système est plus large que le Bull/Bear/Hold-on final ...

c'est pourquoi la description des possibilités de simulation par

Maxim Dmitrievsky

vaut toujours son pesant d'or !

1. La zone de recherche est d'abord définie : de manière empirique ou sur la base d'hypothèses, des tests statistiques sont effectués. Ensuite, un algorithme MO est sélectionné,

option 2.

2. Stratégie de recherche à travers n'importe quel classificateur, analyse de sa structure interne (importance des caractéristiques, valeurs de shap et différentes métriques).

- Seulement "dans l'espoir"..."par un certain polynôme"... + ramasser les transformations de données utiles (quel que soit le MO) est en effet un Art ... ! Ils ne peuvent pas être les mêmes lors de l'analyse de données (comme certains "gurels" ici) - au moins dans la programmation linéaire et quadratique les deux fonctions sont différentes et les résultats sont différents et leur interprétation !


Введение в уменьшение размерности | Портал информатики для гиков
  • 2019.12.30
  • espressocode.top
Машинное обучение. Как обсуждалось в этой статье , машинное обучение — это не что иное, как область обучения, которая позволяет компьютерам «учиться», как люди, без необходимости явного программирования. Что такое прогнозирующее моделирование: прогнозирующее моделирование — это вероятностный процесс, который позволяет нам прогнозировать...
Raison: