L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2586

 
mytarmailS #:

))))

Je suis sorti)

Je vais vous donner un indice : en termes de généralisation, rien ne change
 
Maxim Dmitrievsky #:
Logloss montre la quantité d'information mutuelle entre les traits et la cible, d'après ce que je comprends. C'est le f-i le plus objectif, sans décrire la forme de la dépendance. Le modèle est formé pour minimiser la perte de ces informations, en particulier le boosting fonctionne de cette façon. Ce que vous ajoutez à la coutume s'arrête à la formation.

Il semble que le logloss soit dérivé sur la base du principe du maximum de vraisemblance pour une distribution binomiale. En matstat, le principe du maximum de vraisemblance est étendu et généralisé sous la forme de M-estimations, qui peuvent constituer une justification théorique des expériences (mais pas une garantie de leur succès, bien sûr).

 
Aleksey Nikolayev #:

Comme le logloss est dérivé du principe du maximum de vraisemblance pour une distribution binomiale. Dans le matstat, le principe du maximum de vraisemblance est étendu et généralisé sous la forme de M-estimations, qui peuvent constituer une justification théorique des expériences (mais pas une garantie de leur succès, bien sûr).

Confondu avec l'entropie croisée probablement, mais il est plus souvent utilisé pour le multiclasse. En tout cas, je ne vois pas de problème à faire une estimation supplémentaire par le biais d'une quelconque fonction f, mais uniquement à partir du graphique d'équilibre.
 
Maxim Dmitrievsky #:
Confondu avec l'entropie croisée probablement, mais il est plus souvent utilisé pour le multiclasse.

Il semble que la valeur théorique de la perte de logarithme minimale coïncide avec l'entropie.

Maxim Dmitrievsky #:
De toute façon, je ne vois pas de problème à faire une estimation supplémentaire via une fonction f quelconque, mais purement à partir du graphique d'équilibre.

Je suppose que oui. Seulement dérouté par l'absence d'un grand nombre d'articles sur le sujet) Probablement effrayé de révéler des endroits louches)

 
Aleksey Nikolayev #:

Il semble qu'il y ait là quelque chose que la valeur théorique du minimum de la perte de logarithme coïncide avec l'entropie.

Je suppose que oui. Seul le manque d'un grand nombre d'articles sur le sujet dérange) Probablement, ils ont peur de révéler des endroits louches)

Le Prado a de nombreux articles intéressants sur le sujet. Je l'ai mis dans un long tiroir, mais je serais heureux de le lire plus tard. L'un des auteurs les plus sensés)
 
Maxim Dmitrievsky #:
Prado a beaucoup de choses intéressantes sur ce sujet, ses articles sont sur le site web. Je l'ai mis dans un long tiroir, mais j'aimerais le lire plus tard. L'un des auteurs les plus sensés).

Oui, je devrais jeter un coup d'oeil à ses articles. Il en a quand même un certain nombre).

En ce qui concerne votre idée de combiner les métriques standard et personnalisées, je me suis souvenu d'une idée avec un arbre, où il est construit par l'entropie croisée et élagué par la fréquence des erreurs. Je suppose que vous pourriez essayer d'utiliser votre propre métrique au lieu de la fréquence.

 
Renat Fatkhullin #:
Pouvez-vous partager l'information ?
1) Utilisez-vous la bibliothèque python de MT5 ?
2) L'utilisez-vous en dehors ou à l'intérieur de MT5 ?
3) Quelles sont les caractéristiques qui manquent à la bibliothèque ? Accès aux indicateurs ?

Nous préparons une mise à jour de MQL5 en ajoutant des opérations matricielles rapides. Cela permettra d'effectuer des calculs massifs.

En outre, nous développerons des connecteurs pour les progiciels d'analyse et mettrons en œuvre l'intégration standard WinML.

1. parfois.

2. Intérieur, extérieur.

3.

3.1 Souscriptions d'événements. Les mêmes événements que dans MQL5 déclenchés par certaines méthodes du gestionnaire.

La possibilité d'écrire des stratégies en Python (comme un type d'application) qui peuvent être testées dans le backtester.

Quelques mécanismes d'interaction MQL5-Python prêts à l'emploi. Python peut interagir avec mt5 dans les deux sens, MQL5 peut interagir avec lui dans les deux sens, MQL5 est une unité avec le terminal et est très bien en

avec des fonctions commerciales et similaires, mais ne sait pas comment travailler confortablement avec les meilleures solutions de détection de données du secteur. Python est la norme industrielle en matière de données - pandas, numpy, TensorFlow, Keras, PyTorch, etc., mais l'intégration du "commerçant" dans la plateforme est beaucoup moins importante. Ce serait cool d'avoir des moyens standard d'intégration de ces deux pouvoirs - quelque chose comme vous accrochez un script Python dans mt5, et le script a un modèle en attente, sous la vapeur, ou un pool de modèles, des fonctions traitant du pré-traitement des données, etc. Le script dispose d'une application et d'une stratégie MQL5, qui fait son travail, et appelle la fonctionnalité ML de ce script lorsque cela est nécessaire - rapidement et sans béquilles.

 

Quelqu'un utilise-t-il le paquet P pour le backtest de la stratégie Quantstrat ?

Comment est-il en termes de vitesse ?

 
Aleksey Nikolayev #:

Honnêtement, je ne comprends pas grand-chose. La question est de savoir si la probabilité change avec le temps. Pour étudier cela, on peut simplement construire une régression logistique sur le temps (et vérifier la signification de la différence entre le coefficient et le zéro).

Si d'autres facteurs affectant la probabilité sont étudiés en plus du temps, ils peuvent également être ajoutés à la régression logistique.

elibrarius #:

Ou peut-être est-il plus facile de créer un autre prédicteur - la distance entre la ligne de données et la ligne actuelle. Forest peut calculer elle-même que les données datant de plus de 8 mois sont mauvaises pour la prévision actuelle. Et il y aurait une division simple : avant 8 mois (avec de meilleures feuilles) et après 8 mois avec de moins bonnes feuilles.
Sur un plateau, ils apprennent tous bien, bien sûr. Lors du test/de la validation croisée, nous devons vérifier. Mais comment ? Ce n'est pas clair. Il ne s'agit même pas de la signification du prédicteur, mais de la signification de la division.

Aujourd'hui, j'ai ajouté un tel prédicteur de la distance par rapport à la barre actuelle. Il peut s'agir d'un nombre ou simplement d'une heure. J'ai pris le temps.

L'expérience a montré que la longueur de l'historique pour l'ensemble de données d'entraînement de 1 mois, donne le meilleur résultat.

L'hypothèse selon laquelle l'ajout d'un prédicteur de distance à partir de la première ligne de données serait utile était fausse. En pratique, l'avance ne s'est détériorée qu'avec 1 mois de données, puis avec 2, et enfin avec 10.

Supposons que vous ayez deux mois de données, que l'arbre ait trouvé la division d'un mois et qu'une de ses branches se soit entraînée sur les mêmes données que la longueur d'un mois choisie expérimentalement. L'autre mois s'est également entraîné sur ses propres données. Et il a bien appris, pas mal (comme je l'ai suggéré au début). Ce sera mauvais pour l'attaquant, et il ne fera qu'apprendre sur le plateau. En conséquence, le modèle fait la moyenne des résultats pour les deux mois et l'anticipation est moins bonne que s'il n'avait été entraîné que pour un seul mois.

Conclusion : Vous ne pouvez pas appliquer l'heure globale ou le numéro de ligne. Les variantes cycliques de l'heure : jour de la semaine, heure, minute sont utiles, mais il faut les vérifier.
Pour chaque cible (et/ou ensemble de prédicteurs), la durée de l'historique pour la formation devra être ajustée/optimisée.

 

Coché "Les options de temps cyclique : jour de la semaine, heure, numéro de minute peuvent être utiles - à vérifier".

Les minutes n'ont pratiquement aucun effet, les changements ne dépassant pas 0,5 %
Les heures et les jours de la semaine ont un effet. Des changements d'environ 3 à 5 %.

Je construis 2 modèles en même temps : 1 pour l'achat, 2 pour la vente.
Les modèles d'achat fonctionnent mieux sans le temps de 4 à 5 % et les modèles de vente fonctionnent mieux avec le temps de ces mêmes 4 à 5 %. Comme 5% vendent selon le calendrier et achètent selon d'autres principes.

Raison: