L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 414

 
elibrarius:

Pourquoi ne le sait-on pas ? Le nombre de clusters à partitionner est défini au démarrage comme une valeur d'entrée : K - nombre de clusters souhaité, K>=1

Supposons que j'aie divisé les données en 4 groupes, que dois-je faire avec eux ?


Je veux dire que je ne sais pas à l'avance quelle classe appartient à quoi dans l'échantillon... ce qu'il faut en faire après en termes de trading je ne sais pas, peut-être voir quels cas appartiennent aux signaux de vente et lesquels aux signaux d'achat, ce qui est plus, etc....
 
Aleksey Terentev:
Les paquets ML avec lesquels je me suis familiarisé permettent tous de changer la fonction d'activation de la couche.
En fait, si vous avez suffisamment de connaissances et si la bibliothèque le permet, vous pouvez hériter de la classe des neurones et y enregistrer votre fonction d'activation.
Mais ce sont des méthodes extrêmes.

J'avais envie d'écrire quelques-unes de mes couches récurrentes - heureusement que j'ai repris mes esprits. =)
 
Aleksey Terentev:
En fait, si vous avez suffisamment de connaissances et si la bibliothèque le permet, vous pouvez hériter de la classe des neurones et y écrire votre fonction d'activation.
Mais ce sont des méthodes extrêmes.

Un jour, j'ai voulu me lancer et écrire quelques-unes de mes couches récurrentes, mais c'est bien que je sois revenu à la raison. =)
Il y a juste une sélection initiale du type de réseau par type de sortie, pas besoin de réécrire quoi que ce soit (et toutes les couches internes sont câblées comme étant non linéaires)
 

Le softmax a divisé les signaux normalement, pas comme avant il y avait peu d'achats et peu de ventes, maintenant c'est égal. Mais il perd toujours de l'argent, je dois mieux travailler sur les prédicteurs et les cibles.


 
Les gars, à propos des deux sorties avec les probabilités. Je pense que vous avez tout à fait raison, acheter une sortie est 0,9 puis vendre une autre sortie est 0,1. Mais pourquoi nous en avons besoin est une question intéressante. Sur un graphique hors échantillon, les deux entrées donneront 0,9 ce qui est alors ????. Il est fort probable qu'il y ait une gigue dans les deux sens. Cela se produit également sur le marché en cas d'incertitude. Le marché ne sait pas où aller, et le signal est déjà apparu. Vous obtenez plus d'informations, comme on dit...
 
Voulez-vous que j'écrive un long billet sur la façon de reconnaître le marché complètement ?????. En tout cas une idée pour l'essayer, de plus ce serait plus rapide à faire en deux trois ordinateurs, pensez au calcul parallèle, je l'ai sur 3 cœurs...
 

Je me souviens de quelqu'un qui me grondait parce que je devais orienter mon modèle chaque matin pour pouvoir travailler avec lui à l'avenir. Voici comment mon modèle droit a fonctionné aujourd'hui. Mauvais, dites-vous, bien sûr que je vais vous le dire... Maintenant, mettez-le en miroir dans votre tête et commencez à trader à partir du troisième signal. Comment maintenant ????? Et vous dites que la méthode d'orientation est une connerie : .....

Et pas besoin de dorloter Mamie !!!! :-)))))

 

Très bien, maintenant que vous êtes sur le point, je vais vous dire une pensée sur la collecte de données pour le traitement. Il est vraiment difficile de former un modèle avec un haut niveau de généralisation sur une zone suffisamment grande, parce que le marché est un organisme vivant et bla, bla, bla. Plus la période d'apprentissage est longue, plus les performances du modèle sont mauvaises, mais plus elles sont longues. Objectif : Réaliser un modèle à long terme. Split ou méthode deux, cependant pour ceux qui utilisent un comité de deux réseaux.

Nous avons trois états "Oui", "Non" et "Ne sait pas" lorsque les grilles s'affichent dans des directions différentes.

Nous entraînons le réseau sur l'ensemble de la section, dans notre cas 452 entrées. Le réseau a appris cet ensemble à 55-60%, en supposant que les réponses "Ne sait pas" dans l'ensemble de formation étaient de 50%, donc 226 signaux que le réseau ne pouvait pas apprendre. OK, maintenant nous construisons un nouveau modèle UNIQUEMENT sur les états "Ne sait pas", c'est-à-dire que nous essayons de construire le modèle sur ces quasi-états qui ont trompé le premier modèle. Le résultat est à peu près le même : sur 226, seule la moitié sera reconnue, le reste obtiendra l'état "Ne sait pas", puis on construit à nouveau le modèle. le résultat est 113, puis 56, puis 28, puis 14. Pour les 14 entrées qui ne sont connues d'aucun des modèles précédents, l'optimiseur de Jprediction calcule généralement jusqu'à 100% de généralisabilité.

Le résultat est un "système de modèles" qui reconnaît l'ensemble du marché sur une période de trois mois.

Voici une autre façon, outre le "Contexte du jour", de diviser le marché en sous-espaces et d'effectuer un entraînement en obtenant exactement le "Système de motifs". Voici un exemple.....

 

Pour être honnête, j'ai fait la subdivision un peu différemment ici, mais l'essence reste la même.

Il y avait un fichier général de 288 lignes, je l'ai divisé en trois échantillons, le nombre d'enregistrements de l'échantillon de formation est spécifié dans la ligne Tootal patterns.

* Sensitivity of generalization abiliy: 74.07407407407408%
* Specificity of generalization ability: 70.96774193548387%
* Generalization ability: 72.41379310344827%
* TruePositives: 20
* FalsePositives: 7
* TrueNegatives: 22
* FalseNegatives: 9
* Total patterns in out of samples with statistics: 58

Le dernier :

* Sensitivity of generalization abiliy: 61.904761904761905%
* Specificity of generalization ability: 60.0%
* Generalization ability: 60.869565217391305%
* TruePositives: 39
* FalsePositives: 24
* TrueNegatives: 45
* FalseNegatives: 30
* Total patterns in out of samples with statistics: 138

Et le dernier.

* Sensitivity of generalization abiliy: 69.04761904761905%
* Specificity of generalization ability: 66.0%
* Generalization ability: 67.3913043478261%
* TruePositives: 29
* FalsePositives: 13
* TrueNegatives: 33
* FalseNegatives: 17
* Total patterns in out of samples with statistics: 92

Sans condition, chacun d'entre eux devrait gagner, mais faites attention au nombre total de donnes dans cette zone 54 pièces (stratégie de base). Et c'est ce qui s'est passé quand ils ont tous travaillé ensemble en même temps.


 
Il s'agit d'un site hors échantillon à partir de 05.29 sur 15 minutes. Il en est déjà à sa troisième semaine. Mais s'il ne gagne pas plus, alors c'est une somme dérisoire pour l'approche, mais je crois....... :-)
Raison: