L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 257

 

Je suis un peu confus.

Il y a un prix à payer. Je prends les 200 dernières barres, j'essaie d'entraîner un modèle sur celles-ci pour deux classes (achat/vente). Je peux entraîner n'importe quoi, même une forêt, même un neurone, mais cela ne servira à rien, car si nous imaginons tous les exemples d'entraînement comme des points dans un espace à 200 dimensions, alors les deux classes sont mélangées de manière égale et les tentatives de les séparer avec des hyperplans ne sont pas assez précises.

Maintenant, une meilleure option - toutes sortes de fonds spéculatifs créent de nouveaux prédicteurs (indicateurs, clusters, certaines formules et autres) basés sur le prix. Et sur ces nouveaux prédicteurs, ils entraînent le même modèle que dans le premier point, mais dans ce cas, ils coupent le chou.

Ainsi, dans le second cas, aucune nouvelle information n'est formée et ajoutée à cet endroit, ce sont tous les mêmes points dans un espace à 200 dimensions, qui ont été déplacés dans un espace plus petit. C'est-à-dire une réduction dimensionnelle si particulière, rapprochant les points de la même classe les uns des autres dans l'espace. Mais les modèles d'apprentissage automatique font aussi cela, ils utilisent aussi leurs algorithmes pour réduire la dimensionnalité et rapprocher les classes. Quelle est la différence entre ces deux méthodes ?

Si l'on approxime des points dans l'espace de manière semi-automatique, avec différentes astuces, puis que l'on entraîne le modèle, alors cela fonctionne. Mais si vous faites confiance au modèle lui-même pour travailler avec l'espace original, alors il échoue ? Il s'agit d'opérations similaires dans les deux cas.

 
Dr. Trader:

Maintenant une meilleure option - toutes sortes de fonds spéculatifs créent de nouveaux prédicteurs (indicateurs, clusters, certaines formules, et n'importe quoi d'autre) basés sur le prix. Et sur ces nouveaux prédicteurs, ils entraînent le même modèle que dans le premier point, mais dans ce cas, ils coupent le chou.

...

Pourquoi, si vous approchez des points dans l'espace de manière semi-automatique, avec diverses astuces, puis en enseignant le modèle, alors cela fonctionne. Et si vous faites confiance au modèle pour travailler avec l'espace original lui-même, il échoue ? Ce sont des opérations similaires dans les deux cas, n'est-ce pas ?

Ne tenez-vous pas compte du fait que les grands acteurs du marché font bouger les prix ?
 
Dr. Trader:

Je suis un peu confus.

Il y a un prix à payer. Je prends les 200 dernières barres, j'essaie d'entraîner un modèle sur celles-ci pour deux classes (achat/vente). Je peux entraîner n'importe quoi, même une forêt, même un neurone, mais cela ne servira à rien, car si nous imaginons tous les exemples d'entraînement comme des points dans un espace à 200 dimensions, les deux classes y sont mélangées de manière égale et les tentatives de les séparer avec des hyperplans ne sont pas assez précises.

Maintenant, une meilleure option - toutes sortes de fonds spéculatifs créent de nouveaux prédicteurs (indicateurs, clusters, certaines formules et autres) basés sur le prix. Et sur ces nouveaux prédicteurs, ils entraînent le même modèle que dans le premier point, mais dans ce cas, ils coupent le chou.

Ainsi, dans le second cas, aucune nouvelle information n'est formée et ajoutée à cet endroit, ce sont tous les mêmes points dans un espace à 200 dimensions, qui ont été déplacés dans un espace plus petit. C'est-à-dire une réduction dimensionnelle si particulière, rapprochant les points de la même classe les uns des autres dans l'espace. Mais les modèles d'apprentissage automatique font aussi cela, ils utilisent également leurs algorithmes pour réduire la dimensionnalité et rapprocher les classes. Quelle est la différence entre ces deux méthodes ?

Si l'on approxime des points dans l'espace de manière semi-automatique, avec différentes astuces, puis que l'on entraîne le modèle, alors cela fonctionne. Mais si vous faites confiance au modèle lui-même pour travailler avec l'espace original, alors il échoue ? Ce sont des opérations similaires dans les deux cas, après tout.

Pourquoi avons-nous besoin du modèle en principe ?

Pourquoi avons-nous besoin de filtres différents en ingénierie radio, et en économétrie aussi ? Lissage et ainsi de suite....

Les statistiques sont une science très sournoise - vous pouvez facilement vous laisser entraîner dans un jeu de chiffres. A tout moment.

Si vous avez défini une variable cible, vous devez faire correspondre les prédicteurs à cette variable cible, pas n'importe quels prédicteurs, mais seulement ceux qui sont DEFINITIVEMENT pertinents pour cette variable cible. Regardez toujours le prédicteur et essayez de répondre à la question suivante : "quelle propriété, quel trait de caractère ce prédicteur reflète-t-il dans ma variable cible ? Et de toute façon : qu'est-ce que le prédicteur a à voir avec les marchés financiers ?

Par exemple, le RSI : semble refléter les marchés surachetés/survendus. Il s'agit clairement d'inversions. Et ainsi de suite.

Ou rappelons-nous de Burnakoff (si j'ai bien compris, l'homme a été chassé du site par les inondations) : les incréments avec des décalages assez importants sont un indicateur de la périodicité.

Et d'une manière générale, il faut formuler un modèle général et verbal du marché financier.

Celui de Hindiman (paquet de prévisions), par exemple. Selon lui, le marché se compose de :

  • trois variétés de tendances
  • trois types de bruit
  • La cyclicité, qu'il a une période constante, ce qui est cohérent avec les données de production, comme la production agricole.
Ce n'est probablement pas la seule approche possible. Mais c'est une certitude, pas un bruit

Avec cette approche, vous cocherez le marc de café, les anneaux de Saturne (voir liste des astrologues)...

N'oubliez pas non plus le fléau des données financières, appelé "non stationnarité".

N'oubliez pas non plus que les modèles pour les marchés financiers se révèlent presque toujours surentraînés.

Avons-nous tous gagné ? Fumons du bambou...

 
Dr. Trader:

Je suis un peu confus.

1) peut-être juste parce que les fondations ne font pas ça ?

2) vous devez comprendre ce qu'est le marché, même si c'est à votre manière...

3) vous devez savoir clairement de qui et pourquoi vous devez prendre de l'argent, vous devez avoir votre propre idée spécifique.

4) Tout le MO et ainsi de suite... il s'agit juste d'une boîte à outils pour décrire votre idée spécifique, mais pas l'idée elle-même, et c'est ainsi que la plupart des gens de cette branche pensent que le MO va l'inventer tout seul

Même si cela peut paraître pompeux, j'ai réussi à faire des prévisions de marché plus ou moins adéquates et j'ai un algorithme assez compliqué, il faut environ 6 minutes pour calculer une bougie, mais certains éléments de base seront réécrits en C++.

Et le résultat calculé par cet algorithme complexe doit être analysé avec mes yeux, il s'avère que ce n'est pas automatique mais semi-automatique, mais dans un avenir proche, je vais essayer de remplacer mon analyse visuelle par une MO pour la reconnaissance des formes, d'ailleurs, elle reconnaît très bien la MO contrairement à la prévision.J'ai utilisé mes yeux pour regarder chaque sortie et dire : "Ceci je considère un signal d'achat et ceci je ne considère pas un signal", j'ai créé la cible en fonction de ma vision, c'était une expérience, parce que je n'ai pas encore fait beaucoup de données avec la cible... J'avais 100 échantillons entraînés et 50 contrôles et j'ai entraîné un Forest normal et qu'en pensez-vous ? Forest a reconnu 90% du nouvel échantillon.

 

Bonjour, Task :

- Il existe un tableau de valeurs X,Y,Z ;

- Prenons une tranche - par X de 1 à 1000 sur n-ième Y :

-Il y a des points de minima et de maxima. Si nous coupons par X, alors toutes les valeurs >1 sont importantes.

De quel côté regarder pour recréer le calcul du type de poids par rapport aux axes.

C'est-à-dire commencer à mesurer l'objet.

Si un signal a été reçu sur la cellule x-55 y-163, la tâche consiste à déterminer la valeur (le poids) du point par rapport aux axes X et Y (éventuellement le long de la diagonale), pour sentir la position du point sur l'objet.

Je pense que vous devez vous tourner vers les principales caractéristiques statistiques, la dispersion, les médianes, le mode, l'asymétrie.

En général, il est nécessaire de commencer à mesurer l'objet d'une certaine manière, chaque unité par rapport à l'autre, et aussi que dans les valeurs d'un point sur l'objet, la présence d'autres objets soit prise en compte.

Dossiers :
eiova.jpg  382 kb
1.jpg  320 kb
 
Top2n:

Bon moment, Task :

Peux-tu rester simple, je ne sais pas ce que tu essaies de faire.
 
SanSanych Fomenko:


Merci, je comprends quelque chose.

Les modèles se contentent essentiellement de diviser de manière optimale l'espace des prédicteurs en deux sous-espaces - classe-achat et classe-vente.
Si nous commençons à créer de nouveaux prédicteurs de façon aléatoire et pendant une longue période, nous pouvons aider un peu le modèle, faire une partie de son travail nous-mêmes. Mais il n'est pas nécessaire d'améliorer la stabilité et la prévisibilité, cela peut simplement aider le modèle à faire son travail en moins d'itérations, et il n'y a pas vraiment autant d'utilité dans cette opération que nous le souhaiterions.

Mais les opérations que vous avez mentionnées - nettoyage du bruit, lissage, établissement de tendances, etc. - ne consistent pas seulement à créer des prédicteurs adaptés aux modèles. Il s'agit de la création de prédicteurs qui décrivent en quelque sorte les processus internes du marché.
J'ai examiné différentes anciennes stratégies de travail, elles ont toujours certaines constantes - si MA, alors 21, si RSI, alors 14. Toutes ces constantes et les indicateurs construits avec elles n'aident pas seulement le modèle à classifier plus facilement les données, mais ont aussi certaines propriétés décrivant les processus internes du marché. De plus, les différentes constantes dans les formules des prédicteurs constituent de nouvelles données, nous ajoutons donc de nouvelles informations aux données originales.

Il s'avère que si nous commençons à générer de nouveaux prédicteurs de manière irréfléchie, ils aideront simplement le modèle à obtenir une meilleure précision lors de la formation, mais ils ne contribueront pas à décrire les processus au sein du marché, et donc les prédictions avec eux ne sont pas fiables. Il faut donc les générer avec beaucoup de réflexion, je suis d'accord :)

Et, pour moi, il y a une nouvelle propriété intéressante des prédicteurs - la description des processus internes des données originales.
En d'autres termes, si j'ai, par exemple, une douzaine de prédicteurs qui peuvent facilement reconstruire des centaines de barres de prix, alors ils contiennent manifestement les propriétés nécessaires du marché et le modèle construit sur eux devrait être meilleur.

 
Top2n:


J'ai probablement mal compris ce dont vous avez besoin, mais je prendrais un certain rayon, disons 4, et pour chaque point, je trouverais la valeur moyenne dans ce rayon.
C'est-à-dire que si X=BC, Y=158, Z=1, alors vous pouvez trouver la valeur moyenne de tous les points dans ce rayon R=4. Ce serait le poids moyen du point (BC,158,1) et de son voisinage. Faites cela pour tous les points du tableau, et vous obtenez un nouveau tableau, où plus le nombre est élevé, plus il y a de signaux à proximité du tableau d'origine.
Ensuite, nous pouvons la projeter sur un axe quelconque (en éliminant la coordonnée Z, en additionnant toutes les cellules X et Y pertinentes, qui ont une coordonnée Z différente). Ensuite, éliminez également Y par lui-même et additionnez toutes les cellules par X.

Dossiers :
w5rtduyghjbn.png  388 kb
 
Dr. Trader:


Il s'avère que si vous commencez à générer de nouveaux prédicteurs de manière irréfléchie, ils aideront simplement le modèle à obtenir une meilleure précision lors de la formation, mais ils ne contribueront pas à décrire les processus au sein du marché, et les prédictions qui en découlent ne sont donc pas fiables. Il faut donc les générer avec beaucoup de réflexion, je suis d'accord :)


Pourtant, le four sur lequel on peut danser est une description verbale et intuitive du marché.

Je me suis mis à penser que sur les marchés financiers, cette description intuitive est donnée par ZZ. Si vous le regardez :

  • des tendances peuvent être observées
  • vous pouvez voir le bruit comme une déviation des lignes droites
  • vous pouvez voir la périodicité

Il me semble que tous nos problèmes résident dans cette périodicité, qui varie de façon chaotique sur les deux axes. C'est avec ça qu'on est coincé. Si nous apprenons au moins d'une manière ou d'une autre à gérer cette non-stationnarité, le reste est plus facile.

 
SanSanych Fomenko:

Quoi qu'il en soit, le four sur lequel il faut danser est une certaine description verbale et intuitive du marché.

J'ai longtemps entretenu l'idée que sur les marchés financiers, cette description intuitive est donnée par ZZ. Si vous le regardez :

  • des tendances peuvent être observées
  • le bruit est vu comme une déviation des lignes droites
  • vous pouvez voir la périodicité

Il me semble que tous nos problèmes résident dans cette périodicité, qui varie de façon chaotique sur les deux axes. C'est avec ça qu'on est coincé. Si nous apprenons à gérer au moins d'une manière ou d'une autre cette non-stationnarité, le reste est plus facile.

Ne jugez pas strictement et ne demandez pas ce que je veux dire, mais peut-être qu'un générateur de bruit blanc peut vous aider. A propos, si quelqu'un le peut, veuillez partager votre expérience avec les transformées de Fourier_Laplace_Z.
Raison: