L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3171
Le résultat sur les échantillons de test/examen changera-t-il de manière significative si le prix est sélectionné de manière aléatoire lors de la première itération ?
Je répondrai moi-même par l'affirmative.
J'ai sélectionné au hasard le premier segment quantique pour exclure le signal (chaîne) 1000 fois.
Voici quelques exemples de gifs, montrant comment le processus s'est déroulé avec différentes itérations aléatoires du premier quantum (il peut y avoir des feuilles).
Et voici des images statiques au moment de l'itération intermédiaire - différentes étapes de la sélection et de la randomisation.
Quelle conclusion peut-on tirer ?
1. Vous pouvez avoir de la chance et trouver au hasard un modèle qui fonctionne :)
2. sans réduire le nombre de modèles erronés, il est difficile de construire un modèle en utilisant uniquement le principe d'avidité.
3) Il faut développer des méthodes pour estimer la régularité observée dans un segment ou une feuille quantique.
4. Le caractère aléatoire ne prouve pas que l'on réussisse dans l'apprentissage automatique.
5. Un modèle logiquement valide est nécessaire pour réussir.
6. La réussite sur un échantillon de test ne signifie pas toujours la réussite sur un échantillon d'examen, et vice versa.
Quelles autres conclusions peut-on tirer ?
J'ai perdu de vue votre méthode de quantification au cours du fil de discussion, désolé, veuillez me le rappeler.
La quantification des séries temporelles est très importante, par exemple, en quantifiant un prix par la méthode renko, nous obtiendrons SB (au moins statistiquement pertinent), de sorte que l'expression "quantifiez-le, ne le quantifiez pas, vous obtiendrez toujours xxx" semble au moins sous-estimée, car s'il y a une quantification qui détruit l'information, il y a probablement une quantification qui extrait l'information. à condition qu'il y ait de l'information dans le flux de tiques, bien sûr (nous l'espérons ardemment, parce que l'application de la MO n'aurait pas de sens sinon).
Andrey Dik #:
en quantifiant le prix à l'aide de la méthode renko, nous obtenons le SB (au moins statistiquement pertinent)
Je pense qu'il n'y a pas plus de SB que de simples barres.
Je ne pense pas qu'il y ait plus de SB que de simples bars.
Je pense à un SB beaucoup plus important, car les statistiques sur les barres sont très différentes des performances du SB.
Je ne pense pas que quelqu'un ici ait encore exploré le tiki avec MO.
A haute voix, peut-être pas, du moins pas en quantifiant la série.
Il semble prometteur d'agir "par la méthode contraire", c'est-à-dire de rechercher non pas des régularités, mais des états de la série de prix (tick) (je ne veux pas utiliser "série temporelle"), qui ne sont jamais réalisables et ne se produisent pas dans l'histoire.
Cela permettra d'utiliser des conditions limites pour élaborer une stratégie favorable aux traders.
J'ai oublié au cours du fil de discussion, pardon, la méthode de votre quantification, merci de me la rappeler.
Le concept de "seuil quantifié" est simple : il s'agit de la plage du prédicteur, qui a une valeur numérique sur chaque ligne de l'échantillon. Tout ce qui se trouve dans la plage devient une unité.
Les méthodes de partitionnement en plages peuvent être différentes, et j'utilise à la fois des variantes intégrées dans CatBoost (dans bousting souvent utilisé à la fois pour réduire la RAM requise et la dimensionnalité), et certaines de mes propres méthodes, par exemple, différentes séquences numériques.
Après avoir divisé le prédicteur en plages en utilisant la grille obtenue d'une manière ou d'une autre, chaque segment est pris à son tour et évalué en fonction de la valeur de l'information qu'il contient.
Une variation de la probabilité d'appartenance à une classe de 5 % ou plus par rapport à la valeur moyenne de l'échantillon est considérée comme une information précieuse, de même que le nombre de signaux et leur répartition dans l'échantillon sont pris en compte.
Si l'échantillon a une cible binaire, nous obtenons deux groupes de segments quantiques, dans lesquels la probabilité d'atteindre 0 ou 1 est décalée en conséquence.
Nous créons un nouvel échantillon, dans lequel chaque segment quantique a sa propre colonne - s'il y a un signal dans la plage, nous mettons "1", s'il n'y en a pas, nous mettons "0".
Selon l'IMHO, cela ressemble à du pi-hacking, dont Maxim a parlé récemment. À moins que des tests statistiques ne soient utilisés pour déterminer l'importance des quanta alloués, il s'agit bien de lui.
J'ai donné une fois un exemple simple où la meilleure heure de la semaine pour le trading était sélectionnée sur SB (alors qu'elle n'existe manifestement pas). Il n'y avait que 5*24=120 variantes, mais il suffisait qu'une telle heure soit toujours trouvée (l'intervalle de temps était d'une demi-année, je crois). Il y a là aussi une "stabilité de l'échantillonnage".
Il semble prometteur d'agir "par la méthode contraire", c'est-à-dire de rechercher non pas des régularités, mais des états de la série de prix (tick) (je ne veux pas utiliser "série temporelle"), qui ne sont jamais réalisables et ne se produisent pas dans l'histoire.
Cela permettra d'utiliser les conditions limites pour élaborer une stratégie favorable aux traders.