L'auto-illusion du commerçant : la méfiance à l'égard de l'avant. - page 11

 
Yury Reshetov:

Ça s'appelle des cafards dans la tête. Alors parle pour toi, ne parle pas pour les autres. Si vous n'êtes pas au courant de quelque chose, cela ne veut pas dire que les autres n'en profitent pas. Voir, par exemple, le conseiller expert RNN.

Si un EA n'est pas rentable sur la moitié des avances (moitié backtest, moitié avance), alors vous devriez le jeter. N'importe quel imbécile réalisera un bénéfice sur les backtests en utilisant le tester GA.

Je ne comprends pas ce que je ne devine pas ? A propos d'une sorte d'EA ? Quel est le but de votre message ? Si vous voulez dire l'analyse à terme, l'image sur le lien est un seul et tel un conseiller expert, si ne vaut pas la peine de laisser tomber immédiatement, mais vaut la peine de vérifier sur de nombreuses bandes.
 

Youri Tarshecki:


Je ne vois presque jamais d'analyse de l'efficacité des stratégies et des systèmes basés sur la marche en avant.

Qu'est-ce que c'est ? Manque de tradition ou évitement des émotions désagréables ?

...

Je ne comprends pas ce que je ne devine pas ? Quel est le but de votre message ?

Voir Robert Pardo en PDF


Youri Tarshecki:
Si vous parlez d'analyse prospective, l'image sur le lien n'en est qu'une.

CodeBase n'est pas l'Hermitage ou même le Louvre pour y organiser l'exposition de Pinocchio.

Роберт Пардо в PDF - MQL4 форум
  • www.mql5.com
Роберт Пардо в PDF - MQL4 форум
 
Youri Tarshecki:
Je teste toutes les options. Maintenant, j'exécute 12 segments avec 12 avances et je regarde le résultat global. Si la majorité des avances ne sont pas satisfaisantes, cet EA ne doit pas être utilisé, il doit être retravaillé. En refaisant votre EA et en obtenant des informations sur les avances, vous pouvez comprendre si vous allez dans la bonne direction.

La division aléatoire de l'histoire entre le passé et le présent ne servira à rien.

Les valeurs aléatoires et même les clusters peuvent s'avérer être les meilleurs sur certaines pièces du backtest. C'est-à-dire un bon EA, mais lors du premier backtest, un ensemble aléatoire d'options s'est avéré être le meilleur et vous l'avez choisi pour la suite. En conséquence, il est mort sur le front)). Il en va de même pour les autres - plus on divise, moins les résultats sont statistiquement corrects. Il doit donc y avoir suffisamment de transactions sur chaque backtest et sur chaque forward pour que la validité statistique soit assurée. En fait, pour la plupart des systèmes, même intraday, cela signifie qu'ils devront être testés pendant au moins 20 ans avec vos fractionnements)). Et ils ne vivent généralement pas si longtemps. Et donc, on vous a écrit à juste titre que la meilleure solution serait de combiner les zones arrière en une seule et vous obtenez un ensemble moyen, mais plus fiable, d'ensembles. Et plus précisément des zones optimales pour chaque paramètre optimisé.

Vous n'avez pas le luxe de diviser l'histoire en 12 secteurs avec suffisamment de transactions pour obtenir des résultats statistiques fiables dans chacun d'eux. Et faire quelque chose avec des résultats non fiables est un coup de chance en conséquence.

 
Слава:

Diviser aléatoirement l'histoire entre le passé et le présent ne vous servira à rien.

Les valeurs aléatoires et même les clusters peuvent s'avérer être les meilleurs sur certaines pièces du backtest. C'est-à-dire un bon EA, mais lors du premier backtest, un ensemble aléatoire d'options s'est avéré être le meilleur et vous l'avez choisi pour la suite. En conséquence, il est mort sur le front)). Il en va de même pour les autres - plus on divise, moins les résultats sont statistiquement corrects. Il doit donc y avoir suffisamment de transactions sur chaque backtest et sur chaque forward pour que la validité statistique soit assurée. En fait, pour la plupart des systèmes, même intraday, cela signifie qu'ils devront être testés pendant au moins 20 ans avec vos fractionnements)). Et ils ne vivent généralement pas si longtemps. Et donc, on vous a écrit à juste titre que la meilleure solution serait de combiner les zones arrière en une seule et vous obtenez un ensemble moyen, mais plus fiable, d'ensembles. Et plus précisément les zones optimales pour chaque paramètre optimisé.

Vous n'avez pas le luxe de diviser l'histoire en 12 segments, où les transactions seront suffisantes pour que les résultats soient statistiquement corrects dans chacun d'eux. Et faire quelque chose avec des résultats statistiquement peu fiables est un coup de chance par conséquent.

Et comprenons ce qu'est la validité des statuts. Si vous pensez que plus la moyenne est grande, plus la validité est grande, alors pourquoi ne pas tester sur TOUTE l'histoire disponible - la moyenne sera absolue. Mais serait-il fiable ? Peu probable. Précisément parce que le marché évolue de manière statistiquement fiable et que vous ne pouvez jamais prédire si ce groupe particulier est une anomalie ou le début d'une nouvelle tendance. Ces deux propriétés du marché sont diamétralement opposées et nécessitent une solution dialectique, car l'une exige une augmentation du segment et l'autre une diminution.

Je résous ce problème de manière expérimentale. Dans mon cas particulier, il s'est avéré que la somme de 12 contrats à terme mensuels est supérieure à la somme de 4 contrats à terme de trois mois, qui sont à leur tour supérieurs aux contrats à terme d'un an, le nombre de pertes continues étant également meilleur.

Avez-vous testé vos proportions arrière-avant de manière expérimentale ? Sur quelle base pensez-vous que votre seuil est le plus optimal ?

 
Слава:

Le fait de diviser aléatoirement l'historique entre le passé et le futur ne sert à rien.

Les valeurs aléatoires et même les clusters peuvent s'avérer être les meilleurs sur certaines pièces du backtest. C'est-à-dire un bon EA, mais lors du premier backtest, un ensemble aléatoire d'options s'est avéré être le meilleur et vous l'avez choisi pour la suite. En conséquence, il est mort sur le front)). Il en va de même pour les autres - plus on divise, moins les résultats sont statistiquement corrects. Il doit donc y avoir suffisamment de transactions sur chaque backtest et sur chaque forward pour que la validité statistique soit assurée. En fait, pour la plupart des systèmes, même intraday, cela signifie qu'ils devront être testés pendant au moins 20 ans avec vos fractionnements)). Et ils ne vivent généralement pas si longtemps. Et donc, on vous a écrit à juste titre que la meilleure solution serait de combiner les zones arrière en une seule et vous obtenez un ensemble moyen, mais plus fiable, d'ensembles. Ou plus précisément des zones optimales pour chaque paramètre optimisé.

Il n'y a pas de luxe à diviser l'histoire en 12 zones avec suffisamment de transactions pour que les résultats soient statistiquement corrects pour chacune d'elles. Et faire quelque chose avec des résultats non fiables est un coup de chance en conséquence.

Je suis d'accord avec chaque mot. J'ajouterai que j'utilise l'indicateur R^2 calculé sur la stratégie d'équité obtenue pour identifier les zones les plus stables des paramètres de TC. De mon point de vue, le meilleur résultat est un résultat positif, un bon R^2 (supérieur à 0,8, 0,9) et un nombre statistiquement significatif de transactions. Dans ce cas, le bénéfice absolu n'est pas aussi important que le fait qu'il y ait eu des périodes de perte ou non. Toutes les bonnes stratégies échouent pendant certaines périodes. Il faut simplement que ces pertes s'inscrivent dans la tendance générale positive. Il est également important d'avoir sous la main une douzaine de stratégies, certes moyennes, mais stables (en termes de R^2), dont les moments défavorables ne se chevauchent pas les uns les autres avec une précision absolue (une corrélation totale est difficile à obtenir).
 
Youri Tarshecki:

Et comprenons ce qu'est la validité statistique. Si vous pensez que plus la moyenne est grande, plus la validité est grande, alors pourquoi ne pas tester sur TOUTE l'histoire disponible - la moyenne sera absolue. Mais serait-il fiable ? Peu probable. Précisément parce que le marché évolue de manière statistiquement fiable et que vous ne pouvez jamais prédire si ce groupe particulier est une anomalie ou le début d'une nouvelle tendance. Ces deux propriétés du marché sont diamétralement opposées et nécessitent une solution dialectique, car l'une exige une augmentation du segment et l'autre une diminution.

Le conseiller expert travaille pendant une certaine période - sa phase favorable, pour dire les choses crûment. C'est pourquoi il est insensé de prendre trop d'histoire ou du tout au hasard. Et votre méthode nécessite beaucoup plus de statistiques et de périodes de test. La tâche est donc de trouver un thème qui fonctionne le plus rapidement possible et en même temps d'éliminer l'adaptation, et la division de l'historique en fragments séparés, sur lesquels les décisions sont prises, conduit au fait que l'historique sur lequel le système a déjà travaillé serait très long (arguments sur la validité statistique dans le post précédent).

Youri Tarshecki:


Je résous ce problème de manière expérimentale. Dans mon cas particulier, il s'est avéré que la somme de 12 contrats à terme mensuels est supérieure à la somme de 4 contrats à terme de trois mois, qui sont à leur tour supérieurs aux contrats à terme d'un an, le nombre de pertes continues étant également meilleur.

Avez-vous testé vos proportions arrière-avant de manière expérimentale ? Sur quelle base pensez-vous que votre étirement est le plus optimal ?


Je l'aborde différemment) Je ne prends pas de proportions et je n'utilise pas de test avant. J'analyse la qualité du système par la qualité de l'équité.

Le système idéal est l'équité vers le haut). C'est-à-dire Mo=const et Dispersion(dispersion)=0. En réalité, les mo flottent et la variance n'est pas nulle non plus. En gros, l'oscillation se fait autour d'une ligne droite parfaite. Un bon système est celui qui présente une faible variance et une pente positive lorsqu'il est testé de manière fiable (le nombre de transactions étant un critère). Par exemple, PF le considère. C'est-à-dire qu'un système présentant un bon FP (et quelques autres caractéristiques numériques d'équité) fera l'objet d'un examen plus approfondi de sa stabilité lorsqu'il aura été testé de manière fiable. C'est déjà suffisant pour qu'il passe et vos indicateurs - décomposez-les et ils seront aussi de qualité)).

Et en général, vous devez comprendre ce que le système gagne et examiner chaque partie du système pour la durabilité séparément. Chaque option devrait faire l'objet d'une étude de stabilité distincte.

Et vous devez disposer d'un critère suffisamment non retardé pour l'arrêt du système, qui repose également sur la compréhension des composants du système et qui est crucial pour ses performances

 
Vasiliy Sokolov:
Je suis d'accord avec chaque mot. Je voudrais ajouter que pour identifier les zones les plus stables des paramètres TS, j'utilise l'indicateur R^2 calculé sur la stratégie d'équité obtenue. De mon point de vue, le meilleur résultat est un résultat positif, un bon R^2 (supérieur à 0,8, 0,9) et un nombre statistiquement significatif de transactions. Dans ce cas, le bénéfice absolu n'est pas aussi important que le fait qu'il y ait eu des périodes de perte ou non. Toutes les bonnes stratégies échouent pendant certaines périodes. Il faut simplement que ces pertes s'inscrivent dans la tendance générale positive. Il est également important d'avoir sous la main une douzaine de stratégies, certes moyennes, mais stables (en termes de R^2), dont les moments défavorables ne se chevauchent pas les uns les autres avec une précision absolue (une corrélation totale est difficile à obtenir).
Je suis d'accord) Sauf qu'avoir une douzaine de stratégies rentables non corrélées sous la main est réaliste).
 
Слава:

... fluctuant grossièrement autour d'une ligne droite parfaite. Un bon système est un système qui, lorsqu'il est testé de manière fiable (le nombre de transactions étant un critère), présente une faible variance et une pente positive. Par exemple, PF le considère.

J'ai essayé d'utiliser PF à l'époque mais le problème est qu'il dépend inversement (et très clairement) du nombre de trades, plus il y en a, moins il y a de PF. Le R^2 basé sur la variation nette des capitaux propres (les périodes d'inactivité du système de trading ne sont pas prises en compte) n'a pas cette caractéristique.

La gloire:

C'est-à-dire qu'un système avec un bon FP (et quelques autres caractéristiques numériques d'équité) sera soumis à des tests supplémentaires de stabilité lorsqu'il sera testé de manière fiable. C'est déjà suffisant pour qu'il passe et vos indicateurs - décomposez-les et ils seront aussi de qualité)).

Exactement. Vous pouvez prouver formellement cette affirmation : si TS a une ligne droite d'équité presque parfaite dirigée vers le haut, alors un segment arbitraire (en avant) de cette équité passera également la validation, car il aura aussi un résultat positif. D'autre part, le test prospectif trouvera l'ensemble des paramètres qui seront rentables sur toutes les parties de l'historique, donc il trouvera l'ensemble des paramètres, auxquels l'exécution du TS sur l'ensemble de l'historique donnera le résultat positif le plus stable et stable. Mais comme le même ensemble de paramètres sera obtenu lors de l'optimisation sur l'ensemble de l'échantillon, il n'est pas nécessaire de diviser l'échantillon en N parties arbitraires.

La gloire:

En général, nous devons comprendre ce que le système gagne et considérer chaque partie du système pour la stabilité séparément. Chaque option devrait faire l'objet d'une étude de stabilité distincte.

C'est difficile. C'est probablement le Saint-Graal du commerce. Nous échangeons la conséquence de la cause, qui reste presque toujours dans l'ombre. Par exemple, tous les TS de suivi de tendance ne fonctionnent pas dans un marché de tendance. Un TS peut afficher d'excellents résultats sur certains marchés et sur d'autres - sauf qu'il ne perd pas d'argent. Bien qu'il n'y ait pas de différences évidentes entre ces marchés, même en termes de tendance ou de toute autre statistique.

La gloire:

Et il est nécessaire de disposer d'un critère de déconnexion du système suffisamment non retardé, qui repose également sur la compréhension des composants du système et qui est déterminant pour sa capacité de fonctionnement.

Oui. C'est plus facile ici, car on peut formuler précisément ce que l'on veut voir : une ligne droite avec une pente positive. Si le TS a cessé de gagner de l'argent, ses fonds propres dépasseront tôt ou tard notre modèle d'attente et il devra être désactivé.

Mais le facteur principal ici est un facteur psychologique - accepter l'inévitable piétinement et même une certaine perte comme le comportement standard du TS dans le modèle choisi.

 
Vasiliy Sokolov:

C'est la partie délicate. C'est probablement le Saint Graal du commerce. Nous faisons du commerce en raison d'une cause qui reste presque toujours dans l'ombre. Par exemple, tous les TS de suivi de tendance ne fonctionnent pas dans un marché de tendance. Un TS peut afficher d'excellents résultats sur certains marchés et sur d'autres - sauf qu'il ne perd pas d'argent. Bien qu'il n'y ait pas de différence évidente entre ces marchés, même en termes de tendance ou de toute autre statistique.


il y a deux façons, comme toujours)) la déduction et l'induction. Le test est l'induction - nous trouvons un modèle à partir d'études statistiques. Il y a aussi la déduction - à partir de la compréhension de ce que nous gagnons (ou plutôt de ce que certaines personnes perdent ou gagnent moins) et de la recherche de la manière dont cela devrait se traduire par une stratégie qui l'utilise. Ces deux approches peuvent être combinées - l'induction donne des aperçus, la déduction clarifie. Ou vice versa))
 

Un peu plus sur R^2.

Pour moi, c'est un indicateur très puissant, mais pas suffisant. Dans la pratique, j'ai constaté que certains TSs peuvent produire de très bonnes et régulières remontées d'actions. Le R^2 est très élevé et leur jeu de paramètres peut faire craquer même les attaquants les plus sophistiqués. Voici un exemple d'un tel TS :


Son équité fait que l'on se positionne sur le marché, mais ce n'est pas si simple. Les TS adaptés ont une caractéristique remarquable: leur jeu de paramètres est presque toujours instable et tout léger changement de paramètres modifie le résultat de façon spectaculaire. Par exemple, une légère modification des règles de fermeture de ce TS conduit aux résultats suivants :

Vous pouvez voir qu'un petit changement a conduit à des résultats désastreux. Il est à noter qu'il n'y a que 2 paramètres d'optimisation dans ce TS. C'est au point qu'en fait on peut facilement obtenir l'ajustement en approximant seulement deux points, et le petit nombre de paramètres du TS n'indique pas son incapacité à s'ajuster. Par conséquent, une fois que l'ensemble optimal de paramètres est déterminé, il est nécessaire de déplacer les paramètres d'une certaine valeur dans l'espace d'optimisation multidimensionnel, et de voir les résultats des courses au voisinage du point optimal :

Si nous sommes dans une situation de paramètres stables, leur déplacement ne changera pas radicalement le comportement du TS. Il est important de comprendre que dans le trading réel, ce changement se produira. Dans l'histoire, nous déplaçons des paramètres TS sur un marché statique. Sur le marché réel, le marché va déplacer ses caractéristiques autour des paramètres précédemment trouvés et fixés par nous.

Raison: