L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 804

 
Yuriy Asaulenko:

Ne soyez pas triste, j'en suis conscient.) Cependant, si vous vous sentez plus à l'aise, vous pouvez continuer.

Mais tu as raison.

 
Aleksey Vyazmikin:
Dites-moi s'il vous plaît, est-il suffisant de rechercher la corrélation avec les données cibles au stade initial, si oui, quel seuil de corrélation doit être utilisé ?
La corrélation est une méthode linéaire. S'il y en a un, il ne sert à rien de faire un potager à partir de NS. La régression linéaire est suffisante.
 
Grigoriy Chaunin:
La corrélation est une méthode linéaire. S'il est présent, il ne sert à rien de faire un potager avec le NS. La régression linéaire est suffisante.

Merci pour votre réponse.

Que diriez-vous d'appliquer la régression linéaire pour identifier les relations les plus robustes, en ajoutant des caractéristiques supplémentaires ?

 
Je ne comprends pas la question. Cependant, la régression linéaire ne fonctionne pas sur les marchés financiers.
 

J'y pense depuis un moment maintenant ..... en fait.

Nous avons une matrice dix par dix, que pouvons-nous en dire ?

La quantité de données est de 100.

Nous pouvons ensuite calculer la quantité d'informations contenues dans ces données, qui sera également exprimée en unités. Qu'est-ce que cet ensemble de données contient d'autre, à part la quantité de données et la quantité d'informations ????. Je ne vais pas perdre mon temps à répondre. La quantité de connaissances. Tout cela est naturel par rapport à l'objectif. Ainsi, si nous examinons la relation de cause à effet, nous obtenons le modèle suivant.

Quantité de connaissances -> Quantité de données -> Quantité d'informations.

Pour prédire, il est donc nécessaire de trouver la CONNAISSANCE d'une valeur requise à partir d'un ensemble de données, plutôt que la quantité d'informations.

La connaissance elle-même est une chose très fragile qui peut être perdue par une conversion de données mal faite. Une modification négligente, même d'un petit montant dans un enregistrement, peut réduire considérablement le montant, voire le supprimer complètement.

C'est pourquoi il n'est pas recommandé de rendre les données d'entrée plus complexes avec des conversions. Plus la transformation est complexe, moins il reste de connaissances dans le résultat final.

Alors... Il suffit de penser à haute voix sur la question, certaines personnes ne le comprendront pas et continueront leur chemin sans atteindre la station finale.....

 
Mihail Marchukajtes:

J'y pense depuis un moment maintenant ..... en fait.

Nous avons une matrice dix par dix, que pouvons-nous en dire ?

La quantité de données est de 100.

Nous pouvons ensuite calculer la quantité d'informations contenues dans ces données, qui sera également exprimée en unités. Qu'est-ce que cet ensemble de données contient d'autre, à part la quantité de données et la quantité d'informations ????. Je ne vais pas perdre mon temps à répondre. La quantité de connaissances. Tout cela est naturel par rapport à l'objectif. Ainsi, si nous examinons la relation de cause à effet, nous obtenons le modèle suivant.

Quantité de connaissances -> Quantité de données -> Quantité d'informations.

Pour prédire, il est donc nécessaire de trouver la CONNAISSANCE d'une valeur requise à partir d'un ensemble de données, plutôt que la quantité d'informations.

La connaissance elle-même est une chose très fragile qui peut être perdue par une conversion de données mal faite. Une modification négligente, même d'un petit montant dans un enregistrement, peut réduire considérablement le montant, voire le supprimer complètement.

C'est pourquoi il n'est pas recommandé de rendre les données d'entrée plus complexes avec des conversions. Plus la transformation est complexe, moins il reste de connaissances dans le résultat final.

Alors... Il suffit de penser à voix haute à un sujet élevé pour que certaines personnes ne le comprennent pas et continuent leur chemin sans atteindre la station finale.....

De plus, vous avez pensé et arrondi les chiffres à des dizaines et perdu quelques données, il est généralement néfaste de penser, alors que certaines personnes continuent...

 
Aleksey Vyazmikin:

Merci pour votre réponse.

Que diriez-vous d'appliquer la régression linéaire pour identifier les relations les plus robustes, en ajoutant des caractéristiques supplémentaires ?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
Grigoriy Chaunin:
Je ne comprends pas la question. Cependant, la régression linéaire ne fonctionne pas sur les marchés financiers.

Il n'y a donc pas de corrélation ? Je pense queMaxim Dmitrievsky a répondu à la question ci-dessous.

Merci pour la réponse.

 
Essayez de tracer l'autocorrection sur des données de prix et vous verrez immédiatement s'il y a une corrélation ou non. L'ajout d'indicateurs est inutile. L'indicateur est une fonction du prix. C'est pourquoi nous le construisons sur la base des données de prix uniquement.
 

Pour les amateurs de validation croisée, d'échantillonnage de test, d'OOS et autres, je ne me lasserai pas de me répéter :

SanSanych et Vladimir Perervenko en particulier

Tests hors échantillon
Il s'agit de la méthode de validation la plus populaire, mais aussi la plus utilisée. En bref, les tests hors échantillon nécessitent de mettre de côté une partie des données qui seront utilisées pour tester la stratégie après son élaboration et obtenir une estimation non biaisée des performances futures. Cependant, les tests hors échantillon
réduire la puissance des tests en raison d'un échantillon plus petit
les résultats sont biaisés si la stratégie est développée via des comparaisons multiples
En d'autres termes, les tests hors échantillon ne sont utiles que dans le cas d'hypothèses uniques. L'utilisation de tests hors échantillon pour les stratégies développées par l'exploration de données montre un manque de compréhension du processus. Dans ce cas, le test peut être utilisé pour rejeter des stratégies mais pas pour en accepter. En ce sens, le test est toujours utile, mais les développeurs de stratégies de trading savent que les bonnes performances hors échantillons pour les stratégies développées via des comparaisons multiples sont dans la plupart des cas un résultat aléatoire.
Quelques méthodes ont été proposées pour corriger la signification hors échantillon en présence d'un biais de comparaisons multiples, mais dans presque tous les cas réels, le résultat est une stratégie non significative. Cependant, comme nous le montrons dans la Réf. 1 à l'aide de deux exemples correspondant à deux grands régimes de marché, des stratégies très significatives, même après application de corrections pour le biais, peuvent également échouer en raison de l'évolution des marchés. Par conséquent, les tests hors échantillon ne sont des estimations non biaisées des performances futures que si les rendements futurs sont distribués de manière identique aux rendements passés. En d'autres termes, la non-stationnarité peut invalider les résultats des tests hors échantillon.


Conclusion : les tests hors échantillon ne s'appliquent qu'aux hypothèses uniques et supposent la stationnarité. Dans ce cas, ils sont utiles, mais si ces conditions ne sont pas remplies, ils peuvent être très trompeurs.

Le ROS ne peut être utilisé que pour l'annulation d'hypothèses ou uniquement pour les problèmes stationnaires connus.

Mais pas pour les stratégies de recherche et la sélection des fonctionnalités/évaluation de la stabilité du système.


Raison: