La première pensée qui m'est venue à l'esprit en lisant l'article a été "quelle traduction bâclée".
J'ai regardé d'où venait l'auteur - il s'est avéré qu'il ne s'agissait pas d'une traduction après tout))).
В качестве инструмента для предсказания поведения валютных пар выберем систему R, которая идеально подходит для задач предсказания на финансовых рынках и, в частности, предсказания поведения валютных пар.
Je ne voulais rien dire de mal, juste des pensées dans l'oreille. L'article peut être bon, il peut être très bon......
Intéressé par l'idée elle-même (je ne connaissais pas la forêt aléatoire ). Outil imposé artificiellement. Je veux répéter sans lui - il n'est pas clairement indiqué ce qui a été fait exactement, quels vecteurs de données sont utilisés. Les paramètres du zigzag sont omis. Le public cible est-il constitué d'utilisateurs du progiciel Rattle ? Ou ceux qui écrivent en R ? Sans leur étude, de nombreux points de l'article sont incompréhensibles. Les conclusions sont décousues - l'article ne permet pas de savoir si cette direction est prometteuse ou non. Il serait possible de donner des exemples d'échanges. Impression générale - comme si l'article avait été écrit pour un cercle restreint.
PS. En essayant d'ouvrir TC.Rdata à partir de l'article, le message suivant apparaît :
Ошибка в sqrt(ncol(crs$dataset)) : нечисловой аргумент для математической функции Вдобавок: Предупреждение In rm(crs) : объект 'crs' не найден
Intéressé par l'idée elle-même (je ne connaissais pas la forêt aléatoire). Outil imposé artificiellement. Je veux répéter sans lui - il n'est pas clairement indiqué ce qui a été fait exactement, quels vecteurs de données sont utilisés. Les paramètres du zigzag sont omis. Le public cible est-il constitué d'utilisateurs du progiciel Rattle ? Ou ceux qui écrivent en R ? Sans leur étude, de nombreux points de l'article sont incompréhensibles. Les conclusions sont décousues - l'article ne permet pas de savoir si cette direction est prometteuse ou non. Il serait possible de donner des exemples d'échanges. L'impression générale est que l'article a été écrit pour un cercle restreint.
Il y a là quelque chose de très pointilleux. Moi, par exemple, qui ne suis pas mathématicien, j'ai assez bien compris l'essentiel, à l'exception de quelques points qui auraient dû être expliqués plus en détail.Par exemple, je n'ai pas très bien compris le terme "tree splitting", qui revient plusieurs fois et dont on ne sait pas très bien ce qu'il signifie exactement. Quant aux conclusions, de quelles conclusions avez-vous besoin ? "Allez ! aux barricades" ? Moi, par exemple, après avoir lu cet article, je me suis rendu compte que j'étais en train d'inventer une bicyclette, en essayant d'inventer moi-même des algorithmes similaires au lieu d'utiliser une solution toute faite.Si j'ai bien compris, l'idée principale était de populariser le package R auprès des amateurs intéressés par les statistiques (mais pas auprès des "nuls"). Et cela s'est plutôt bien passé, à mon avis.
Intéressé par l'idée elle-même (je ne connaissais pas la forêt aléatoire). Outil imposé artificiellement. Je veux répéter sans lui - il n'est pas clairement indiqué ce qui a été fait exactement, quels vecteurs de données sont utilisés. Les paramètres du zigzag sont omis. Le public cible est-il constitué d'utilisateurs du progiciel Rattle ? Ou ceux qui écrivent en R ? Sans leur étude, de nombreux points de l'article sont incompréhensibles. Les conclusions sont décousues - l'article ne permet pas de savoir si cette direction est prometteuse ou non. Il serait possible de donner des exemples d'échanges. Impression générale - comme si l'article avait été écrit pour un cercle restreint.
PS. Lorsque l'on essaie d'ouvrir TC.Rdata à partir de l'article, on obtient ce qui suit :
Public cible - utilisateurs du progiciel Rattle ? Ou ceux qui écrivent en langage R ? Sans les étudier, de nombreux points de l'article sont incompréhensibles.
Lorsque j'utilise Rattle, j'identifie deux publics cibles :
Les utilisateurs non formés à R qui peuvent composer leur propre fichier .csv d'entrée et créer et évaluer les résultats de 6 modèles, pas seulement les forêts aléatoires. Le problème principal n'est pas le modèle, mais les données d'entrée du modèle. Si vous parvenez à trouver les données initiales, vous pourrez alors commander la programmation. L'essentiel est l'idée, et les techniques de programmation peuvent également être appliquées.
PS. Et en essayant d'ouvrir TC.Rdata à partir de l'article, on obtient ce qui suit :
Revérifié, tout est normal. la séquence d'action est la suivante :
- démarrer R
- tabulation {Fichier/charger l'espace de travail
- puis chercher le fichier TC.RData dans l'archive décompressée.
- Lancer Rattle
- Onglet Data/R Dataset
- dans le menu déroulant, rechercher le nom TC dans la fenêtre Data Name.
- Cliquez sur "Run"
Nous obtenons la liste des vecteurs qui vous intéressent.
Les utilisateurs formés constituent un autre public. Rattle est un outil assez pratique pour la sélection des données initiales du modèle. Lors de l'élaboration de systèmes de trading, la majeure partie du temps est consacrée à la sélection des données initiales - la partie la plus incertaine du travail. C'est là que Rattle est très utile. Vous pouvez obtenir une estimation finale très rapidement, sans avoir à construire des modèles mathématiques très complexes.
Bonne chance, prêt à poursuivre les explications
Vous êtes un peu tatillon. Moi, par exemple, qui ne suis pas mathématicien, j'ai très bien compris l'essentiel, à l'exception de certains points qui auraient mérité d'être expliqués plus en détail.Par exemple, je n'ai pas bien compris le terme "tree splitting", qui revient plusieurs fois et dont on ne sait pas très bien ce qu'il signifie. Quant aux conclusions, de quelles conclusions avez-vous besoin ? "Allez ! aux barricades" ? Moi, par exemple, après l'avoir lu, je me suis rendu compte que j'étais en train d'inventer une bicyclette, en essayant d'inventer moi-même des algorithmes similaires au lieu d'utiliser une solution toute faite.Si j'ai bien compris, l'idée principale était de populariser le package R auprès des amateurs intéressés par les statistiques (mais pas auprès des "nuls"). Et cela s'est plutôt bien passé, à mon avis.
Par exemple, je n'ai pas bien compris le terme "tree splitting" (découpage des arbres)
Nous prenons la racine de l'arbre - elle se trouve au sommet.
Nous divisons la racine et traçons deux lignes à partir de la racine - division de la racine, puis la même action à chaque niveau.
Dans chaque nœud de l'arbre, une condition formulée par l'algorithme est vérifiée. Par exemple, si eurusd > 1,35, on passe à la branche gauche, sinon on passe à la branche droite.
L'algorithme a généré de manière excessive 500 arbres de ce type. Il devrait y avoir 10000 conditions.
Ensuite. À l'arrivée des valeurs de tous les prédicteurs - une valeur de chaque prédicteur - j'ai 88 pièces au total, sont comparées avec les arbres et une décision est prise que cet ensemble particulier de 88 valeurs implique long ou court. En d'autres termes, il s'agit d'une sorte d'analogue d'un modèle, mais dans une très large mesure.
J'ai revérifié, c'est bon. La séquence est la suivante :
- Lancer R
- fichier/charger l'onglet espace de travail
- puis rechercher le fichier TC.RData dans l'archive décompressée.
- Lancer Rattle
- Données/onglet Dataset
- dans le menu déroulant, rechercher le nom TC dans la fenêtre Data Name.
- Cliquez sur "Run" (Exécuter)
Nous obtenons la liste des vecteurs qui vous intéressent.
Nous vous remercions ! Maintenant, c'est clair.
Pouvez-vous nous expliquer l'essence de ces vecteurs : ZZ.75, ZZ.35 ?
Que sont les vecteurs *.dif1, *.dif2, *.dif3 ? Des incréments ? De quoi par rapport à quoi ?
Vecteurs eur, gbp, etc. - de quoi s'agit-il ?
Et une question globale : pourquoi les données des indicateurs sont-elles ajoutées ? N'est-ce pas la même chose que [x, f1(x), f2(x)] ? Je fais allusion à la redondance. N'avez-vous pas essayé de fournir simplement les incréments des fermetures ?
Merci d'avance pour vos réponses.
Je vous remercie ! Maintenant c'est clair.
Pourriez-vous nous expliquer l'essence de ces vecteurs : ZZ.75, ZZ.35 ?
Que sont les vecteurs *.dif1, *.dif2, *.dif3 ? Des incréments ? De quoi par rapport à quoi ?
Vecteurs eur, gbp, etc. - de quoi s'agit-il ?
Et une question globale - pourquoi ajouter des données à partir d'indicateurs ? N'est-ce pas la même chose que [x, f1(x), f2(x)] ? Je fais allusion à la redondance. N'avez-vous pas essayé de fournir simplement les incréments des fermetures ?
Merci d'avance pour vos réponses.
Pourriez-vous expliquer l'essence de ces vecteurs : ZZ.75, ZZ.35 ?
Il s'agit de ZZ avec une distance minimale de retournement de 75 pips et 35. La variable cible TREND est obtenue à partir de ZZ.35. Ces variables ne peuvent pas être utilisées dans le modèle - en regardant dans le futur.
Que sont les vecteurs *.dif1, *.dif2, *.dif3 ? Des incréments ? De quoi par rapport à quoi ?
L'incrément par rapport à la barre précédente, la barre précédente (-2) et la barre précédente (-3). L'idée est de tenir compte des tendances.
Vecteurs eur, gbp, etc. - de quoi s'agit-il ?
Les quotients eurusd, gbpusd sont les premiers symboles.
Je fais allusion à la redondance. Avez-vous essayé d'introduire simplement les incréments des clôtures ?
J'ai essayé beaucoup de choses. L'article est une démonstration des possibilités et en même temps de la redondance, afin que chacun puisse sélectionner ses propres idées et essayer. La sélection se fait très simplement - la variable est marquée comme Ignorer.
Félicitations pour l'article de SanSanych !
Bien sûr, sur R, il serait plus compact, mais nous devrions probablement commencer par là.
Je suis en train de terminer l'article sur l'apprentissage "profond". Avec vos données, nous essaierons de comparer les résultats.
Je vous souhaite bonne chance.
J'ai examiné de près l'ensemble de données, il n'est pas bon. Les guillemets doivent être supprimés. En d'autres termes, les 48 premières variables sont supprimées. Nous nous retrouvons avec un ensemble de données comprenant 42 variables d'entrée et une variable cible.
Eh bien, c'est au propriétaire de choisir, chacun choisit en fonction de ses goûts, de son expérience, etc. Mais il y a une remarque à propos du modèle. "RandomForest est merveilleux parce qu'il n'a pas besoin de prétraitement, pas du tout. Il accepte merveilleusement les données brutes.
Sinon, l'article est bien sûr très utile.
Félicitations pour l'article de SanSanych !
Bien sûr, sur R, il serait plus compact, mais nous devrions probablement commencer par là.
Je suis en train de terminer l'article sur l'apprentissage "profond". Avec vos données, nous essaierons de comparer les résultats.
Bonne chance
Il serait très utile de reprendre votre fil de discussion ici.
Il s'agissait d'un matériel très utile.

- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Vous acceptez la politique du site Web et les conditions d'utilisation
Un nouvel article Les forêts aléatoires prédisent les tendances a été publié :
Cet article envisage d'utiliser le package Rattle pour la recherche automatique de modèles afin de prédire les positions longues et courtes des paires de devises sur le Forex. Cet article peut être utile à la fois pour les traders débutants et expérimentés.
Les positions longues et courtes en tant que variables cibles n'existent pas et c'est la principale différence avec les variables indépendantes décrites ci-dessous. Cet aspect s'accorde avec le fait que nous allons prédire un futur qui n'existe pas dans le moment présent. Nous pouvons bien tirer des tendances sur les données historiques car nous connaissons l'avenir par rapport au passé.
Pour distinguer les tendances sur les données historiques, nous allons utiliser le ZigZag. C'est un indicateur brillant pour les données historiques et inutile pour les données réelles car le dernier lien et parfois le précédent sont redessinés. Comme il n'y a pas de dynamique sur les données historiques, on peut tirer de très belles tendances avec cet indicateur.
L'indicateur ZigZag avec le paramètre « distance entre les points d'inversion » égal à 0,0035 dollar a été utilisé pour le calcul de la variable cible. La figure 1 représente le résultat.
Fig. 1. L'indicateur ZigZag
Auteur : СанСаныч Фоменко