L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo

mytarmailS 2016.07.08 14:08 #361

Yury Reshetov:

Ne serait-il pas préférable de l'intégrer dans R ?

Et plus de gens pourront travailler et les ponts mt5 avec R semblent être disponibles.

mytarmailS 2016.07.08 14:16 #362

Dr. Trader:

Je n'ai jamais essayé, mais techniquement vous pourriez aussi traiter la variable cible comme un prédicteur en l'incluant dans le modèle pca. Ensuite, dans les nouvelles données, sa valeur sera inconnue, par conséquent pca peut remplir ces valeurs manquantes.

J'ai essayé de prédire les composants de la tête et je n'ai rien obtenu d'intéressant...

Vous pouvez aussi l'essayer, il existe un très bon paquetage bien documenté pour cela "Rssa".

EURUSD - Tendances, prévisions Wma 5/20 - Ema Portefeuille : PriceChannelExpert et

TheXpert 2016.07.08 14:23 #363

Dr. Trader:

Non, c'est bon. Puisque les prédicteurs utilisés pour chacune des composantes principales sont connus, nous pouvons éliminer sans risque les prédicteurs qui ne sont pas utilisés dans les composantes principales.

Comment ça, ils ne sont pas utilisés ? L'ACP est une transformation linéaire. Les dimensions qui peuvent être éliminées sont celles qui peuvent être obtenues par une combinaison linéaire des autres. Cela signifie que tout prédicteur peut être obtenu par une combinaison linéaire des composantes principales. Si vous prenez un intervalle de 95%, il y a de fortes chances de perdre bêtement un bon prédicteur à cause de l'échelle, un intervalle inférieur à 100% n'est utilisé que dans la compression de données avec perte, sinon seules les composantes nulles sont toujours coupées.

Trading en ligne sur Discussion de l'article "Estimations Question sur le trading

Dr. Trader 2016.07.08 14:36 #364

mytarmailS:
Bon sang, je me doutais bien que ce n'était pas un hasard si ces images "NA" se retrouvaient dans la date, mais j'ai lu le manuel, il est clairement question d'ACP avec un réseau neuronal, mais alors on ne sait toujours pas comment ce type du site a pu obtenir cette belle image avec une bonne séparation par classes.

Les images ont un point différent là... L'article lui-même ne porte pas sur la classification, mais sur le clustering. Vous avez des données, vous devez les diviser en groupes d'une manière ou d'une autre. Vous ne savez même pas combien de groupes vous avez - deux, trois, dix... L'auteur utilise un graphique des deux premières composantes de l'ACP où l'important est la proximité des points d'un groupe entre eux. Les couleurs sont déjà une analyse comparative, et sont attribuées à partir de variables cibles déjà connues, qui ne sont pas calculées, mais simplement extraites du tableau. Si les groupes de points sont correctement répartis par couleur, alors tout est OK, la méthode semble fonctionner et nous pouvons l'essayer sur d'autres données. Mais il n'y a vraiment aucune prédiction dans l'article, seulement un regroupement et une comparaison avec une classification connue.

Vous pouvez dessiner un graphique similaire dans l'article de mon précédent post. Le résultat sera un graphique comme celui-ci : http://i0.wp.com/www.win-vector.com/dfiles/YAwarePCA_files/figure-html/scaledplotest-1.png. Pas de regroupement intéressant ici, les données d'entrée sont différentes. Mais si vous utilisez l'iris de table comme données d'entrée, vous obtiendrez quelque chose de similaire aux graphiques de l'article que vous avez donné.

Aide au codage Pouvez-vous me suggérer un Indicateurs d'élite :)

СанСаныч Фоменко 2016.07.08 14:43 #365

Combinateur:
L'ACP était à l'origine destinée à réduire la dimensionnalité des séries originales. C'est tout. L'utiliser pour sélectionner des prédicteurs relève du délire.

Pourriez-vous réfuter de manière appropriée le contenu de l'article dont j'ai donné le lien. A ce stade, leDr. Trader: a tenté d'utiliser ce matériel. Pour l'utiliser de manière très spécifique. Le résultat est négatif. Peut-être pouvez-vous également nous donner votre avis sur le sujet ?

Principal Components Regression, Pt. 3: Picking the Number of Components | R-bloggers

Nina Zumel
www.r-bloggers.com

In our previous note we demonstrated Y-Aware PCA and other y-aware approaches to dimensionality reduction in a predictive modeling context, specifically Principal Components Regression (PCR). For our examples, we selected the appropriate number of principal components by eye. In this note, we will look at ways to select the appropriate number...

Quelques signes des bons Apprendre et écrire ensemble Apprenez-en davantage sur les

Yury Reshetov 2016.07.08 14:48 #366

mytarmailS:

Ne serait-il pas préférable de l'intégrer dans R ?

Et plus de personnes pourront travailler et les ponts mt5 avec R semblent être disponibles.

Trader s'est déjà planté en essayant de porter l'ancienne libVMR vers R et n'avait pas assez de mémoire pour une grosse machine nucléaire et toutes les performances pour une petite (réduction du nombre de cycles par 100 fois), alors qui veut marcher sur le même râteau est peu probable ?

Il est donc préférable de ne pas commencer à parler du portage vers R pour de telles tâches - ce problème ne va pas s'arranger.

SPAM, SPAMMERS et leurs Questions des débutants MQL5 Avez-vous des tactiques pour

mytarmailS 2016.07.08 14:56 #367

Yury Reshetov:

Si l'on en juge par le fait que Dr. Trader a déjà planté en essayant de porter l'ancienne libVMR vers R et qu'il n'avait pas assez de mémoire pour une grande machine nucléaire, ainsi que des performances complètes pour une petite (le nombre de cycles a été réduit de 100 fois), il est peu probable que des personnes soient prêtes à marcher sur le même râteau ?

Il vaut donc mieux ne pas souffler mot du portage sur R comme celui-ci - cet engin est trop lent.

Je voulais créer un paquet pour "R" .

"R" est constitué à 70% de paquets écrits dans d'autres langages (C++, C, fortran, java...) donc la vitesse de traitement ne devrait pas en souffrir, ou bien je rate quelque chose ?

le célèbre paquet "h2o" est entièrement écrit en java

Statistiques de dépendance entre [Toute question de débutant, Justification de l'existence des

Yury Reshetov 2016.07.08 15:01 #368

mytarmailS:

Je voulais créer un paquet pour "R".

"R" est constitué d'environ 70% de paquets écrits dans des langages "étrangers" (C++, C, fortran, java...) donc la vitesse de traitement ne devrait pas en souffrir, ou bien je rate quelque chose ?

le célèbre paquet "h2o" est entièrement écrit en java

Je ne le savais pas. Je vais essayer de chercher des instructions sur la création de paquets en Java.

Dr. Trader 2016.07.08 15:02 #369

Yury Reshetov:

Plus précisément dans le fichier de rapport :

/**
* La qualité de la modélisation hors échantillon :
*
* VraisPositifs : 182
* VraisNégatifs : 181
* FauxPositifs : 1
* FauxNégatifs : 1
* Total des modèles hors échantillon avec statistiques : 365
* Total des erreurs hors échantillon : 2
* Sensibilité de la capacité de généralisation : 99.4535519125683%
* Spécificité de la capacité de généralisation : 99,45054945054946%
* Capacité de généralisation : 98,90410136311776%
* Indicateur de Reshetov : 8,852456238401455
*/

Désolé, je n'y crois pas, c'est trop graphique. Pouvez-vous répéter l'expérience s'il vous plaît ? J'ai joint une autre archive, où les données portent sur une période différente. La formation du modèle doit être sur train.csv, le test sur test_notarget.csv. Je suis intéressé par les résultats prédits pour le fichier test_notarget.csv. Le fichier pour le test ne contient pas de variable cible, pour être juste. Mais il y a une autre archive protégée par un mot de passe avec les résultats du test test.csv, je vais donner le mot de passe pour la comparaison en échange des résultats prédits.

Dossiers :

forex_test.zip 2699 kb

[Toute question de débutant, Moyenne mobile Discussion de l'article "Utiliser

Dr. Trader 2016.07.08 15:13 #370

Combinateur:

Comment ça, ils ne sont pas utilisés ? L'ACP est une transformation linéaire. Les dimensions amovibles : celles qui peuvent être obtenues par une combinaison linéaire des autres. Cela signifie que tout prédicteur peut être obtenu par une combinaison linéaire des composantes principales. Si l'on prend un intervalle de 95%, il y a de fortes chances de perdre un bon prédicteur bêtement à cause de l'échelle, un intervalle inférieur à 100% n'est utilisé que dans la compression de données avec perte, sinon seules les composantes qui sont nulles sont toujours coupées.

Je ne l'ai pas formulé correctement, mais vous l'avez bien compris. Il s'agit justement de prendre des composants suffisants pour une précision de 95 % et d'écarter le reste. Exemple : il y a 10000 prédicteurs, cela signifie que 10000 composants peuvent être créés pour une précision garantie de 100%. Nous pouvons alors écarter les 9 900 composants pour n'en garder que 100, mais la précision ne sera réduite que de 5%, passant de 100% à 95%. Le reste des 100 composants doit être analysé et les prédicteurs qui n'y sont pas utilisés doivent être supprimés. Une perte de 5% n'est pas un problème, car il est important de prédire la variable cible, et non de recréer les données originales sans perte.

Première vache sacrée : Filtre FIR avec phase L'étiquette du marché ou

L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 37