L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 92

 
Vizard_:
OK)))) mais lisez bien les conditions -
"afficher les résultats en % (cas prédits avec succès) pour les deux échantillons (train = xx%, test = xx%). Il n'est pas nécessaire de préciser les méthodes et les modèles, juste les chiffres".
Nous attendons d'autres résultats. Je me demande quelles conclusions Mihail Marchukajtes va tirer.

mon résultat (si vous le souhaitez, je vous donnerai également la méthode) :

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56% en formation :

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

52% au test :

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
Quoi qu'il en soit, le niveau maximal de généralisation est d'environ 53%, donc...... De temps en temps, Garbage in Garbage Out apparaît, c'est-à-dire garbage..... Je ne peux pas le vérifier sur le test car Excel ne supporte pas les formules longues. Je ne veux pas écrire pour lui dans MKUL, si le modèle serait de qualité normale je l'essaierais, mais avec un tel pourcentage de généralisation, je pense que le résultat ne sera pas très bon au test....
 
mytarmailS:
Je ne comprends pas comment cette "prévisibilité" est calculée et si elle a un sens si l'objectif n'est pas pris en compte.

Il existe des formules pour estimer le degré de bruit du signal, ou vice versa. Comment et ce que ces formules calculent, seul l'auteur le sait, nous pouvons seulement croire qu'il sait ce qu'il fait.
Le résultat est assez simple : si les prédicteurs eux-mêmes ne sont pas du "bruit", il est plus facile de prédire quelque chose avec eux. Et si vous les traitez d'une manière ou d'une autre, vous pouvez obtenir un signal encore plus stable. Un signal stable est une bonne base pour une prévision.

Vous pouvez même estimer rapidement les prédicteurs vous-même à l'aide de la fonction Omega() de ce paquetage et y appliquer les valeurs d'un prédicteur particulier (une colonne du tableau d'apprentissage). Le résultat est 0 % - bruit et prédicteur inutile. 100% - tout est bon, le prédicteur peut être utilisé.
Je suppose que nous ne devrions pas introduire les valeurs pures de l'indicateur dans la fonction, mais leur incrément, par exemple pour une moyenne mobile - c(MA[0]-MA[1], MA[1]-MA[2], MA[2]-MA[3], etc.)

À propos des valeurs cibles - oui, elles ne sont pas utilisées dans le paquet. Ce paquet ne peut rien prédire. Il détermine seulement, d'une manière ou d'une autre, les prédicteurs auxquels on peut se fier et ceux qui ne le sont pas, et en crée d'autres sur la base de ces derniers. La sélection de la variable cible et l'entraînement du modèle prédictif doivent être traités différemment. Il est logique que certaines variables cibles puissent être mieux prédites et d'autres moins.
La variable cible est un problème pour n'importe quel paquet. Il n'est pas certain que la variable cible utilisée puisse même être prédite avec les prédicteurs disponibles. Par exemple, je peux utiliser soit "hausse/déclin du prix sur la prochaine barre", soit "hausse/déclin en zigzag" pour la variable cible. J'aimerais apprendre comment créer de nouvelles variables cibles afin qu'elles s'adaptent au mieux aux prédicteurs disponibles. Qui sait, je pourrais peut-être prédire parfaitement un appartement avec mes prédicteurs, mais je ne le saurai jamais car je n'ai pas essayé.

 
Comme je comprends que personne ne lit les conditions générales (toute manipulation de données est autorisée), je ne vais pas me torturer. En fait, tout est simple.
J'ai juste besoin de prendre les décalages de A6, d'appliquer une formule simple sept moins que le cinquième et d'obtenir 100% sur les deux échantillons. Merci à tous. Bonne chance...
 
Vizard_:
Comme je comprends que personne ne lit les conditions générales (toute manipulation de données est autorisée), je ne vais pas me torturer. En fait, tout est simple.
Il suffit de prendre les décalages de A6, d'appliquer une formule simple septième moins que cinquième et d'obtenir 100% sur les deux échantillons. Merci à tous. Bonne chance...
Alors, quel est le piège ? Moi aussi, je peux coder une variable de sortie dans un tas de déchets d'entrée comme ça. Tu ne devinerais jamais. Je ne sais toujours pas quel est le but de tout ça.
 
Mihail Marchukajtes:
Où est le plaisir dans tout ça ? Je peux aussi encoder une variable de sortie dans un tas de déchets d'entrée. Vous ne pourrez pas le deviner. Je ne sais toujours pas quel était le but de tout ça.
Il a attiré notre attention sur le fait que la quantité de données utilisées n'est pas toujours suffisante pour la prédiction. Par exemple, en nous limitant à 9 mesures, nous pourrions manquer des informations importantes provenant de mesures plus éloignées. Et aussi que nous ne pouvons pas évaluer un prédicteur sans tenir compte de ses interactions avec d'autres prédicteurs.
 
Mihail Marchukajtes:
Où est le plaisir dans tout ça ? Je peux aussi encoder une variable de sortie dans un tas de déchets d'entrée. Vous ne pourrez pas le deviner. Je ne comprends toujours pas le but de tout ça.
Que tu ne peux pas voir la marmotte, mais que tu peux.)
Allez, essayons. Juste un simple.
 
Vizard_:
En ce sens que vous ne pouvez pas voir la marmotte, mais elle est là)))
Allez, essayons. Juste un simple.
Allez, je vais trouver quelque chose. ....
 
Par exemple, ce fichier. Le train Chitso n'a pas besoin de faire de test. L'optimiseur de Reshetov montre des déchets ou 56%, mais le spermophile est là aussi. Qui peut trouver.... ??? Je ne vois vraiment pas l'intérêt de ces jeux quand la sortie est faite à partir de la transformation de l'entrée, ici et le réseau ne sera pas nécessaire..... alors c'est tout....
 
Mihail Marchukajtes:
Par exemple, ce fichier. Le train Chitso n'a pas besoin de faire de test. L'optimiseur de Reshetov montre des déchets ou 56%, mais le spermophile est là aussi. Qui peut trouver.... ??? Je ne vois vraiment pas l'intérêt de ces jeux quand la sortie sera faite à partir de la transformation de l'entrée, il n'y aura plus besoin de réseau non plus..... so....
Le fait qu'une simple archive rar ne puisse pas être jointe.... fait chier ce forum. C'est pathétique en un mot.....
Dossiers :