L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3187

 
Je n'ai pas du tout compris le sens de ce qui s'est passé, mais c'est un état d'esprit normal pour moi.
 
fxsaber #:.

ZЫ En général, s'il y a un intérêt à essayer de trouver des différences entre les deux lignes, on peut les fournir.

Jetez un coup d'œil à ce que je vous ai écrit. Je ne pourrai l'examiner moi-même qu'à l'automne.

 
Aleksey Nikolayev #

Forester#:

J'ai fait une expérience avec l'échantillon sur lequel j'ai publié les gifs, il y a déjà 47% d'unités dans l'échantillon, les données sont résumées dans un tableau.


Description du contenu des colonnes :

  • Génération - le nombre de génération aléatoire de la cible avec un nombre fixe de "1" et "0", la dernière ligne - la cible originale
  • Similarité de tous - le pourcentage de similitude de la cible est spécifié.
  • Similitudes "1" - le pourcentage de similitude de la cible est spécifié, mais seulement pour la réponse "1".
  • Similitude "0" - le pourcentage de similitude de la cible est indiqué, mais uniquement pour une réponse "0".
  • Q_All - combien de segments quantiques ont été trouvés en utilisant 870 tables quantiques et 6533 prédicats.
  • Q_All% - combien de "Q_All" en pourcentage de l'échantillon avec la cible originale.
  • Q échantillonné - indique combien de segments quantiques ont été échantillonnés (seuls ceux qui ne se chevauchent pas sont échantillonnés)
  • Q sélectionné% - combien de "Q sélectionnés" en pourcentage de l'échantillon avec la cible originale.
  • Prédicteurs - pour combien de prédicteurs de l'échantillon il a été possible de trouver un segment quantique répondant aux critères donnés.
  • Prédicteurs % - combien de "Prédicteurs" en pourcentage d'expression de l'échantillon avec la cible originale.

Je précise que pour un prédicteur, plusieurs segments quantiques peuvent être sélectionnés au total, et que ces segments ne doivent pas se chevaucher dans la plage de la valeur du prédicteur.

Ce que je n'aime pas, c'est que dans les environs de 50 % des cibles sont laissées en place, ce qui peut avoir un effet négatif sur l'évaluation du résultat.

En fait, il s'avère qu'un grand nombre de segments quantiques ont été trouvés sur des cibles aléatoires, mais parce qu'il s'agissait de certaines grappes (vraisemblablement), différentes tables ont chevauché leurs coordonnées, de sorte qu'après avoir sélectionné des plages qui ne se chevauchent pas, il s'est avéré que la qualité (l'utilité) de ces segments quantiques est pire (moins) que les segments originaux par un facteur de 10. Par conséquent, en moyenne, sur l'échantillon avec la cible originale, les coupes quantiques ont été trouvées plus souvent pour différents prédicteurs par 3,5 fois.

Que pensez-vous de ces résultats ?

Ajouté :

Le tracé de la séquence binaire de la cible aléatoire et de l'original ressemble à ceci


 
Aleksey Vyazmikin #:

J'ai mené une expérience avec l'échantillon sur lequel j'ai publié les gifs, il y a déjà 47% d'unités dans l'échantillon, les données sont résumées dans le tableau.


Description du contenu des colonnes :

  • Génération - le nombre de génération aléatoire de la cible avec un nombre fixe de "1" et "0", la dernière ligne - la cible originale
  • Similarité de tous - le pourcentage de similitude de la cible est spécifié.
  • Similitudes "1" - le pourcentage de similitude de la cible est spécifié, mais seulement pour la réponse "1".
  • Similitude "0" - le pourcentage de similitude de la cible est indiqué, mais uniquement pour une réponse "0".
  • Q_All - combien de segments quantiques ont été trouvés en utilisant 870 tables quantiques et 6533 prédicats.
  • Q_All% - combien de "Q_All" en pourcentage de l'échantillon avec la cible originale.
  • Q échantillonné - indique combien de segments quantiques ont été échantillonnés (seuls ceux qui ne se chevauchent pas sont échantillonnés)
  • Q sélectionné% - combien de "Q sélectionnés" en pourcentage de l'échantillon avec la cible originale.
  • Prédicteurs - pour combien de prédicteurs de l'échantillon il a été possible de trouver un segment quantique répondant aux critères donnés.
  • Prédicteurs % - combien de "Prédicteurs" en pourcentage d'expression de l'échantillon avec la cible originale.

Je précise que pour un prédicteur, plusieurs segments quantiques peuvent être sélectionnés au total, et que ces segments ne doivent pas se chevaucher dans la plage de la valeur du prédicteur.

Ce que je n'aime pas, c'est que dans les environs de 50 % des cibles sont laissées en place, ce qui peut avoir un effet négatif sur l'évaluation du résultat.

En fait, il s'avère qu'un grand nombre de segments quantiques ont été trouvés sur des cibles aléatoires, mais parce qu'il s'agissait de certaines grappes (vraisemblablement), différentes tables ont chevauché leurs coordonnées, de sorte qu'après avoir sélectionné des plages qui ne se chevauchent pas, il s'est avéré que la qualité (l'utilité) de ces segments quantiques est pire (moins) que les segments originaux par un facteur de 10. En conséquence, en moyenne, sur l'échantillon avec la cible originale, les coupes quantiques ont été trouvées plus souvent pour différents prédicteurs par 3,5 fois.

Que pensez-vous de ces résultats ?

Question pour Alexei. Je ne suis pas très fort en théorie statistique. J'ai simplement suggéré de mélanger la cible au lieu de la génération.
 
Forester #:
Question pour Alexei. Je ne suis pas doué pour la théorie statistique. J'ai juste suggéré de mélanger la cible au lieu de la génération.

Je vois.

J'ai une autre suggestion à vous faire : si nous rendions le processus de construction de la forêt plus facile à gérer et si nous prenions un sous-échantillon spécifique du segment quantique sélectionné comme racine de chaque arbre ?

La profondeur doit être d'environ 2 à 3 divisions, de sorte que les exemples de classes classifiables par feuille soient d'au moins 1 %.

Je pense que le modèle sera plus stable.

 
Aleksey Vyazmikin #:

J'ai mené une expérience avec l'échantillon sur lequel j'ai publié les gifs, il y a déjà 47% d'unités dans l'échantillon, les données sont résumées dans le tableau.


Description du contenu des colonnes :

  • Génération - le nombre de génération aléatoire de la cible avec un nombre fixe de "1" et "0", la dernière ligne - la cible originale
  • Similarité de tous - le pourcentage de similitude de la cible est spécifié.
  • Similitudes "1" - le pourcentage de similitude de la cible est spécifié, mais seulement pour la réponse "1".
  • Similitude "0" - le pourcentage de similitude de la cible est indiqué, mais uniquement pour une réponse "0".
  • Q_All - combien de segments quantiques ont été trouvés en utilisant 870 tables quantiques et 6533 prédicats.
  • Q_All% - combien de "Q_All" en pourcentage de l'échantillon avec la cible originale.
  • Q échantillonné - indique combien de segments quantiques ont été échantillonnés (seuls ceux qui ne se chevauchent pas sont échantillonnés)
  • Q sélectionné% - combien de "Q sélectionnés" en pourcentage de l'échantillon avec la cible originale.
  • Prédicteurs - pour combien de prédicteurs de l'échantillon il a été possible de trouver un segment quantique répondant aux critères donnés.
  • Prédicteurs % - combien de "Prédicteurs" en pourcentage d'expression de l'échantillon avec la cible originale.

Je précise que pour un prédicteur, plusieurs segments quantiques peuvent être sélectionnés au total, et que ces segments ne doivent pas se chevaucher dans la plage de la valeur du prédicteur.

Ce que je n'aime pas, c'est que dans les environs de 50 % des cibles sont laissées en place, ce qui peut avoir un effet négatif sur l'évaluation du résultat.

En fait, il s'avère qu'un grand nombre de segments quantiques ont été trouvés sur des cibles aléatoires, mais parce qu'il s'agissait de certaines grappes (vraisemblablement), différentes tables ont chevauché leurs coordonnées, de sorte qu'après avoir sélectionné des plages qui ne se chevauchent pas, il s'est avéré que la qualité (l'utilité) de ces segments quantiques est pire (moins) que les segments originaux par un facteur de 10. Par conséquent, en moyenne, sur l'échantillon avec la cible originale, les coupes quantiques ont été trouvées plus souvent pour différents prédicteurs par 3,5 fois.

Que pensez-vous de ces résultats ?

Ajouté :

Le tracé de la séquence binaire de la cible aléatoire et de l'original ressemble à ceci


Dix simulations, ce n'est rien, il en faut des milliers pour obtenir une signification statistique.

Je ne suis pas non plus prêt à donner un avis d'expert sur un cas particulier, mais j'ai simplement souligné les problèmes possibles et les moyens courants de les résoudre.

 
Aleksey Vyazmikin #:

Que pensez-vous des résultats ?

Ajouté :

Le graphique de séquence binaire de l'aléatoire cible et de l'original ressemble à ceci

Vous êtes en train d'inventer des absurdités inutiles et implacables. Saber au moins l'a fait en une demi-heure et l'a oublié.
 
Aleksey Nikolayev #:

Dix simulations, ce n'est rien, il en faut des milliers pour obtenir une signification statistique.

Je ne suis pas non plus prêt à donner un avis d'expert sur un cas particulier, mais j'ai seulement souligné les problèmes possibles et les moyens courants de les résoudre.

Des milliers - cela demande trop de ressources informatiques - une passe - environ 40 minutes - calcul de base sur une carte vidéo.

J'ai généralement pensé que ce test ne permettait que de vérifier la possibilité de tels regroupements sur différentes plages du prédicteur.

Et il est nécessaire d'examiner la probabilité d'atteindre une plage particulière du segment quantique, qui a déjà été sélectionnée initialement.

J'aimerais néanmoins connaître l'avis des participants sur la question de la différence de la cible en pourcentage pour la fiabilité de ce test.

 
Maxim Dmitrievsky #:
Tu racontes n'importe quoi et tu t'acharnes à dire n'importe quoi. Saber, au moins, l'a fait en une demi-heure et l'a oublié.

Gardez pour vous vos appréciations sur les performances des autres, surtout quand vous ne comprenez pas ce que fait l'autre.

Je suis ouvert aux critiques constructives, et il n'y en a pas de votre part.

 
Aleksey Vyazmikin #:

Gardez pour vous les évaluations des performances des autres, en particulier lorsque vous ne comprenez pas ce que fait l'autre personne.

Je suis ouvert aux critiques constructives, et vous ne l'êtes pas.

Vous faites des conneries. Il a été écrit à plusieurs reprises que vous obtiendrez N'IMPORTE QUEL résultat au hasard. Ouvrez les yeux pour voir. Rien à ajouter :)

Peux-tu au moins comprendre ce que tu fais et pourquoi ?)
Raison: