L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo

СанСаныч Фоменко 2023.10.04 15:29 #32811

Aleksey Vyazmikin #:

J'ai pris un échantillon de 2010 à 2023 (47k lignes), je l'ai divisé en 3 parties dans l'ordre chronologique et j'ai décidé de voir ce qui se passerait si nous échangions ces parties.

La taille des sous-échantillons est de 60 % pour la formation, de 20 % pour le test et de 20 % pour l'examen.

J'ai fait ces combinaisons (-1) - c'est l'ordre standard - chronologique. Chaque sous-échantillon a sa propre couleur.

J'ai entraîné 101 modèles avec des semences différentes pour chaque ensemble d'échantillons, et j'ai obtenu le résultat suivant

Toutes les métriques sont standard, et on peut voir qu'il est difficile de déterminer le profit moyen des modèles (AVR Profit), ainsi que le pourcentage de modèles dont le profit dépasse 3000 points sur le dernier échantillon qui n'a pas participé à l'entraînement.

Peut-être faudrait-il réduire le taux de réussite relatif des variantes -1 et 0 dans la taille de l'échantillon d'entraînement ? En général, il semble que Recall réagisse à cela.

À votre avis, les résultats de ces combinaisons devraient-ils être comparables entre eux dans notre cas ? Ou les données sont-elles irrémédiablement obsolètes ?

Un autre bricolage...

Il y a la validation croisée, tout est mâché et mâché..., largement utilisé....

Aleksey Vyazmikin 2023.10.04 15:42 #32812

СанСаныч Фоменко #:

Un autre autodidacte...

Il y a une validation croisée, tout est mâché et mâché..., largement utilisé.....

C'est justement cela, la validation croisée n'est peut-être pas efficace dans ce cas.

Et quel est l'intérêt de cette conception personnelle ? Maxim retourne l'échantillon par chronologie - en supposant que le résultat sera identique - mon expérience montre l'erreur. Ou bien tout est individuel et la validation peut révéler un modèle ou une occurrence aléatoire dans l'ensemble de l'échantillon.

Qui veut une stratégie Toute question des nouveaux Neuro-prévision des séries financières

[Supprimé] 2023.10.04 16:09 #32813

Aleksey Vyazmikin #:

C'est justement là que le bât blesse : la validation croisée n'est pas forcément efficace dans ce cas.

Et où est l'auto-affaire ? Maxim retourne l'échantillon chronologiquement - en supposant que le résultat sera identique - mon expérience montre l'erreur. Ou bien tout est individuel et la validation peut révéler un modèle ou une occurrence aléatoire dans l'ensemble de l'échantillon.

Les flèches ne sont pas dirigées vers Maxim, d'autant plus qu'il n'a fait ou même pensé à aucune des choses suggérées.

Aleksey Vyazmikin 2023.10.04 16:12 #32814

Maxim Dmitrievsky #:

Tu ne devrais pas te mettre à dos Maxim, surtout s'il n'a fait aucune des choses que tu as suggérées.

Que voulez-vous dire par "il n'a rien fait" ? N'êtes-vous pas déjà en train d'entraîner le modèle sur l'histoire la plus récente ?

[Supprimé] 2023.10.04 16:15 #32815

fxsaber #:

Quand aucune matrice ne peut le gérer.

Il faut trois secondes pour trouver des chaînes similaires de longueur 30K dans une chaîne de 10M.

Il ne s'agit pas de compter toutes les corrélations possibles, mais de comparer la source avec d'autres données. Vous n'avez pas besoin d'une matrice, juste d'un vecteur.

[Supprimé] 2023.10.04 16:16 #32816

Aleksey Vyazmikin #:

Que voulez-vous dire par "je ne l'ai pas fait" ? N'êtes-vous pas déjà en train d'entraîner le modèle sur l'histoire la plus récente ?

Je ne sais plus qui l'a fait en premier. Un intello. Ça n'a pas d'importance dans mon cas.

Aleksey Vyazmikin 2023.10.04 16:17 #32817

Maxim Dmitrievsky #:

Je ne me souviens plus qui l'a choisi en premier. Cela n'a pas d'importance dans mon cas.

En quoi votre cas est-il différent du mien ?

[Supprimé] 2023.10.04 16:19 #32818

Aleksey Vyazmikin #:

En quoi votre cas est-il différent du mien ?

parce que je n'aime pas communiquer avec des sophistes et des psychologues analphabètes )

ces personnes ne produisent pas de contenu utile

Aleksey Vyazmikin 2023.10.04 16:29 #32819

Maxim Dmitrievsky #:

parce que je n'aime pas parler à des sophistes et à des psychologues analphabètes )

Ces personnes ne produisent pas de contenu utile

Votre "amour" affecte-t-il les données d'une manière magique ?

fxsaber 2023.10.04 16:39 #32820

Maxim Dmitrievsky #:

Il ne s'agit pas de compter toutes les corrélations possibles, mais de comparer la source avec d'autres données. Il n'est pas nécessaire d'utiliser une matrice, un vecteur suffit.

C'est le cœur du calcul ligne par ligne de la matrice.

L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3282