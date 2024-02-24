L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3285

Maxim Dmitrievsky #:
Continuez à quantifier 😵‍💫

Aleksey Vyazmikin #:

Et voici le résultat - les deux dernières colonnes

En effet, les résultats se sont améliorés. Nous pouvons faire l'hypothèse que plus l'échantillon est grand, plus le résultat de l'entraînement sera bon.

Il est nécessaire d'essayer de s'entraîner sur 1 et 2 parties de l'échantillon d'entraînement - et si les résultats ne sont pas beaucoup plus mauvais que sur 2 et 3 parties, alors le facteur de la fraîcheur de l'échantillon peut être considéré comme moins important que le volume.

L'entraînement est terminé, les résultats figurent dans les deux dernières colonnes du tableau.


Nous pouvons conclure provisoirement qu'en effet, le succès de la formation dépend de la taille de l'échantillon. Cependant, je note que les résultats de l'échantillon "-1p1-2" sont comparables, et même meilleurs selon certains critères, à ceux de l'échantillon"-1p2-3", alors que pour l'échantillon "0p1-2", les résultats sont deux fois plus mauvais en termes de nombre de modèles satisfaisant au critère donné.

J'ai maintenant lancé un échantillon avec une chronologie inversée, où l'échantillon d'entraînement consiste en l'échantillon initial exam+test+train_p3, et l'échantillon de test est train_p2, et l'examen est train_p1. L'objectif est de voir s'il est possible de construire un modèle efficace sur des données plus récentes qui aurait fonctionné il y a 10 ans.

Aleksey Vyazmikin #:

Un peu plus et on obtiendra le résultat le plus trivial... ou peut-être qu'on ne l'obtiendra pas, mais qu'on fera alors une découverte qui bouleversera le monde de l'EM !

СанСаныч Фоменко #:

J'ai écrit à de nombreuses reprises sur le "pouvoir prédictif des prédicteurs". qui est calculé comme la distance entre deux vecteurs.

Je suis tombé sur une liste d'outils permettant de calculer la distance :

Il ne s'agit pas de l'outil standard, qui possède son propre ensemble de distances.

Voici une tâche sans entrée : ...
Quel sera, selon vous, le résultat ? 😀

Comme précédemment : voici les valeurs des caractéristiques sans les caractéristiques elles-mêmes.....

Et puis il écrira : et personne n'a deviné, le résultat est comme ça 😁😁😁😁🥳
 
Maxim Dmitrievsky #:
Max, je ne comprends pas pourquoi tu te moques de moi.

S'il n'y a pas d'hypothèses - ne dis rien, s'il y en a - dis-le, comme "le résultat sera nul".

 
Aleksey Vyazmikin #:
...

Quel sera, selon vous, le résultat ?

СанСаныч Фоменко #:

Un peu plus et l'on obtiendra un résultat banal... ou peut-être pas, mais alors une découverte qui bouleversera le monde de ME !

Vous pensez donc que le nombre de modèles sera comparable dans les deux premières colonnes ? Alors qu'ils sont deux fois plus différents. Soyez plus précis sur la trivialité, s'il vous plaît.

Andrey Dik #:

J'ai écrit plus haut à propos de matstat. Avant cela, j'ai écrit sur kozul. Avant même cela, j'ai écrit sur les erreurs Oracle (erreurs de balisage), lorsque les données sont balisées d'une manière que vous ne comprenez pas. Ce qui ressort absolument de tout cela, c'est la prise de conscience du fait que les résultats varient en fonction du volume et de la durée de la formation. Cela dépend des données, qui ne sont pas fournies ou décrites.
Les erreurs de marquage affectent les résultats et les périodes. Le résultat sera de savoir quel poulet a utilisé quelle patte pour marquer avec quelle patte.

Les gens ici aiment parler des piliers de base de l'apprentissage : prétraitement, quantification, relation entre les perdictors et les cibles.... Mais ils ne parlent pas de la patte utilisée pour le marquage, gauche ou droite. Or, cette question est plus importante que toutes les autres.
 
Maxim Dmitrievsky #:
Cela ressemble déjà à l'opinion d'un professionnel (qu'elle soit juste ou non est une autre question).
