L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3069

 
Aleksey Vyazmikin #:
Maxim, pouvez-vous créer un robot sur mon échantillon en utilisant votre système ? Ce serait plus intéressant pour moi qu'une simple boîte noire.
Vous devez avoir des millions de fonctionnalités là-dedans. Mon approche est conçue pour être entièrement automatique. Vous pouvez simplement me dire quelles caractéristiques sont bonnes selon vous, plusieurs pièces ou la même avec différents paramètres, et je peux l'exécuter sur elles. Et il choisira lui-même les cibles. Parce que de votre ensemble de données, seuls les signes resteront dans tous les cas, le reste changera tout.
 
Maxim Dmitrievsky #:
Vous devez avoir un million de signes là-dedans. Mon approche est conçue pour être entièrement automatique. Il vous suffit de me dire quels signes sont bons à vos yeux, quelques morceaux ou le même avec des paramètres différents, et je peux les utiliser. Et il choisira lui-même les cibles. Parce qu'à partir de votre ensemble de données, seuls les signes resteront de toute façon, le reste changera tout le reste.

Il ne s'agit pas d'un million, mais de 6 000 traits. Combien en avez-vous en moyenne ? En général, CB peut les déplacer facilement. Le fait que les cibles puissent changer - laissons-le faire. Je n'ai pas un grand échantillon - 4k lignes pour la formation + des dumps de test pour la validation (je comprends que vous avez un nombre fixe d'arbres pour chaque modèle).

 
Aleksey Vyazmikin #:

Non, ce n'est pas un million, mais 6 000 signes. Combien en avez-vous en moyenne ? En général, CB peut facilement les déplacer. Le fait que les cibles puissent changer - laissez-les faire. L'échantillon lui-même n'est pas très grand - 4k lignes pour la formation + des dumps de test pour la validation (je comprends que vous avez un nombre fixe d'arbres pour chaque modèle).

10 à 20 caractéristiques suffisent. N'importe lequel d'entre eux à choisir, de sorte que les formules peuvent être simplement chargées dans une librairie prête à l'emploi. Il n'est donc pas nécessaire de modifier quoi que ce soit. Après avoir lu le fichier de prix, je génère les caractéristiques nécessaires, je ne lis pas celles qui sont prêtes à l'emploi. Je n'ai pas non plus besoin d'un grand nombre de caractéristiques éparses. Plus il y a de caractéristiques, plus il est difficile de trouver des relations stables.
.

Il faut bien comprendre qu'il s'agit d'une chose particulière avec ses propres astuces. Il ne s'agit pas d'un apprentissage ordinaire.

J'ai mis 3 000 modèles en formation et je suis allé me coucher. Demain, j'examinerai les meilleurs modèles autour d'un café 😋.
 
Maxim Dmitrievsky #:
10 à 20 caractéristiques suffisent. N'importe laquelle d'entre elles à choisir, de sorte que les formules puissent être simplement chargées dans une librairie prête à l'emploi. Pour ne rien changer. Après avoir lu le fichier des prix, je génère les attributs nécessaires, je ne lis pas ceux qui sont prêts à l'emploi. Je n'ai pas non plus besoin d'un grand nombre d'attributs épars. Plus il y a de caractéristiques, plus il est difficile de trouver des relations stables.

J'ai mis 3 000 modèles en formation et je suis allé me coucher. Demain, j'examinerai les meilleurs modèles autour d'un café 😋.

Il n'est pas plus facile de lire un tableau et de travailler avec les données calculées que d'écrire des formules ?

Je ne pense pas que vous puissiez changer le code du tout au tout. Je n'insiste pas sur l'expérience.

 

En cours d'apprentissage

R2 : 0.9806482223765112

Apprendre le modèle 2204 de 3000


 
Aleksey Vyazmikin #:

N'est-il pas plus facile de lire un tableau et de travailler avec les données calculées que d'écrire des formules ?

Je pense qu'il ne sera pas possible de ne pas modifier le code du tout. Je n'insiste pas sur l'expérience.

Vous devez transférer les formules dans le terminal. Je vous enverrai un robot prêt à l'emploi. Je n'ai besoin que de caractéristiques de votre part. Les noms des indicateurs, si vous ne pouvez pas les mettre dans les formules.
 
Женя #:

Vous n'avez pas compris l'essentiel de ce que je voulais vous dire, essayez de faire tourner votre piplan sur SB (random walk), pour commencer, et peut-être (à coup sûr) vous aurez des résultats proches, qu'est-ce que cela peut vous apprendre ?

8% - les erreurs sont ridicules, sur des jetons et des cibles correctement préparés, cela ne peut pas arriver en principe, vous prévoyez le passé mélangé au futur et votre prévision recherche effectivement ce passé.

SR - ratio de Sharpe normalisé par la racine du nombre d'observations, il s'agit d'une mesure standard de la performance d'une stratégie. Le SR est fonction de l'akurasi et, plus encore, de la corrélation entre le rendement prévu et le rendement réalisé. Un akurasi de plus de 60 % donne un SR à deux chiffres, ce qui correspond à une équité exponentielle lisse (en cas de réinvestissement).

Ainsi, différentes réalisations de SB peuvent avoir des tendances, des cycles et tout ce que vous voulez. Quel sera le résultat de cette comparaison ?
 
Maxim Dmitrievsky #:
Les formules doivent être transférées au terminal. Je vous enverrai un robot prêt à l'emploi. Tout ce dont vous avez besoin, ce sont les caractéristiques. Les noms des indicateurs, si vous ne pouvez pas dans les formules.

Vous pouvez me donner les modèles binaires séparément. J'ai cru comprendre qu'il y en avait deux au final ? Cette approche vous permettra de travailler avec n'importe quelles données.

 
Aleksey Vyazmikin #:

Pouvez-vous me donner les modèles binaires séparément ? Je suppose qu'il y en a deux au final ? Cette approche vous permettra de travailler avec n'importe quelles données.

Je ne négocierai pas. Vous m'avez demandé de m'entraîner - donnez-moi les signes, je m'entraînerai et je testerai. Si le résultat est bon, je vous donnerai le code source.

S'il y a des signes normaux, il ne doit pas y en avoir beaucoup. Je n'ai pas besoin d'ensembles de données comportant 6 000 signes, je n'ai pas le temps pour cela

Sinon, je ferai d'autres choses.

 

Je vois que les passions se sont un peu échauffées dans les dernières pages. Je demande à chacun d'écrire sur le fond, et non d'essayer d'affaiblir l'adversaire.

Je comprends que chacun pense avoir raison, mais essayez aussi de respecter l'opinion des autres.

Je suggère d'abandonner les arguments et la division par paquets (Python/R). De toute façon, personne ne prouvera quoi que ce soit à qui que ce soit.

Raison: