Que mettre à l'entrée du réseau neuronal ? Vos idées... - page 76
Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Pas vraiment.
C'est plutôt pas du tout.
))
Chat m'a contredit de la même manièreEt lorsque j'ai posé la question : "Si après l'entraînement l'entrée est 1 et la sortie 2, cela correspond-il à la règle "si l'entrée est 1, la sortie est 2" - même Dipsic a dû en convenir". Il s'agit plutôt de l'essence de la boîte. Essayez de répondre à la même question.
Nous obtenons ainsi ce que l'on appelle le score R/S, dont la valeur est comprise entre -1 et +1, où :
- S est le chemin total, c'est-à-dire la longueur de la trajectoire,
- R est le chemin net, c'est-à-dire la distance entre le point de départ et le point d'arrivée de la trajectoire, qui peut être négative.
L'option est intéressante. Je ne l'ai pas essayée. Il s'avère que vous avez besoin d'un modèle de régression. Vous pouvez alors essayer la métrique et le carré R, ou une modification - pour estimer la dispersion de l'écart par rapport à une ligne droite....
Je considère le problème différemment - je pose une question de classification - si le prix atteindra le point SL ou TP, et une variante - si le prix atteindra le SL avant que le marché ne passe à un état différent (le début de la tendance) ou non. Il est important de placer le SL sur quelque chose de similaire aux points de référence, et pas seulement en pips.
E vgeny Shevtsov #:
Mais, pour que l'ensemble des estimations obtenues de cette manière soient égales entre elles, l'intervalle de temps T utilisé pour obtenir chaque estimation doit être le même.
L'inconvénient ici est que le prix peut évoluer dans la bonne direction pendant un tiers du temps au début, puis glisser à plat vers le point de départ. Si l'on considère que le prix évolue d'un niveau à l'autre, cette approche semble étrange et les modèles doivent être compris immédiatement :
1. si un niveau significatif sera atteint dans l'intervalle de temps
2. Combien de temps faudra-t-il pour atteindre ce niveau ?
3. ce qui se passera après l'avoir atteint (cela dépend de la réponse à la deuxième question - suffisamment de temps pour un repli ou un effondrement après l'aplatissement).
Lorsque l'on atteint un niveau significatif, il est important d'évaluer le mouvement jusqu'à ce niveau.
En général, c'est l'expérimentation qui permet de déterminer quel paradigme est le plus correct.
Quel intervalle de temps utilisez-vous ?
Je voudrais également souligner l'inconvénient de l'utilisation d'un échantillonnage continu - l'obtention d'exemples similaires sur des barres voisines, qui peuvent quantitativement l'emporter dans un sens ou dans l'autre, ce qui donne un changement de probabilité incorrect, si vous ne négociez pas sur chaque barre par la suite.
C hat m'a dit la même choseEt quand j'ai posé la question : "Si après l'entraînement l'entrée est 1 et la sortie 2, est-ce que cela correspond à la règle "si l'entrée est 1, la sortie est 2" - même Dipsic a dû en convenir". Il s'agit plutôt de l'essence de la boîte. Essayez de répondre à la même question.
Loin de moi l'idée de faire du "chat gpt", et encore moins du "dipsic".
Pour être honnête, je n'ai jamais interagi avec eux (hmmm... je devrais peut-être commencer...).
Mais encore une fois, je suis loin d'être un professionnel en la matière.
Prenons l'exemple d'un perseptron (neurone unique) :
Le concept n'est pas "si autre", mais "similaire" ou "dissemblable".
La sortie du perseptron est la somme des produits des valeurs de X par les valeurs de W élément par élément.
Et si l'image X est identique ou très similaire à l'image W (qui a été préalablement formée lors de l'entraînement), alors la sortie est la valeur maximale possible dans le contexte de "la somme des produits de X sur W".
À condition, bien sûr, qu'au cours du processus d'apprentissage, les images X aient été préalablement normalisées dans l'intervalle de 0 à +1, ou dans l'intervalle de -1 à +1.
Sans cette normalisation, il n'y aura pas de résultat adéquat.
(Toutefois, il existe d'autres façons de normaliser).
En d'autres termes, si le perseptron a "vu" (sur les entrées X) ce qu'on lui a appris (et que son apprentissage est stocké sur W), il produira le résultat le plus élevé sur la somme des produits.
Cependant, il est toujours possible de SÉLECTIONNER une telle image X, à la présentation de laquelle le perseptron produira un résultat encore plus élevé.
Il convient de noter ici que l'image présentée doit également être prénormalisée dans l'intervalle de 0 à +1, ou dans l'intervalle de -1 à +1.
Et c'est là que les questions se posent :
- quel devrait être exactement ce "résultat le plus élevé", sur la base duquel nous pourrions conclure que le perseptron a vu exactement ce qu'on lui a enseigné ?
- et faut-il appliquer un certain corridor de qualité, un niveau inférieur de qualité et un niveau supérieur de qualité, ou seul le niveau inférieur est-il suffisant ?
En général, ces questions sont valables à la fois avec et sans fonction d'activation.
Evgeny Shevtsov#:
Où dois-je aller pour "chat-gpt", et plus encore pour "dipsic".
Pour être honnête, je n'ai jamais communiqué avec eux (hmm... peut-être que je devrais commencer...).
Essayez donc, ça vaut le coup. https://chat.deepseek.com/ Surtout la partie du fil consacrée au raisonnement. Dip l'explique bien en tant que tuteur.
E vgeny Shevtsov#:
...
Le concept n'est pas "if else" mais "similar" ou "dissimilar".
...
Vous voyez, si vous n'avez pas de seuil, alors vous n'avez pas de modèle. Soit vous acceptez le seuil, soit MLP et les autres n'ont aucune raison d'exister. Il n'existe pas de modèle du type "il est probable qu'un missile tiré aujourd'hui d'un pays voisin nous atteindra. Ou pas.
L'IA dit 0,694875.... Le modèle final est une prise de décision. Et si vous avez un seuil de 0,6, alors votre IA est une boîte avec des règles "si l'entrée est 0,3 / 0,7 / 0,1 / 0,8, alors la sortie est0,694875....", et il n'y a pas d'autre moyen.
Et si vous n'avez pas de seuil, vous avez un modèle de "je ne sais pas ce qu'est cet ensemble de nombres, je n'ai aucune idée de ce à quoi il sert".
Mais même si vous ne savez pas ce qu'est la boîte, elle contient une règle : ""si l'entrée est 0,3 / 0,7 / 0,1 / 0,8, la sortie est0,694875..." (et il n'y a pas d'autre moyen). (et il n'y a pas d'autre moyen de la contourner)
J'ai un indicateur de bruit de construction similaire
Il s'agit de l'indicateur de bruit le plus insignifiant qui n'a rien à voir avec le bruit dans les séries temporelles. Vous avez un réseau dipsic, demandez-lui ce qu'est le bruit ))
C'est une option intéressante. Je ne l'ai pas essayée. Il s'avère qu'elle nécessite un modèle de régression. Vous pouvez alors essayer la métrique et le carré R, ou une modification - pour estimer la dispersion de l'écart par rapport à une ligne droite....
Je considère le problème différemment - je pose une question de classification - si le prix atteindra le point SL ou TP, et une variante - si le prix atteindra le SL avant que le marché ne passe à un état différent (le début de la tendance) ou non. Il est important de placer le SL sur quelque chose de similaire aux points de référence, et pas seulement en pips.
L'inconvénient ici est que le prix peut évoluer dans la bonne direction au début pendant un tiers du temps, puis glisser à plat vers le point de départ. Si nous considérons que le prix se déplace de niveau en niveau, cette approche semble étrange, les modèles doivent être compris immédiatement :
1. si un niveau significatif sera atteint dans l'intervalle de temps
2. Combien de temps faudra-t-il pour atteindre ce niveau ?
3. ce qui se passera après l'avoir atteint (en fonction de la réponse à la deuxième question - suffisamment de temps pour un repli ou un effondrement après une phase de stagnation).
Lorsqu'un niveau significatif est atteint, il est important d'évaluer le mouvement jusqu'à ce niveau.
En général, c'est l'expérimentation qui permet de déterminer quel paradigme est le plus correct.
Quel intervalle de temps utilisez-vous ?
Je voudrais également souligner l'inconvénient de l'utilisation d'un échantillonnage continu - obtenir des exemples similaires sur des barres voisines, qui peuvent quantitativement l'emporter dans un sens ou dans l'autre, donnant un changement de probabilité incorrect, si vous ne négociez pas sur toutes les barres par la suite.
En ce qui concerne l'estimation R/S, où l'intervalle de temps T est également directement impliqué :
Je pense que les transactions devraient être effectuées d'une manière tout à fait similaire à la façon dont les estimations elles-mêmes sont générées.
C'est-à-dire qu'une fois que le réseau (sciemment entraîné) a ouvert une transaction, celle-ci devrait être fermée de force après l'intervalle de temps T, ce dernier pouvant être appelé "horizon de prédiction".
Ainsi, le niveau TP est le lieu de fermeture forcée de la transaction, et le niveau SL doit être placé uniquement à titre d'assurance et à une distance telle qu'il ne nuise pas au concept lui-même.
Il est préférable de calculer l'intervalle de temps T par des chandeliers entiers, car cela élimine le problème du calcul du vendredi au lundi, où il y a un excès de temps de deux jours, si T a été calculé par le concept de temps, et non par les chandeliers.
Le nombre de bougies T doit être nettement inférieur (d'un facteur de plusieurs) à la taille de l'image X utilisée pour entraîner le réseau.
Bien sûr, il est plus familier et compréhensible de penser en termes de facteur de profit (le rapport entre la distance TP et la distance SL, ainsi que le rapport entre le mouvement à la hausse et le mouvement à la baisse, ou le rapport entre le mouvement à la baisse et le mouvement à la hausse) en tant qu'estimation d'une transaction ou d'un mouvement de prix.
Cependant, l'estimation calculée de cette manière peut être et sera significativement supérieure à un et jusqu'à l'infini.
Pour la formation en réseau, il est nécessaire de fournir des estimations comprises entre -1 et +1, ce qui est possible grâce à l'estimation R/S.
Mais je le répète, l'estimation R/S est loin d'être autosuffisante, car elle estime la trajectoire uniquement par rapport à elle-même, mais elle n'estime pas le mouvement R par rapport à un mouvement plus long que S.
le bruit dont vous et dipsic avez parlé n'a rien à voir avec les prix.
À quoi se rapporte-t-il ?
1) Aux signaux physiques 2) Au contexte :
Je dis des choses évidentes. Mais même celles-ci ne se retrouvent pas dans les articles de ce genre. Même le contexte n'est pas décomposé, où, quoi et quand appeler le bruit et où, quand et comment, et surtout - pourquoi donc - il faut s'en débarrasser.
Une approche qui ne vaut pas mieux que ma créativité.