Les réseaux neuronaux. Questions des experts. - page 13

 
joo:

Entrez un troisième type de signal. Total des signaux :

0 ou 1 ou 2

Ok. Ce n'est pas un problème. Mais comment PNN va-t-il traiter cette valeur ?

Parce que l'intervalle [0;1] - identifie les valeurs de probabilité possibles, et comment 2 s'inscrit-il ici ? Je n'arrive pas à comprendre...

 
lasso:

Ok. Ce n'est pas un problème. Mais comment PNN va-t-il traiter cette valeur ?

Après tout, l'intervalle [0;1] identifie les valeurs de probabilité possibles, et comment 2 s'inscrit-il dans cet intervalle ? Je n'arrive pas à comprendre...

Je n'arrive pas à l'avoir, quel est le problème ? Utiliser une sigmoïde dans la plage [-1;1], 0 correspondra à l'absence de signal. Et puis il y a 3 types de signal "propre".
 
joo:
Je n'arrive pas à l'avoir, quel est le problème ? Utiliser une sigmoïde dans la plage [-1;1], 0 correspondra à l'absence de signal. Et puis il y a 3 types de signal "propre".

J'ai également envisagé cette option, mais dans ce cas, 0 se situe au milieu de la fourchette, c'est-à-dire qu'il correspond à une probabilité de 0,5.

Ah, la probabilité d'occurrence d'un événement égale à 0,5 et aucune information sur l'occurrence de l'événement, je pense que ce sont des choses bien différentes. C'est là que réside le problème (

 

Ensuite, vous devez avoir trois types d'événements. Chacun d'entre eux a une plage de [0;1] (ou ce qui est plus pratique), et considère la probabilité de chaque événement.

Je le dis tout de suite : c'est une voie sans issue. Il est impossible de décrire la probabilité de tel ou tel événement tout en enseignant au net cette probabilité. Supposons qu'un réseau donne une probabilité de sortie d'un événement de 90%. Et si l'événement ne se produit pas ? Alors le réseau est faux, mais pourquoi serait-il faux s'il reste encore 10% de probabilité ? Vous ne pouvez pas fournir un ensemble d'entraînement adéquat, c'est tout.

 

Oui, merci, ça me semble correct. Je vais devoir y réfléchir.

 
joo:

Ensuite, vous devez avoir trois types d'événements. Chacun a une plage de [0;1] (ou autre, selon ce qui est le plus pratique), et considère la probabilité de chaque événement.

Je le dis tout de suite, c'est une impasse. Il est impossible de décrire la probabilité d'un événement tout en enseignant cette probabilité au réseau. Supposons qu'un réseau produise une probabilité de 90 % d'un événement. Et si l'événement ne se produit pas ? Le réseau est donc faux, mais pourquoi serait-il faux s'il reste 10% de probabilité ? Vous ne pouvez pas fournir un ensemble d'entraînement adéquat, c'est tout.

Dans les problèmes de classification dans la couche de sortie, il est préférable d'utiliser SOFTMAX au lieu de sigmoïde comme fonction d'activation. Dans ce cas, chaque neurone de sortie correspond à une certaine classe, et ses sorties donnent la probabilité d'appartenance à la classe correspondante. La somme des sorties par couche est égale à 1, comme il se doit.

lasso, vous pouvez vous renseigner sur les fonctions d'activation, y compris SOFTMAX, ici, page 22.

 
joo:

Je le dis d'emblée : cette direction est dans l'impasse. Il est impossible de décrire la probabilité d'un événement ou d'un autre tout en enseignant cette probabilité au réseau. Disons que le réseau émet une probabilité de 90% pour un événement. Et si l'événement ne se produit pas ? Le réseau est donc faux, mais pourquoi serait-il faux s'il reste 10% de probabilité ? Vous ne pouvez pas fournir un ensemble d'entraînement adéquat, c'est tout.

Une direction sans issue - quoi ? Pour utiliser la NS probabiliste dans le trading ou ma description de ce kit de formation ?

J'espère que c'est la dernière.)

Et en général, quel ensemble de formation peut être qualifié d'adéquat ?

Par exemple, nous entrons dans le PNN trois valeurs de l'oscillateur dans l'intervalle [-1 ; 1] de trois périodes différentes et nous le comparons avec la sortie de 0,70 (le prix n'a augmenté que de 35 pips par rapport au mouvement attendu de 50 pips).

S'agit-il d'un ensemble de formation adéquat ?

 
alsu:

Dans les tâches de classification, dans la couche de sortie, il est préférable d'utiliser SOFTMAX comme fonction d'activation au lieu de sigmoïde. Dans ce cas, chaque neurone de sortie correspond à l'une des classes, et leurs sorties donnent la probabilité d'appartenir à la classe correspondante. La somme des sorties par couche est égale à 1, comme il se doit.

Meilleur ou pas, c'est à vous de voir. Ça ne fait aucune différence. Cela dépendra des besoins du lasso. Si on le souhaite, et les sorties/entrées peuvent être représentées comme une somme égale à 1 neurones de couche, tout en utilisant une sigmoïde. Mais le problème restera le même : l'incapacité à fournir un ensemble de formation adéquat.
 
lasso:

Une direction sans issue - quoi ? Pour utiliser la NS probabiliste dans le trading ou ma description de ce kit de formation ?

J'espère que c'est la dernière.)

C'est une voie sans issue pour déterminer la probabilité d'un événement commercial particulier.

lasso:

Et en général, quel ensemble de formation peut être qualifié d'adéquat ?

Par exemple, nous entrons dans le PNN trois valeurs de l'oscillateur dans l'intervalle [-1 ; 1] de trois périodes différentes et nous lui comparons la sortie de 0,70 (le prix n'a augmenté que de 35 pips par rapport au mouvement attendu de 50 pips).

S'agit-il d'un ensemble de formation adéquat ?

Quelle information le chiffre 0,7 apporte-t-il sur la probabilité d'un événement (déjà arrivé) ? Aucun. Par conséquent, le résultat sera également - aucun.

Le PNN peut être utilisé pour la classification de certaines conditions et/ou l'appartenance d'une figure à un certain modèle, mais nous ne pourrons pas l'utiliser comme un outil de détermination de la probabilité de l'issue d'un événement. Ou plutôt il peut être utilisé, mais la valeur de la probabilité trouvée ne sera pas effective (j'ai écrit plus haut pourquoi).

 
lasso:

Ok. Ce n'est pas un problème. Mais comment PNN va-t-il traiter cette valeur ?

Après tout, l'intervalle [0;1] - identifie les valeurs possibles des probabilités, et comment 2 s'intègre-t-il ici ? Je n'arrive pas à comprendre...


Il existe en fait deux options :

1. codage binaire des entrées (1 entrée/1 événement). 0 - l'événement n'a pas eu lieu, 1 - il a eu lieu.

2. Extension de l'ensemble des valeurs pour chaque entrée (comme on vous l'a déjà dit : 0, 1, 2...). Il n'y a pas de problème avec la plage [0;1] ici, vous obtiendrez des probabilités à la sortie du réseau, alors que l'entrée ne doit pas nécessairement avoir des probabilités. Si vous n'y croyez pas, il existe un autre moyen : divisez l'intervalle [0;1] en un nombre nécessaire de parties (0 - l'événement ne s'est pas produit, 0,5 - aucune observation, 1 - l'événement s'est produit).

Raison: