Reti neurali. Domande degli esperti. - pagina 13

 
joo:

Inserisci un terzo tipo di segnale. Segnali totali:

0 o 1 o 2

Ok. Questo non è un problema. Ma come farà PNN a gestire questo valore?

Perché l'intervallo [0;1] - identifica possibili valori di probabilità, e come si inserisce il 2 qui? Non riesco a capire...

 
lasso:

Ok. Non è un problema. Ma come farà PNN a gestire questo valore?

Dopo tutto, l'intervallo [0;1] identifica possibili valori di probabilità, e come si inserisce il 2 qui? Non riesco a capire...

Non ci riesco, qual è il problema? Usare la sigmoide nell'intervallo [-1;1], 0 corrisponderà a nessun segnale. E poi ci sono 3 tipi di segnale "pulito".
 
joo:
Non ci riesco, qual è il problema? Usare la sigmoide nell'intervallo [-1;1], 0 corrisponderà a nessun segnale. E poi ci sono 3 tipi di segnale "pulito".

Ho anche considerato questa opzione, ma in questo caso 0 è nel mezzo della gamma, cioè corrisponde a una probabilità di 0,5

Ah, la probabilità che si verifichi un evento uguale a 0,5 e nessuna informazione sul verificarsi dell'evento, penso che siano cose ben diverse. È qui che si trova il problema (

 

Allora dovete avere tre tipi di eventi. Ognuno ha un intervallo di [0;1] (o quello che è più conveniente), e considera la probabilità di ogni evento.

Lo dico subito: questa è una direzione senza uscita. È impossibile descrivere la probabilità di questo o quell'evento e insegnare comunque alla rete questa probabilità. Supponiamo che una rete dia in uscita una probabilità di un evento del 90%. E se l'evento non si verifica? Allora la rete è sbagliata, ma perché dovrebbe essere sbagliata se c'è ancora il 10% di probabilità? Semplicemente non si può fornire un set di allenamento adeguato, tutto qui.

 

Sì, grazie, mi sembra giusto. Dovrò pensarci.

 
joo:

Allora dovete avere tre tipi di eventi. Ognuno ha un intervallo di [0;1] (o altro, se più conveniente), e considera la probabilità di ogni evento.

Lasciatemi dire subito che questo è un vicolo cieco. È impossibile descrivere la probabilità di un evento e comunque insegnare alla rete quella probabilità. Supponiamo che una rete emetta una probabilità del 90% di un evento. E se l'evento non si verifica? Allora la rete è sbagliata, ma perché dovrebbe essere sbagliata se c'è ancora il 10% di probabilità? Semplicemente non si può fornire un set di allenamento adeguato, tutto qui.

Nei problemi di classificazione nello strato di uscita è meglio usare SOFTMAX invece di sigmoide come funzione di attivazione. In questo caso, ogni neurone di uscita corrisponde a qualche classe, e le sue uscite danno la probabilità di appartenenza alla classe corrispondente. La somma delle uscite per strato è uguale a 1, come dovrebbe essere.

lasso, potete leggere sulle funzioni di attivazione, incluso SOFTMAX, qui, pagina 22

 
joo:

Lasciatemi dire subito che questa è una direzione senza via d'uscita. È impossibile descrivere la probabilità di un evento o di un altro e comunque insegnare alla rete quella probabilità. Diciamo che la rete emette una probabilità del 90% di un evento. E se l'evento non si verifica? Quindi la rete è sbagliata, ma perché dovrebbe essere sbagliata se c'è ancora il 10% di probabilità? Semplicemente non si può fornire un set di allenamento adeguato, tutto qui.

Direzione senza uscita - cosa? Per usare le NS probabilistiche nel trading o la mia descrizione di questo kit di formazione?

Spero che sia la seconda ))

E in generale, quale set di allenamento può essere definito adeguato?

Per esempio, inseriamo PNN con tre valori dell'oscillatore nell'intervallo [-1; 1] da tre periodi diversi e lo confrontiamo con l'output di 0,70 (il prezzo è andato solo 35 pips dal movimento previsto di 50 pips).

È un set di allenamento adeguato?

 
alsu:

Nei compiti di classificazione nello strato di uscita è meglio usare SOFTMAX come funzione di attivazione invece di sigmoide. In questo caso ogni neurone di uscita corrisponde a una delle classi, e le loro uscite danno la probabilità di appartenere alla classe corrispondente. La somma delle uscite per strato è uguale a 1, come dovrebbe essere.

Meglio o no, dipende da voi. Non fa alcuna differenza. Dipenderà da ciò di cui il lazo ha bisogno. Se lo si desidera, e le uscite/ingressi possono essere rappresentati come una somma pari a 1 neuroni di strato, mentre si usa una sigmoide. Ma il problema rimarrà lo stesso: l'incapacità di fornire un set di allenamento adeguato.
 
lasso:

Direzione senza uscita - cosa? Per usare le NS probabilistiche nel trading o la mia descrizione di questo kit di formazione?

Spero che sia la seconda ))

È una direzione senza uscita per determinare la probabilità di un particolare evento commerciale.

lazo:

E in generale, quale set di allenamento può essere definito adeguato?

Per esempio, inseriamo PNN con tre valori dell'oscillatore nell'intervallo [-1; 1] da tre periodi diversi e confrontiamo l'uscita con 0,70 (il prezzo è andato solo 35 pips dal movimento previsto di 50 pips).

È un set di allenamento adeguato?

Che informazione porta la cifra 0,7 sulla probabilità di un evento (già arrivato)? Nessuna. Pertanto, il risultato sarà anche - nessuno.

PNN può essere usata come classificazione di certe condizioni e/o appartenenza di una figura a un certo modello, ma non potremo usarla come strumento per la determinazione della probabilità dell'esito di qualche evento. O piuttosto può essere usato, ma il valore della probabilità trovata non sarà efficace (ho scritto sopra perché).

 
lasso:

Ok. Non è un problema. Ma come farà PNN a gestire questo valore?

Dopo tutto, l'intervallo [0;1] - identifica possibili valori di probabilità, e come si inserisce il 2 qui? Non riesco a capire...


In realtà ci sono due opzioni:

1. codifica binaria degli ingressi (1 ingresso/1 evento). 0 - l'evento non è accaduto, 1 - è accaduto.

2. Estendendo l'insieme dei valori per ogni ingresso (come vi è già stato detto: 0, 1, 2...). Non c'è nessun problema con l'intervallo [0;1] qui, otterrete probabilità all'uscita della rete, mentre l'ingresso non deve necessariamente avere probabilità. Se non credete - c'è un altro modo: dividete l'intervallo [0;1] nel numero necessario di parti (0 - l'evento non si è verificato, 0,5 - nessuna osservazione, 1 - l'evento si è verificato).

Motivazione: