Galateo del mercato o buone maniere in un campo minato - pagina 25

 
registred писал(а) >>

Signori, potete dirmi come affrontate il volo in bassi locali e pesi iniziali curvi? Capisco che all'inizio non hanno alcun effetto sull'allenamento, ma più tardi cominciano a influenzare molto i risultati.

Ho stabilito la regola di riaddestrare la rete ad ogni passo. Ovviamente, in questa configurazione, la rete può essere occasionalmente "fuori posto", ma nella fase successiva, è proprio dove deve essere. La mia idea si basa sul fatto che la probabilità che la rete impari la cosa "sbagliata" è notevolmente inferiore a 1, e in generale, su un grande campione di riqualificazione, il contributo dei "bambini pazzi" è minimo.

paralocus ha scritto >>.

Sono un po' confuso su come ridurre il moltiplicatore di contributo di un'altra epoca.... Ho dei pesi di strato di uscita molto piccoli alla fine dell'addestramento, e grandi pesi di strato nascosto al contrario.

Allarme: W2 [0] = -0,0414 W2 [1] = 0,0188 W2 [2] = -0,0539

Allarme: W1[1,0]=-27.0731 W1[1,1]=-30.2069 W1[1,2]=37.6292 W1[1,3]=30.4359 W1[1,4]=-22.7556 W1[1,5]=-37.5899

Qui dovrete pensare da soli. Prevedo solo i segni degli aumenti di prezzo previsti (+/-1). Ha a che fare con la specificità del trading (vedi L'equazione di base del trading qualche post sopra), e il fatto che cercare di prevedere l'ampiezza e il segno simultaneamente lo rende catastroficamente difficile (il numero di architetture TC e di epoche di allenamento sta crescendo). Nessuna potenza del PC di casa sarebbe sufficiente qui, anche se non riqualifichiamo la griglia ad ogni passo! Così, tradizionalmente, quando si predicono i valori assoluti di BP, si controlla l'errore di apprendimento ad ogni epoca fino a quando non diventa inferiore ad alcuni. Questo processo può non convergere - la griglia si blocca in un ciclo infinito e sono necessari meccanismi per portarla fuori dal suo stato comatoso. Quando ho sperimentato questo, ho controllato il tasso di riduzione dell'errore di apprendimento e quando la condizione è stata soddisfatta - ho riformato tutti i pesi, cioè ho praticamente ricominciato l'apprendimento da capo. A quel punto ho dovuto trovare il numero approssimativo di epoche necessarie per l'apprendimento e il peso di ogni epoca (coefficiente prima della correzione di ogni peso) è diminuito dalla legge 1-j/N. Dove j corre in valori da 1 a N. Dopo aver abbandonato l'ampiezza predittiva, la rete ha cominciato ad apprendere in modo rapido ed efficiente, quindi è diventato possibile introdurre un numero fisso di epoche di allenamento senza monitorare l'errore di apprendimento.

Inoltre, passando da predizione a predizione, per ridurre il numero di epoche, ho mantenuto i valori dei pesi della rete senza randomizzarli. A volte ho avuto un effetto di "incollaggio" di alcuni pesi che si manifestava nel loro aumento infinito o tendenza a zero. L'ho affrontato in questo modo: quando faccio una nuova previsione ho influenzato tutti i pesi con l'operatore th(). Ha funzionato in modo efficiente.

 
Neutron >> :
... Un numero fisso di epoche di allenamento senza monitorare l'errore di apprendimento.

>> il problema è stato risolto!

 

al neutrone

Sono in procinto di riscrivere tutti i miei due strati in una forma più compatta. Voglio ridurre tutto a operazioni di matrice di due o tre funzioni. Appena l'avrò finito lo posterò.

Allo stesso tempo "taglierò" la previsione dell'ampiezza. Infatti - il segno è più che sufficiente.

 
Neutron >> :

Qui è dove devi pensare da solo.

Intendi pensare a come passare dal calcolo dell'errore di ampiezza al calcolo dell'errore di segno?

Intendi qui?

d_2_out = test - out;                                             // Ошибка на выходе сетки
 

No. Stavo parlando in termini generali. Ovviamente, andrai per la tua strada...

 

Ci sono un paio di domande che, per evitare un'inutile agitazione qui, vorrei fare via linea privata.

So che non sei un dilettante...

Posso?

 
Tu chiedi!
 
Neutron >> :
Tu chiedi!

>> ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.)

 
Risposto.
[Eliminato]  
Neutron >> :

Ho stabilito la regola di riaddestrare la rete ad ogni passo. Ovviamente, in questa configurazione, la rete può essere a volte "nel posto sbagliato", ma nel passo successivo è già nel posto giusto. L'idea si basa sul fatto che la probabilità che la rete sia addestrata "male" è molto meno di 1, quindi nel complesso, su un grande campione di riqualificazione il contributo dei "bambini pazzi" è minimo.

Non ho capito bene cosa intendi per "riqualificazione ad ogni passo"?