Marktknigge oder gute Manieren im Minenfeld - Seite 25

 
registred писал(а) >>

Meine Herren, sagen Sie mir, wie Sie damit umgehen, in flache lokale Tiefs und gekrümmte Anfangsgewichte zu fliegen. Ich verstehe, dass sie am Anfang keine Auswirkungen auf das Training haben, aber später beginnen sie, die Ergebnisse sehr zu beeinflussen.

Ich habe es mir zur Regel gemacht, das Netz bei jedem Schritt neu zu trainieren. Es ist klar, dass das Netz in dieser Konfiguration gelegentlich "fehl am Platz" sein kann, aber im nächsten Schritt ist es genau da, wo es sein muss. Meine Idee beruht auf der Tatsache, dass die Wahrscheinlichkeit, dass das Netz etwas "Falsches" lernt, deutlich unter 1 liegt, und dass der Beitrag der "verrückten Kinder" bei einer großen Zahl von Umschulungen im Allgemeinen minimal ist.

paralocus schrieb >>.

Ich bin etwas verwirrt darüber, wie man den Beitragsmultiplikator einer anderen Epoche reduziert.... Am Ende des Trainings habe ich sehr kleine Gewichte der Ausgabeschicht und im Gegensatz dazu große Gewichte der versteckten Schicht.

Warnung: W2 [0] = -0,0414 W2 [1] = 0,0188 W2 [2] = -0,0539

Alarm: W1[1,0]=-27.0731 W1[1,1]=-30.2069 W1[1,2]=37.6292 W1[1,3]=30.4359 W1[1,4]=-22.7556 W1[1,5]=-37.5899

Hier müssen Sie selbst denken. Ich werde nur die Vorzeichen der erwarteten Preissteigerungen vorhersagen (+/-1). Das hat mit der Spezifität des Handels zu tun (siehe Die Grundgleichung des Handels einige Beiträge weiter oben) und mit der Tatsache, dass der Versuch, die Amplitude und das Vorzeichen gleichzeitig vorherzusagen, katastrophal schwierig ist (die Zahl der TC-Architekturen und Trainingsepochen wächst). Kein heimischer PC-Power würde hier ausreichen, auch wenn wir das Grid nicht bei jedem Schritt neu trainieren! Bei der Vorhersage der absoluten BP-Werte wird also traditionell der Lernfehler in jeder Epoche kontrolliert, bis er kleiner als ein bestimmter Wert ist. Dieser Prozess kann nicht konvergieren - das Grid hängt in einer Endlosschleife, und es sind Mechanismen erforderlich, um es aus seinem komatösen Zustand herauszubringen. Als ich damit experimentierte, kontrollierte ich die Rate der Verringerung des Lernfehlers, und wenn die Bedingung erfüllt war, änderte ich alle Gewichte, d. h. ich begann praktisch von vorne zu lernen. Dabei musste ich die ungefähre Anzahl der Epochen herausfinden, die für das Lernen benötigt werden, und die Gewichtung jeder Epoche (Koeffizient vor der Korrektur jeder Gewichtung) verringerte sich durch das Gesetz 1-j/N. Wobei j in Werten von 1 bis N läuft. Nachdem ich die prädiktive Amplitude aufgegeben hatte, begann das Netz schnell und effizient zu lernen, so dass es möglich wurde, eine feste Anzahl von Trainingsepochen einzuführen, ohne den Lernfehler zu überwachen.

Um die Anzahl der Epochen zu reduzieren, habe ich außerdem die Gewichte des Netzes beibehalten, ohne sie zu randomisieren, wenn ich von Vorhersage zu Vorhersage gehe. Manchmal hatte ich einen Effekt des "Klebens" einiger Gewichte, der sich in ihrer unendlichen Zunahme oder Tendenz zum Nullpunkt manifestierte. Ich habe es so gehandhabt: Bei der Erstellung einer neuen Prognose habe ich alle Gewichte mit dem Operator th() beeinflusst. Es hat effizient funktioniert.

 
Neutron >> :
... Eine feste Anzahl von Trainingsepochen ohne Überwachung des Lernfehlers.

>> Das Problem ist gelöst!

 

zu Neutron

Ich bin gerade dabei, alle meine zwei Ebenen in eine kompaktere Form umzuschreiben. Ich möchte das Ganze auf Matrixoperationen von zwei oder drei Funktionen reduzieren. Sobald ich es fertiggestellt habe, werde ich es veröffentlichen.

Gleichzeitig werde ich die Amplitudenvorhersage "herausschneiden". In der Tat - das Zeichen ist mehr als genug.

 
Neutron >> :

Hier müssen Sie selbständig denken.

Sie meinen, wie man von der Berechnung des Amplitudenfehlers zur Berechnung des Vorzeichenfehlers übergehen kann?

Sie meinen hier?

d_2_out = test - out;                                             // Ошибка на выходе сетки
 

Nein. Ich habe ganz allgemein gesprochen. Offensichtlich werden Sie Ihren eigenen Weg gehen...

 

Es gibt ein paar Fragen, die ich, um unnötige Aufregung zu vermeiden, über eine private Leitung stellen möchte.

Ich weiß, Sie sind kein Amateur...

Darf ich?

 
Sie fragen!
 
Neutron >> :
Sie fragen!

>> ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.)

 
Beantwortet.
 
Neutron >> :

Ich habe es mir zur Regel gemacht, das Netz bei jedem Schritt neu zu trainieren. Natürlich kann das Netz bei dieser Einrichtung manchmal "am falschen Ort" sein, aber im nächsten Schritt ist es bereits am richtigen Ort. Die Idee beruht auf der Tatsache, dass die Wahrscheinlichkeit, dass das Netz "falsch" trainiert wird, viel geringer als 1 ist, so dass der Beitrag der "verrückten Kinder" bei einer großen Anzahl von Umschulungen insgesamt minimal ist.

Ich bin mir nicht ganz sicher, was Sie mit "Umschulung bei jedem Schritt" meinen.

Grund der Beschwerde: