Neuronales Netz und Eingaben - Seite 41

 
nikelodeon:
Ich habe eine Stichprobe von 11 Spalten + 1 Spaltenausgabe vorbereitet. Frage: Welche Anzahl von Spalten sollte beim Start des Predictor angegeben werden? Nur die Menge der Daten (11) oder zusammen mit der Ausgabe (12) ????

Das heißt, wenn in der ursprünglichen Tabellenkalkulation (csv-Datei) die Anzahl der Spalten N > 46 und die Anzahl der Zeilen M ist, dann sind die Kosten für die Berechnungszeit proportional zu: 2 * (N - 2) + M - 2

Wenn die Anzahl der Spalten in der Kalkulationstabelle N < 13 ist, ist der Zeitaufwand für die Berechnungen proportional zu 2 * (N - 2)2 + M - 2

Das heißt, wenn die Anzahl der Spalten in der Kalkulationstabelle N = 12 (10 Eingaben) beträgt, dann ist die Rechenzeit auf demselben Computer die gleiche wie für N = 1025 (1023 Eingaben). Denn für die Anzahl der Eingänge, die kleiner als 11 ist, werden die MSUA-Kerntransformationen aktiviert.

 
OK, wir haben das Timing geklärt. Aber mir ist noch etwas anderes aufgefallen. Wenn Sie die gleiche Datei optimieren, erhalten Sie völlig unterschiedliche Ergebnisse... Wie vollständig.... Natürlich unterscheiden sie sich, manchmal sogar sehr stark. Womit hat das zu tun, Juri? Ich dachte, dass wir bei der Optimierung in diesem Fall zu demselben Ergebnis kommen müssen. Aber hier stellt sich heraus, dass das Ergebnis anders ist.... :-( Worum geht es?
 
nikelodeon:
OK, wir haben das Timing geklärt. Aber noch etwas ist mir aufgefallen. Wenn Sie ein und dieselbe Datei optimieren, erhalten Sie völlig unterschiedliche Ergebnisse... Wie vollständig.... Sie unterscheiden sich natürlich, manchmal sogar sehr stark. Womit hat das zu tun, Juri? Ich dachte, dass wir bei der Optimierung in diesem Fall zu demselben Ergebnis kommen müssen. Aber hier stellt sich heraus, dass das Ergebnis anders ist.... :-( Womit hat das zu tun?

Das hat mit Zufälligkeit zu tun. Die allgemeine Stichprobe wird mit Hilfe von jPrediction in zwei Teilstichproben aufgeteilt, eine Trainingsstichprobe und eine Kontrollstichprobe. jPrediction unternimmt 100 Versuche, die allgemeine Stichprobe in zwei Teile aufzuteilen.

Bei jedem Versuch wird ein Modell aus der Trainingsstichprobe erstellt. Bei der Kontrollstichprobe wird das Modell "auf Lousigkeit" geprüft. Die bei der Kontrolle erzielten Ergebnisse (Verallgemeinerbarkeit) werden angezeigt. Aber die Ergebnisse der Trainingsfähigkeit werden in der Hölle nicht benötigt, da sie eine Anpassung sind und daher nirgends angezeigt werden.

Wenn die Ergebnisse für die beste Verallgemeinerbarkeit bei ein und derselben Stichprobe mit verschiedenen Durchläufen sehr unterschiedlich ausfallen, bedeutet dies, dass die Stichprobe nicht repräsentativ ist - zu viel Unrat in den Eingaben. Das heißt, die Prädiktoren haben eine geringe Signifikanz.

Wenn die Stichprobe repräsentativ ist, kann dasselbe beste Modell mehr als einmal in 100 Durchläufen erstellt werden, d. h. es hängt nicht so sehr davon ab, welche Beispiele in der Trainingsstichprobe und welche in der Kontrollstichprobe enthalten sind.

 
Reshetov:


Bei der Vorhersage von NS-Zeitreihen ist eine Partitionierung der Stichprobe mit einem PRNG von keinerlei praktischem Nutzen - völliger Unsinn, der nichts aussagt.

Nur künstliche Aufteilung mit einer Kontrollstichprobe am Ende der Zeitreihe

 
Guten Abend ... Gibt es ein Beispiel für einen EA, der ein neuronales Netzwerk mit, sagen wir, einem muving oder einem anderen Indikator verwendet? Oder sogar einfacherein neuronales Netzwerk in einem EA in MT auf muving gebaut ist?
Grund der Beschwerde: