Was soll in den Eingang des neuronalen Netzes eingespeist werden? Ihre Ideen... - Seite 76

 
Evgeny Shevtsov #:

Nicht wirklich.

Es ist eher so, dass es gar nicht so ist.

))








Chat widersprach mir ebenfallsund als ich die Frage stellte: "Wenn nach dem Training die Eingabe 1 und die Ausgabe 2 ist, entspricht das der Regel "wenn die Eingabe 1 ist, ist die Ausgabe 2" - sogar Dipsic musste zustimmen". Es geht eher um das Wesen der Box. Versuchen Sie, die gleiche Frage zu beantworten.
 
Evgeny Shevtsov #:

Daraus ergibt sich der sogenannte R/S-Score, dessen Wert von -1 bis +1 reicht, wobei :

- S ist der Gesamtweg, d. h. die Länge der Flugbahn,

- R ist der Nettoweg, d. h. der Abstand zwischen dem Startpunkt der Flugbahn und dem Endpunkt der Flugbahn, der auch negativ sein kann.

Das ist eine interessante Option. Ich habe sie nicht ausprobiert. Es stellt sich heraus, dass man dafür ein Regressionsmodell braucht. Sie können es dann mit metrischem und R-Quadrat versuchen, oder mit einer Modifikation - um die Streuung der Abweichung von einer geraden Linie zu schätzen....

Ich betrachte das Problem anders - ich stelle eine Frage zur Klassifizierung - ob der Preis den SL- oder TP-Punkt erreichen wird, und eine Variante - ob der Preis den SL erreichen wird, bevor der Markt in einen anderen Zustand übergeht (den Beginn des Trends) oder nicht. Es ist wichtig, SL auf etwas Ähnliches wie die Referenzpunkte zu setzen, nicht nur in Pips.



E vgeny Shevtsov #:

Damit die auf diese Weise erhaltenen Schätzungen gleichwertig sind, muss das Zeitintervall T, das für jede Schätzung verwendet wird, gleich groß sein.

Der Nachteil dabei ist, dass sich der Preis anfangs für ein Drittel der Zeit in die richtige Richtung bewegen kann, um dann flach zum Ausgangspunkt zurückzufallen. Wenn man bedenkt, dass sich der Preis von Niveau zu Niveau bewegt, dann sieht dieser Ansatz seltsam aus, die Modelle sollten sofort verstanden werden:

1. ob in dem Zeitintervall ein signifikantes Niveau erreicht wird

2. Wie lange es dauern wird, das Niveau zu erreichen

3. was nach dem Erreichen des Niveaus passieren wird (es hängt von der Antwort auf die zweite Frage ab - genug Zeit für einen Pullback oder einen Zusammenbruch nach dem Flat).

Beim Erreichen eines wichtigen Niveaus ist es wichtig, die Bewegung bis zu diesem Niveau zu bewerten.

Welches Paradigma das richtige ist, lässt sich im Allgemeinen durch Ausprobieren herausfinden.

Welches Zeitintervall verwenden Sie?


Ich möchte auch auf den Nachteil der kontinuierlichen Stichprobenerhebung hinweisen - man erhält ähnliche Beispiele auf benachbarten Balken, die quantitativ in die eine oder andere Richtung überwiegen können, was eine falsche Wahrscheinlichkeitsverschiebung ergibt, wenn man später nicht auf jedem Balken handelt.

 
Ich habe einen Lärmindikator auf ähnliche Weise gebaut

 
Ivan Butko #:







C hat hat mir dasselbe gesagt. Und als ich die Frage stellte: "Wenn nach dem Training die Eingabe 1 und die Ausgabe 2 ist, entspricht das der Regel "wenn die Eingabe 1 ist, ist die Ausgabe 2" - musste sogar Dipsic zustimmen". Es geht mehr um das Wesen der Box. Versuchen Sie, die gleiche Frage zu beantworten.


Es liegt mir fern, "gpt" zu plaudern, geschweige denn "dipsic".

Um ehrlich zu sein, habe ich noch nie mit ihnen interagiert (hmmm... vielleicht sollte ich damit anfangen...).


Andererseits bin ich in diesem Fall alles andere als ein Profi.


Sagen wir, am Beispiel eines Perseptrons (einzelnes Neuron):


Das Konzept ist nicht "wenn sonst", sondern "ähnlich" oder "unähnlich".


Der Ausgang des Perseptrons ist die Summe der Produkte der Werte von X mit den Werten von W Element für Element.

Und wenn das Bild X mit dem Bild W (das zuvor während des Trainings gebildet wurde) identisch oder sehr ähnlich ist, dann ist die Ausgabe der maximal mögliche Wert im Rahmen der "Summe der Produkte von X auf W".

Vorausgesetzt natürlich, dass die Bilder X beim Training zuvor auf den Bereich von 0 bis +1 oder auf den Bereich von -1 bis +1 normiert wurden.

Und ohne eine solche Normalisierung wird es kein adäquates Ergebnis geben.

(Es gibt jedoch auch andere Möglichkeiten der Normalisierung.)


Mit anderen Worten: Wenn das Perseptron "gesehen" hat (an den Eingängen X), was ihm beigebracht wurde (und das Gelernte an W gespeichert ist), wird es das höchste Ergebnis bei der Summe der Produkte erzielen.


Es ist jedoch immer möglich, ein solches Bild X zu WÄHLEN, bei dessen Präsentation das Perseptron ein noch höheres Ergebnis erzielen wird.

Dabei ist zu beachten, dass das präsentierte Bild ebenfalls auf den Bereich von 0 bis +1 oder auf den Bereich von -1 bis +1 vornormiert werden muss.


Und hier stellt sich die Frage :

- Was genau sollte dieses "höchste Ergebnis" sein, aus dessen Höhe wir schließen könnten, dass das Perseptron genau das gesehen hat, was ihm beigebracht wurde?

- und sollte ein gewisser Korridor von Highness angewandt werden, ein niedrigeres Highness-Niveau und ein höheres Highness-Niveau, oder reicht nur das niedrigere aus?


Im Allgemeinen sind diese Fragen sowohl mit als auch ohne Aktivierungsfunktion gültig.

 
Evgeny Shevtsov #:


Evgeny Shevtsov#:


Wohin gehe ich zu "chat-gpt", und noch mehr zu "dipsic".

Um ehrlich zu sein, habe ich noch nie mit ihnen kommuniziert (hmm... vielleicht sollte ich damit anfangen...).



Probieren Sie es auf jeden Fall aus, es lohnt sich. https://chat.deepseek.com/ Vor allem der argumentative Teil des Threads. Dip erklärt es gut als Tutor.



E vgeny Shevtsov#:

...

Das Konzept ist nicht "if else", sondern "similar" oder "dissimilar".

...






Sehen Sie, wenn Sie keinen Schwellenwert haben, dann haben Sie kein Modell. Entweder Sie akzeptieren den Schwellenwert, oder die Existenz von MLP und anderen hat keinen Sinn. Es gibt kein "wahrscheinlich wird eine Rakete, die jetzt von einem Nachbarland abgefeuert wird, uns treffen. Oder sie wird es nicht.



Die KI sagt 0,694875..... Das endgültige Modell ist die Entscheidungsfindung. Und wenn Sie einen Schwellenwert von 0,6 haben, dann ist Ihre KI eine Box mit Regeln "wenn der Input 0,3 / 0,7 / 0,1 / 0,8 ist, dann ist der Output0,694875....".

Und wenn Sie keinen Schwellenwert haben, dann haben Sie ein Modell, das sagt: "Ich weiß nicht, was diese Zahlenreihe ist, ich habe keine Ahnung, wofür sie da ist".


Aber selbst wenn man nicht weiß, was das Kästchen ist, hat es eine Regel in sich:"Wenn die Eingabe 0,3 / 0,7 / 0,1 / 0,8 ist, ist die Ausgabe0,694875..."(und es gibt keine andere Möglichkeit, das zu umgehen)

[Gelöscht]  
Ivan Butko #:


Ich habe einen ähnlich konstruierten Rauschindikator
Dies ist der sinnloseste Rauschindikator, der nichts mit Rauschen in Zeitreihen zu tun hat. Sie haben ein Dipsic-Netzwerk, fragen Sie ihn, was Rauschen ist )).
 
Maxim Dmitrievsky #:
Dies ist der sinnloseste Rauschindikator, der nichts mit Rauschen in Zeitreihen zu tun hat. Sie haben ein dipsic-Netzwerk, fragen Sie ihn, was Rauschen ist ))
Das Rauschen, von dem Sie und dipsic sprachen, hat nichts mit den Preisen zu tun.
 
Aleksey Vyazmikin #:

Das ist eine interessante Option. Ich habe sie nicht ausprobiert. Es stellt sich heraus, dass dafür ein Regressionsmodell erforderlich ist. Sie können es dann mit Metrik und R-Quadrat versuchen, oder mit einer Modifikation - um die Streuung der Abweichung von einer geraden Linie zu schätzen....

Ich betrachte das Problem anders - ich stelle eine Frage zur Klassifizierung - ob der Preis den SL- oder TP-Punkt erreichen wird, und eine Variante - ob der Preis den SL erreichen wird, bevor der Markt in einen anderen Zustand übergeht (den Beginn des Trends) oder nicht. Es ist wichtig, SL auf etwas Ähnliches wie die Referenzpunkte zu setzen, nicht nur in Pips.


Das Minus hier ist, dass sich der Kurs am Anfang für ein Drittel der Zeit in die richtige Richtung bewegen kann und dann flach zum Ausgangspunkt zurückfällt. Wenn man bedenkt, dass sich der Preis von Level zu Level bewegt, sieht dieser Ansatz seltsam aus, die Modelle sollten sofort verstanden werden:

1. ob in dem Zeitintervall ein signifikantes Niveau erreicht wird

2. Wie lange es dauern wird, das Niveau zu erreichen

3. was nach dem Erreichen des Niveaus passieren wird (abhängig von der Antwort auf die zweite Frage - genug Zeit für einen Pullback oder einen Zusammenbruch nach einem Flat).

Wenn ein bedeutendes Niveau erreicht ist, ist es wichtig, die Bewegung bis zu diesem Niveau zu bewerten.

Im Allgemeinen lässt sich durch Experimentieren herausfinden, welches Paradigma das richtigere ist.

Welches Zeitintervall verwenden Sie?


Ich möchte auch auf den Nachteil einer kontinuierlichen Stichprobenziehung hinweisen - man erhält ähnliche Beispiele auf benachbarten Balken, die quantitativ in die eine oder andere Richtung überwiegen können, was eine falsche Wahrscheinlichkeitsverschiebung ergibt, wenn man später nicht auf jedem Balken handelt.


Bezüglich der R/S-Schätzung, bei der auch das Zeitintervall T direkt betroffen ist:


Ich bin der Meinung, dass der Handel auf eine ganz ähnliche Art und Weise erfolgen sollte, wie die Schätzungen selbst generiert werden.

Das heißt, sobald das (wissentlich trainierte) Netzwerk einen Handel eröffnet hat, sollte er nach dem Zeitintervall T zwangsweise geschlossen werden, wobei letzteres als "Vorhersagehorizont" bezeichnet werden kann.

Das TP-Niveau ist also der Ort, an dem das Geschäft zwangsweise geschlossen wird, und das SL-Niveau sollte nur zur Versicherung und in einem solchen Abstand platziert werden, dass es dem Konzept selbst nicht schadet.


Es ist besser, das Zeitintervall T durch ganzzahlige Candlesticks zu berechnen, denn damit entfällt das Problem der Berechnung von Freitag bis Montag, wo es einen zweitägigen Zeitüberschuss gibt, wenn T nach dem Konzept der Zeit und nicht nach Candlesticks berechnet wurde.

Die Anzahl der Kerzen T muss wesentlich kleiner sein (um ein Vielfaches) als die zum Training des Netzes verwendete Bildgröße X.


Natürlich ist es vertrauter und verständlicher, den Gewinnfaktor (das Verhältnis zwischen dem TP-Abstand und dem SL-Abstand sowie das Verhältnis zwischen der Aufwärtsbewegung und der Abwärtsbewegung oder das Verhältnis zwischen der Abwärtsbewegung und der Aufwärtsbewegung) als Schätzung eines Handels oder einer Kursbewegung zu betrachten.

Die auf diese Weise berechnete Schätzung kann und wird jedoch deutlich größer als eins und bis zu unendlich sein.

Für das Netzwerktraining hingegen sind Schätzungen im Bereich von -1 bis +1 erforderlich, was durch die R/S-Schätzung erfüllt wird.


Aber ich wiederhole: Die R/S-Schätzung ist weit davon entfernt, autark zu sein, da sie die Flugbahn nur relativ zu sich selbst schätzt, nicht aber die R-Bewegung relativ zu einer längeren Bewegung als S.

[Gelöscht]  
Ivan Butko #:
Der Lärm, von dem Sie und dipsic sprachen, hat nichts mit den Preisen zu tun.
Womit hat es dann zu tun?
Wenn Butkos Neuron einen Handel eröffnet und der Preis um die Position herum schwankt, wie nennt man das aus der Sicht des Neurons?
Unberücksichtigte/unvorhersehbare Schwankungen wären was? Oder bist du so cool, dass du jeden Tick vorhersagen kannst?
 
Maxim Dmitrievsky #:
Worauf bezieht sie sich?



1) Auf physische Signale 2) Auf den Kontext:

  • Wenn ein Broker Kurse "einstreut", die nicht mit den Preisen übereinstimmen. Reines Rauschen. Reiner Unsinn.
  • Wenn es vorgefertigte Regeln gibt, aber irgendetwas ihre Ausführung verhindert: Eine Trendstrategie, die nach ihren eigenen Regeln vorgeht, geht in den Keller. Währenddessen machen Flat-Strategien Geld. Wenn einer der TS auf dem gleichen Grundstück verdient, über welches Rauschen in den Preisen können wir reden. Nur im Zusammenhang mit einem anderen TS.


Ich sage offensichtliche Dinge. Aber selbst die stehen nicht in den "Quatsch rein, Quatsch raus" Quatsch Artikeln hier. Nicht einmal der Kontext wird aufgeschlüsselt, wo, was und wann man Lärm nennt und wo, wann und wie und vor allem - warum man ihn loswerden muss.

Ein Ansatz, der nicht besser ist als mein kreatives Stochern.