Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2526

 
Aleksey Nikolayev #:

Zum Beispiel, wenn 1<=t1<=t2<n, dann ist ACF(t1,t2)=sqrt(t1/t2).

Ich habe eine weitere Frage. Hier betrachten wir den ACF benachbarter Werte in einer Stichprobe von unendlichem Umfang. Zum Beispiel: t1=1, t2=2. Wir erhalten ACF =sqrt(0,5) ~ 0,707. Nun nehmen wir andere Nachbarwerte, z. B.t1=10000, t2=10001. Wir erhalten ACF = 1 (fast). Es stellt sich heraus, dass benachbarte Werte unterschiedlich zueinander korreliert sind. Ist das normal?

 
LenaTrap #:

Um ehrlich zu sein, kann ich überhaupt nichts verstehen.

p.s. Vielleicht hat ja ein superschlauer Mathematiker Mitleid mit mir und erklärt mir, was hier los ist?

Sie brauchen keinen "superschlauen Mathematiker" im Handel .....

DL hat 3 Schichten - interne (versteckte) Griffe t Moment bzw. externe t-1 und t+1... - daher ist eine Autokorrelation möglich... Imho... Ich sehe das folgendermaßen

obwohl es mir aus irgendeinem Grund so vorkommt, dass, wenn wir nicht die Delta-Änderung eines Merkmals in der Zeit nehmen, sondern irgendeinen Index - dann kann vielleicht der Effekt der Autokorrelation dieser sich überschneidenden Werte im Zeitraum irgendwie nivelliert werden... das ist fraglich... denn close(t)/close(t-1) haben auch eine Schnittmenge und damit eine Autokorrelation... obwohl bei TF>15min die Autokorrelation zu verschwinden scheint (nicht beobachtet) - ich habe es nicht persönlich überprüft... und dies ist noch nicht der Index, den ich brauche...

Es ist sinnlos, bei der Modellierung von Kursbewegungen mit adäquaten TF's nach Autokorrelation zu beten... Und es macht keinen Sinn, nach jedem Tick ein Modell zu verwenden (wie bei der Ableitung von Regularitäten, noch dazu von langfristigen)... imho (aber mit höherer Wahrscheinlichkeit)...

ABER rekurrente neuronale Netze leiten die Informationen nur vorwärts weiter (mit dem Aufkommen der Boltzmann-Maschinen begann man, sie für mehrschichtiges probabilistisches Lernen zu verwenden)... obwohl es bereits geklungen hat

Rekurrente Netze und Bayes'sche Methoden haben für sich genommen weder die Fähigkeit bewiesen, das "Gedächtnis" aus Finanzzeitreihen herauszuholen, noch Schlussfolgerungen über das robusteste Modell für neue Daten zu ziehen.

Aus diesem Grund werden rekursive Netze mit Backpropagation des Fehlers und seiner dy/dx-Minimierung bei realen Problemen verwendet (da sie gerade wegen ihrer dy/dx-Minimierungsfähigkeiten die Integration ermöglichen)

p.s.

Im Allgemeinen ist es für mich die gleiche Monte-Carlo-Methode - nur eben maschinell... Ich sehe noch nichts Neues in der Vorwärtssuche mit Backpropagation... rein terminologisch...

p.p.s

außer, dass man mit Theano etwas ausprobieren kann, ohne viel PC-Ressourcen zu verbrauchen (obwohl TensorFlow angepriesen wurde)...

und was Y und was X ist, liegt im Ermessen des Entwicklers (entweder a priori oder als Ergebnis einer statistischen Analyse)... Wenn Sie gut mit Python sind -- in Sklearn sind sogar 2-in-1 Merkmale bereits in einigen Methoden implementiert? Beispiele! -- und die Merkmalsbedeutung macht sich selbst und ML macht sich selbst -- ein paar Zeilen zu (wie Sie corrcoef in ein paar Zeilen gefunden haben)

 
LenaTrap #:

Auf dem realen Markt? Ich persönlich habe eine Art Philosophie, die so aussieht:

*wollen aber nicht wirklich darüber diskutieren, denn ohne Beweise ist es sinnlos, über Annahmen zu diskutieren

! im echten Handel - verdrehen Sie nicht den Sinn...

Ja, die Philosophie ist in der Tat für jeden anders... der Zweck der Statistik besteht darin, die Varianz zu erklären

und formalisieren Abhängigkeiten von unabhängigen Tests

 
Arztnummer:

Ich habe eine weitere Frage. Betrachten Sie den ACF benachbarter Werte in einer Stichprobe von unendlichem Umfang. Zum Beispiel: t1=1, t2=2. Wir erhalten ACF =sqrt(0,5) ~ 0,707. Nun nehmen wir andere Nachbarwerte, z. B.t1=10000, t2=10001. Wir erhalten ACF = 1 (fast). Es stellt sich heraus, dass benachbarte Werte unterschiedlich zueinander korreliert sind. Ist das normal?

Ja, das stimmt. Dies ist der zweite Grund für die Nicht-Stationarität von SB (der erste ist die Zunahme der Varianz mit der Zeit). Nur bei stationären Prozessen hängt die ACF nur von der Zeitdifferenz ACF(t1,t2)=ACF(t1-t2) ab (schon aufgrund ihrer Definition). Aus diesem Grund wird die ACF bei stationären Reihen gewöhnlich als Funktion eines Arguments t1-t2 geschrieben.

 
Doc #:

Die Frage sollte natürlich an Alexej gerichtet werden. Aber ich würde mit "egal" antworten. Ich nehme an, die Frage ist, dass SB einen Weg zurücklegt, der proportional zu sqrt(t) ist.

Gemeint war das berühmte "Spieler-Ruin"-Problem. Sie könnte beispielsweise verwendet werden, um die statistische Signifikanz der Auswirkung von Preisen zu testen, die ein bestimmtes Niveau "anstreben".

 
Aleksey Nikolayev #:

Gemeint war das berühmte "Player Busting"-Problem. So könnte beispielsweise die statistische Signifikanz der Wirkung von Preisen, die auf ein bestimmtes Niveau "streben", getestet werden.

Das ist viel interessanter.

Vielleicht sollten wir den Standpunkt aufgeben, dass der Markt eine Zeitreihe ist, und endlich einen Durchbruch in der Marktanalyse erzielen.

 
Aleksey Nikolayev #:

Ja, das stimmt. Dies ist der zweite Grund für die Nicht-Stationarität von SB (der erste ist die Zunahme der Streuung mit der Zeit). Nur bei stationären Prozessen hängt die ACF nur von der Zeitdifferenz ACF(t1,t2)=ACF(t1-t2) ab (schon aufgrund ihrer Definition). Aus diesem Grund wird ACF bei stationären Reihen gewöhnlich als Funktion eines Arguments t1-t2 geschrieben.

GUT. Lassen Sie mich die Frage anders formulieren. Unterscheiden sich die beiden unten beschriebenen Situationen voneinander?

1) Wir haben eine Stichprobe von unendlicher Größe. Betrachten Sie zwei Zeitpunkte n und (n-t). Beachten Sie, dass 1 <= (n-t) <= n. Berechnen SieACF((n-t),n)=sqrt((n-t)/n).

2) Wir haben eine Stichprobe der Länge n. Berechnen Sie den ACF der Stichprobe mit Verzögerung t:ACF(t) =sqrt((n-t)/n).

 
JeeyCi #:

Obwohl ich aus irgendeinem Grund den Eindruck habe, dass, wenn man nicht die Delta-Änderung des Merkmals über die Zeit nimmt, sondern einen Index kontrahiert, vielleicht der Effekt der Autokorrelation dieser sich überschneidenden Werte im Zeitraum irgendwie ausgeglichen werden kann... das ist fraglich... denn close(t)/close(t-1) haben auch eine Schnittmenge und damit eine Autokorrelation... obwohl bei TF>15min die Autokorrelation zu verschwinden scheint (nicht beobachtet) - ich habe es nicht persönlich überprüft... und es ist noch nicht der Index, den ich brauche...


Sie brauchen es wahrscheinlich nicht, aber mit jedem Trend beginnen die Zeitreihendaten eine Autokorrelation aufzuweisen, die manchmal sehr hoch ist und theoretisch viele Analysemodelle/neuronale Netze stören sollte.

Dieser Effekt ist wirklich schwierig für Prognosen zu nutzen, denn nichts ist von Dauer, der Trend ändert sich mit dem Rang, das Chaos mit der Ordnung, zufällig wandernde Zeitreihen können plötzlich gar nicht mehr wandern, und umgekehrt, und durch eine solche Schätzung kann man die Prozessstruktur nicht verstehen, es ist zu einfach, es wäre wie der Handel über 200SMA.

Aber vielleicht lohnt es sich trotzdem, zu prüfen, wie Ihr neuronales Netz auf Autokorrelationen reagiert, und zu versuchen, sie zu entfernen, falls sie existieren und stören. Benachbarte Elemente sollten sich überhaupt nicht überschneiden (wenn ich das richtig sehe?), und wenn Sie solche Daten verwenden, wäre es ein großes Wunder, wenn das Modell funktionieren würde.

 
LenaTrap #:

Sie brauchen es wahrscheinlich nicht, aber bei jedem Trend werden die Zeitreihendaten

Verdrehen Sie es nicht: Wenn Sie versuchen, mit mir zu streiten, reden Sie immer noch über Ihre... nur über die Zeitreihen... (und niemand hat die Probenahmeverfahren aufgehoben)...

Der Preis ist auf lange Sicht keine Funktion der Zeit, das habe ich schon oft gesagt (und ich werde es nicht wiederholen)... Ich habe Ihnen gezeigt, wo Sie Autokorrelation in DL erhalten können... und was Sie für X und Y und für die Modellierung welcher Abhängigkeiten verwenden müssen - ich habe es auch zum 10. Mal geschrieben - es liegt im Ermessen des Entwicklers...

Ich bin nicht der Entwickler Ihres Modells - ich muss das Verhalten des Preises im Laufe der Zeit nicht beweisen... (vielleicht hätte ich nicht auf die DL kritzeln sollen - jeder hier denkt über etwas nach und widerlegt es oder beweist jemandem etwas - und nimmt ein Wort aus jeder Disziplin)... Ingenieure, die sich mit MO befassen (und die nicht hier sind), werden die Enge der Autokorrelationsdebatte immer noch verstehen (um des nerdigen Geredes willen), egal ob es sich um einen Trend oder einen Tick handelt, wenn das Modell in einem viel breiteren Aspekt und auf einem breiteren Horizont der Lernmenge aufgebaut ist als dem Horizont, an dem Ihre Flöhe (Autokorrelation) herauskommen können... dafür ist das Deep Learning da (um alles zu berücksichtigen)

... Für mich ist die Frage des Handels kein Thema:

Aleksey Nikolayev #:

Das berühmte "Spieler-Ruin"-Problem.

... ... deshalb vermeide ich diesen Unsinn schon seit langem ... es hat sich gezeigt, dass niemand hier eine Ahnung vom Modellieren hat, und diejenigen, die eine haben, verschwenden ihre Zeit nicht mit diesem Thema ... ok, es gibt viel mehr nützliches DL-Zeug im Netz als all das unverhohlene Jargon, das Sie hier ohne guten Grund von sich gegeben haben ...

Für Statistiken sollten Sie wirklich besser mit akademischen Mathematikern sprechen, ich sollte nicht antworten... - Es interessiert mich nicht, ob Sie glauben, dass Autokorrelation die DL beherrscht... - zum 5. Mal schrieb ich "es ist ein schlechtes Modell" (ich will nicht das 10. Mal schreiben)... Lassen Sie sich von Ihren Akademikern antworten (wenn meine Antwort Sie dazu gebracht hat, etwas beweisen zu wollen)

 
Arztnummer:

Nun gut, in Ordnung. Lassen Sie mich die Frage anders formulieren. Unterscheiden sich die beiden unten beschriebenen Situationen voneinander?

1) Wir haben eine Stichprobe von unendlicher Größe. Betrachten Sie zwei Zeitpunkte n und (n-t). Beachten Sie, dass 1 <= (n-t) <= n. Berechnen SieACF((n-t),n)=sqrt((n-t)/n).

2) Wir haben eine Stichprobe der Länge n. Wir berechnen den ACF der Stichprobe mit Verzögerung t:ACF(t) =sqrt((n-t)/n).

Der Unterschied besteht darin, dass im ersten Fall ACF für alle möglichen Paare von Zeitpunkten betrachtet wird, während im zweiten Fall einer der Zeitpunkte t2=n festgelegt wird und viele Paare von Zeitpunkten( z. B. das Paar t1=1, t2=2) nicht berücksichtigt werden. Im Allgemeinen ist der ACF eine Funktion von zwei Argumenten. Nur bei stationären Prozessen kann die ACF als Funktion eines Arguments t=t1-t2 (Lag) betrachtet werden.

Der Stichproben-ACF wird immer aus einer bestimmten numerischen Stichprobe (Realisierung) eines Prozesses berechnet und erweist sich immer als eine Funktion eines Arguments (Verzögerungswert). Dies ist der Hauptgrund, warum der Stichproben-ACF für eine SB-Implementierung keine Schätzung für den ACF darstellt.)