Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2537

 
Aleksey Vyazmikin #:

Was ist, wenn das Ziel nicht zufällig festgelegt ist?

Wie? Einen der Eingänge mit dem Ausgang duplizieren? Sie wird es schon lernen. Ich glaube, ich habe es sogar ausprobiert.

Aleksey Vyazmikin #:

Ich habe gerade ein Experiment durchgeführt - meine Stichprobe ist normalerweise in drei Teile aufgeteilt, also habe ich sie genommen, zu einer Stichprobe kombiniert und ein Modell mit 100 Bäumen trainiert, dann gesehen, welche Prädiktoren nicht verwendet wurden, und sie blockiert. Dann habe ich das Modell wie üblich trainiert, wobei ich das Übertraining in der zweiten Stichprobe gestoppt habe, und die Ergebnisse in der dritten Stichprobe mit der Variante verglichen, wenn ich ohne Ausschluss von Prädiktoren trainiere. Es stellte sich heraus, dass die Ergebnisse bei den ausgewählten Prädiktoren besser waren, und hier finde ich es schwierig, diesen Effekt auf Gedanken wie "die Auswahl der verschiedenen Prädiktoren erfolgt aufgrund des Unterschieds in den Stichproben auf dem Intervall, durch das Training auf der gesamten Stichprobe wählen wir automatisch Prädiktoren, die nicht verlieren ihre Bedeutung im Laufe der Zeit" zu schließen.

Ja, Sie haben etwas ausgewählt, das in der Zukunft Auswirkungen haben wird. Es kann sogar sein, dass es in der Vergangenheit wenig Einfluss hatte, aber wegen seines guten Einflusses in der Zukunft auf den Durchschnitt der gesamten Stichprobe ausgewählt wurde.

Aleksey Vyazmikin #:

Bedeutet dies jedoch, dass das Modell über einen längeren Zeitraum umso robuster ist, je größer die Stichprobe ist? Können die Prädiktoren für das Lernen auf diese Weise ausgewählt werden, d. h. fördert dies nicht das Überlernen?

Wie man so schön sagt - der Markt verändert sich. Neue Spieler kommen ins Spiel, erschaffen neue Roboter und schalten alte aus, usw. Ich denke, dass das Modell bei einer sehr großen Stichprobe zu einem durchschnittlichen Ergebnis für alle diese Veränderungen kommen wird, möglicherweise zu einem Nullwert. Ich denke, man muss die Tiefe des Trainings an die maximale Effizienz anpassen und regelmäßig trainieren. Ich selbst experimentiere mit demselben Zeitraum (z. B. 2-Jahres-Test, Nachschulung an Samstagen, Datenmenge von einigen Tagen bis zu einem oder zwei Jahren).
Theoretisch wäre es besser, den Umfang der Trainingsstichprobe für jede Umschulung automatisch festzulegen. Aber bis jetzt weiß ich nicht, wie.

Aleksey Vyazmikin #:
Im Allgemeinen hörte ich eine Empfehlung von den Gründern von CatBoost, dass ich Hyperparameter des Modells finden und dann dummerweise alle verfügbaren Proben für die Verwendung des Modells in der Arbeit trainieren sollte.

Creators won't advise bad) Ich greife Hyperparameter auf Walking-Forward (VF) auf, da die Datenkonsistenz erhalten bleibt und man hier einfach die Tiefe der Geschichte für das Lernen aufgreifen kann, indem man den Einfluss alter Daten abbaut. Sie können auch die Kreuzvalidierung (CV) verwenden, wenn sich die Daten im Laufe der Zeit nicht ändern, aber hier geht es nicht um Märkte.
Nach der Auswahl, natürlich sollten wir lernen, bis zum gegenwärtigen Zeitpunkt und verwenden Sie das Modell für die Zeit, die Sie hatten in der Vorwärts-TP oder TP.
Indem Sie auf der gleichen Fläche wie die Testfläche trainieren, passen Sie das Modell und die Hyperparameter an diesen einen Test an. Und wenn man 10-50 Mal mit KV oder VF trainiert, findet man die besten Hyperparameter für einen großen Teil der Geschichte.
Vielleicht ist es besser, oder ich bin einfach zu faul, einmal pro Woche die Hyperparameter aufzurufen)) Was also wirklich besser ist - die Praxis wird es zeigen.

 
elibrarius #:
Theoretisch wäre es besser, die Größe der Trainingsstichprobe für jede Umschulung irgendwie automatisch zu bestimmen. Aber bis jetzt weiß ich nicht, wie

UM DEN DURCHSCHNITT ZU BESTIMMEN

wenn die Größe der Gen-Schöpfung unbekannt ist, die Größe der Wiederholungsstichprobe berücksichtigen

n=(t^2*sigma^2)/delta_y^2

- für Zufallsstichproben (für geschichtete und serielle Stichproben wird die Formel etwas komplizierter)

d.h. wir müssen das erforderliche Konfidenzniveau P und den entsprechenden Zuverlässigkeitskoeffizienten t=2 für ein Konfidenzniveau von 95% bestimmen... eine zulässige maximale Fehlerspanne (der Branchenexperte sollte sie selbst kennen, wenn Sie Händler sind) in den Divisor... und Varianz (sigma), die unbekannt ist, aber aus früheren Beobachtungen bekannt sein kann...

Im Allgemeinen ist es das, worüber ich meine Zweifel schrieb, als ich über gleitende Fenster [im Prinzip kann man sagen "Stichprobengröße"] und t-Statistiken sprach, um einen flachen Trend und die Wahrscheinlichkeit zu definieren, "wo wir sind" - um auf RS zu verwerfen oder RS zu absorbieren...

Natürlich nur, wenn Ihr Merkmal normalverteilt ist und der Hauptfaktor ist, der das Ergebnis beeinflusst (Sie haben vielleicht schon dy/dx->min definiert)... es handelt sich nicht um ein Multifaktormodell (ich denke, in diesem Fall kann man den höchsten Wert aus den berechneten Werten nehmen... imho)

UM DEN ANTEIL DES MERKMALS ZU BESTIMMEN

auf dieselbe Weise, aber anstelle von Fehler- und Varianzwerten des Mittelwerts sind der Grenzfehler des Anteils (delta_w) und die Varianz eines alternativen Attributs w(1-w) zu verwenden

wenn die Häufigkeit (w) nicht einmal annähernd bekannt ist, wird bei der Berechnung der maximale Wert der Anteilsvarianz berücksichtigt, 0,5(1-0,5)=0,25

cboe für Optionen in der Asymmetrieauswertung Minuten vor dem Verfallsdatum des 2x nächstgelegenen K_opt (als alternative Indikation) einbeziehen...

oder beliebige andere Zeichen für Geschmack und Farbe (falls keine Optionen)

p.s. ungefähr wie hier

p.p.s. Das ist logisch, und wie man die Berechnung der Stichprobenadäquanz bei der Modellbildung mit unbekannter Genpopulation umsetzt, ist eine Frage der Verfügbarkeit von Rohdaten und der Logik... aber 2 Jahre scheint mir eine normale Spanne für die Bevölkerung zu sein... imho

Определение объема выборки
Определение объема выборки
  • 2013.08.16
  • baguzin.ru
Ранее мы рассмотрели методы построения доверительного интервала для математического ожидания генеральной совокупности. В каждом из рассмотренных случаев мы заранее фиксировали объем выборки, не учитывая ширину доверительного интервала. В реальных задачах определить объем выборки довольно сложно. Это зависит от наличия финансовых ресурсов...
 
JeeyCi #:

UM DEN MITTELWERT ZU BESTIMMEN

Ist die Größe der Grundgesamtheit unbekannt, wird das Volumen der Wiederholungsstichprobe für eine Zufallsstichprobe berücksichtigt (bei geschichteten und seriellen Stichproben wird die Formel etwas komplizierter)

n=(t^2*sigma^2)/delta_y^2

d.h. es ist notwendig, eine erforderliche Konfidenzwahrscheinlichkeit P und einen entsprechenden Konfidenzkoeffizienten t=2 für ein Konfidenzniveau von 95% zu definieren... eine zulässige maximale Fehlerspanne (der Branchenexperte sollte sie selbst kennen, wenn Sie Händler sind) in den Divisor... und Varianz (sigma), die unbekannt ist, aber aus früheren Beobachtungen bekannt sein kann...

Im Allgemeinen ist es das, worüber ich meine Zweifel schrieb, als ich über gleitende Fenster [im Prinzip könnte man sagen "Stichprobengröße"] und t-Statistiken sprach, um einen flachen Trend und die Wahrscheinlichkeit zu definieren, "wo wir sind" - um auf RS zu verwerfen oder RS aufzunehmen...

Natürlich nur, wenn Ihr Merkmal normalverteilt ist und der Hauptfaktor ist, der das Ergebnis beeinflusst (Sie haben vielleicht schon dy/dx->min definiert)... es handelt sich nicht um ein Multifaktormodell (ich denke, in diesem Fall kann man den höchsten Wert aus den berechneten Werten nehmen... imho)

UM DEN ANTEIL DES MERKMALS ZU BESTIMMEN

das Gleiche, aber anstelle von Fehler- und Varianzwerten des Mittelwerts werden Grenzfehler des Anteils (delta_w) und Varianz des alternativen Merkmals w(1-w) verwendet

cboe für Optionen, bei der Schätzung der Asymmetrie setzen Minuten bis zum Verfallsdatum von 2 am nächsten K_opt (als alternative Attribute)...

oder beliebige andere Zeichen für Geschmack und Farbe (falls keine Wahlmöglichkeiten bestehen)

p.s. ungefähr wie hier

p.p.s. Das ist logisch, und wie man die Berechnung der Stichprobenadäquanz bei der Modellbildung mit unbekannter Genpopulation umsetzt, ist eine Frage der Verfügbarkeit von Rohdaten und der Logik... aber 2 Jahre scheint mir auch eine normale Spanne für einen Genpool zu sein... imho

zur Ermittlung des Durchschnitts:
(Hoch+Tief)/2
 
Vladimir Baskakov #:
für die Definition von Durchschnitt:
(Hoch+Tief)/2

Ich möchte Sie nicht verärgern, aber "Durchschnitt", (hoch+niedrig)/2, kann streng genommen überhaupt nicht genannt werden, es gibt akademischere Bezeichnungen dafür. Der Zeitpunkt der Ereignisse ist unbekannt und unregelmäßig und unregelmäßig.

 
Maxim Kuznetsov #:

Ich möchte Sie nicht verärgern, aber "Durchschnitt", (hoch+niedrig)/2, kann streng genommen überhaupt nicht genannt werden, es gibt akademischere Namen für solche Dinge. Der Zeitpunkt der Ereignisse ist unbekannt und unregelmäßig und unregelmäßig.

Ich denke, das ist der durchschnittlichste aller Durchschnitte.
 
Maxim Kuznetsov #:

Der zeitliche Ablauf der Ereignisse ist unbekannt und unregelmäßig.

In der Tat, aus Gewohnheit verliere ich die "Ereignisse" aus den Augen, während ich über "Zeichen" nachdenke... - Ich vergesse immer wieder... Danke, dass Sie mich an das Wort erinnert haben...! - Hier kommt das Bayes-Theorem ins Spiel, der Logik nach zu urteilen, also nehme ich an

 
Vielleicht ist es albern, aber ich verwende ungern etwas anderes als "close". Wenn ich eine Reihe von Beobachtungen (Entschuldigung) aus der Nähe habe, weiß ich immer, dass zwischen den Beobachtungen ein fester Zeitraum liegt (er ist immer derselbe, stabil und mir bekannt). Aber bei der Verwendung von niedrig / hoch und verschiedene Berechnungen mit ihnen, finde ich..... eine zufällige Zeitspanne zwischen den Beobachtungen, die immer unterschiedlich ist, von einer Beobachtung zur anderen.
 
LenaTrap #:
Vielleicht ist es albern, aber ich mag es nicht, etwas anderes als Close zu benutzen. Wenn ich eine Reihe von Beobachtungen (Entschuldigung) aus der Nähe habe, weiß ich immer, dass zwischen den Beobachtungen ein fester Zeitraum liegt (er ist immer derselbe, stabil und mir bekannt). Aber bei der Verwendung von niedrig / hoch und verschiedene Berechnungen mit ihnen, finde ich..... eine zufällige Zeitspanne zwischen den Beobachtungen, die immer unterschiedlich ist, von einer Beobachtung zur anderen .

über die Zufälligkeit und immer anders ist natürlich machanuto... das ist eigentlich der ganze Zweck des Studiums all dieses Tohuwabohu - zu bestimmen hoch / niedrig mehr oder weniger genau in der Zeit und Preis :-)

 
LenaTrap #:
Vielleicht ist es albern, aber ich mag es nicht, etwas anderes als Close zu benutzen. Wenn ich eine Reihe von Beobachtungen (Entschuldigung) aus der Nähe habe, weiß ich immer, dass zwischen den Beobachtungen ein fester Zeitraum liegt (er ist immer derselbe, stabil und mir bekannt). Aber bei der Verwendung von niedrig / hoch und verschiedene Berechnungen mit ihnen, finde ich..... eine zufällige Zeitspanne zwischen den Beobachtungen, die immer unterschiedlich ist, von einer Beobachtung zur anderen.

Wenn man streng mathematisch vorgeht, ist es notwendig, Open zu verwenden, denn nur für ihn ist der Zeitpunkt seines Tick-Empfangs markovianisch - er ist eindeutig als Eröffnung definiert (unter der Annahme idealer Stunden und des Fehlens von fehlenden Kursen). Der Abschluss zum Zeitpunkt des Tick-Empfangs kann bis zum Ende des Zeitrahmensegments nicht eindeutig als Abschluss definiert werden.

Üblicher ist es jedoch, mit einer geschlossenen Gruppe zu arbeiten. Wahrscheinlich ist es dasselbe wie früher, als man mit Tageskursen arbeitete.

 
Aleksey Nikolayev #:

Wenn der mathematische Ansatz streng ist, dann sollte Open verwendet werden, denn nur bei diesem ist der Zeitpunkt der Ankunft des Ticks markovianisch - er ist eindeutig als Opening definiert

Technisch gesehen ist der Schlusskurs der einzige Kurs mit verlässlicher Zeitangabe, d.h. im Moment des Wechsels von einem Balken zum nächsten ist der Kurs genau gleich dem Schlusskurs.

Wenn dieser erste Tick 10 Minuten nach dem Balkenwechsel auftritt, bedeutet dies, dass der Eröffnungskurs der Preis dieses Moments ist.