Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3281
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
nicht normierte Kreuzkorrelationen )
Kreuzkovarianz.Nun, Sie brauchen Pearson.
Nun, Sie brauchen Pearson.
Ich weiß nicht, wie ich es machen soll, und ich bin müde.
So ähnlich.
Ich bin mir nicht sicher, wie ich es machen soll, und ich bin müde.
etwas Ähnliches
Ja, das ist es nicht.
Richtig, falsch.
Es ist fast etwas, schlagen Sie es nach, ich bin weg.
Schnelles Auffinden ähnlicher kurzer Zeichenfolgen in einer langen Zeichenfolge.
Die Suche nach ähnlichen kurzen Zeichenfolgen (300) in der millionsten Zeichenfolge dauert bei einer solchen Implementierung über Alglib mehr als sechs Sekunden.
Ich habe es beschleunigt.
Ergebnis.
Jetzt in 300 Millisekunden.
Jetzt in 300 Millisekunden.
Wenn keine Matrix es kann.
Es dauert drei Sekunden, um ähnliche 30K-Strings in einem 10M-String zu finden.
Wenn keine Matrix damit umgehen kann.
Es dauert drei Sekunden, um ähnliche 30K-Strings in einem 10M-String zu finden.
300/1M ist nicht fft, 30K/10M ist fft.
Wenn keine Matrix damit umgehen kann.
Es dauert drei Sekunden, um ähnliche Zeichenfolgen der Länge 30K in einer Zeichenfolge von 10M zu finden.
Beeindruckendes Ergebnis!
Ich habe eine Stichprobe von 2010 bis 2023 (47k Zeilen) genommen, sie in drei Teile in chronologischer Reihenfolge unterteilt und beschlossen, zu sehen, was passieren würde, wenn wir diese Teile austauschen.
Die Größe der Teilstichproben Zug - 60%, Test - 20% und Prüfung - 20%.
Ich habe diese Kombinationen gebildet (-1) - dies ist die Standardreihenfolge - chronologisch. Jede Teilstichprobe hat ihre eigene Farbe.
Ich habe 101 Modelle mit verschiedenen Seed für jede Gruppe von Proben trainiert und folgendes Ergebnis erhalten
Alle Metriken sind standardisiert, und es ist zu erkennen, dass es schwierig ist, den durchschnittlichen Gewinn der Modelle (AVR Profit) sowie den Prozentsatz der Modelle, deren Gewinn 3000 Punkte übersteigt, für die letzte Probe, die nicht am Training teilgenommen hat, zu bestimmen.
Vielleicht sollte die relative Erfolgsrate der Varianten -1 und 0 in der Trainingsstichprobe reduziert werden? Im Allgemeinen scheint es, dass Recall darauf reagiert.
Sollten Ihrer Meinung nach die Ergebnisse solcher Kombinationen in unserem Fall miteinander vergleichbar sein? Oder sind die Daten unwiederbringlich veraltet?