Analysieren Sie die wichtigsten STATISTISCHEN Merkmale des Musters und wählen Sie eine Methode, um darauf zu handeln. - Seite 3

 
Aliaksandr Hryshyn:

Man kann auch Perzentile verwenden, das ist einfacher zu berechnen, man braucht mehr Daten, damit es keine Überraschungen gibt...

Gab Hinweise, wo zu graben ist.) Trotzdem können Sie eine Menge tun....


Ich werde über Perzentile lesen, danke )
 
Alexander Laur:

Irgendetwas sagt mir, dass die Wahrscheinlichkeit nahe bei 50 % liegen wird. :)

Was ist es? Was ist das für ein Gefühl?
 
Alexander Laur:


Wahrscheinlich Erfahrung. :)


Oh, wie viele wundersame Entdeckungen
Der Geist der Erleuchtung
Und Erfahrung, [Sohn der] schwierigen Fehler,
Und Genius, [paradoxer] Freund,
(und der Zufall, der Gott der Erfindungen)
 

Schauen Sie in der Codebase nach dem Indikator für den nächsten Nachbarn. Die Methode ist recht einfach. Sie legen die Länge des aktuellen Musters fest, finden ähnliche Muster aus der Vergangenheit (z. B. verwenden Sie die Korrelation als Abstand zwischen den Mustern) und prognostizieren das künftige Kursverhalten aus vergangenen Mustern, indem Sie deren individuelle Vorhersagen gewichten. Dies ist im Wesentlichen dasselbe wie Clustering oder RBF oder SVM oder GRNN. Es hängt alles davon ab, wie man den Abstand zwischen dem aktuellen Muster und ähnlichen Mustern aus der Vergangenheit misst. Lesen Sie über GRNN und Bayes. Dort wird die Vorhersagetheorie in Form von statistischen Verteilungen beschrieben. Über GRNN und die oben erwähnten Vorhersagemethoden ist viel geschrieben worden, und alles lässt sich auf eine einfache Formel bringen:


Vorhersage y = SUM y[k]*exp(-d[k]/2s^2) / SUM exp(-d[k]/2s^2)


wobei y[k] das k-te vergangene Muster und d[k] der Abstand zwischen dem k-ten Muster und dem aktuellen Muster ist. Wenn Abstände eine Gaußsche Verteilung haben, dann ist d[k] = (x - x[k])^2. Für eine beliebige (supergaußsche) Verteilung gilt d[k] = |x - x[k]|^p, wobei p je nachdem gewählt wird, ob man den engsten Nachbarn mehr Gewicht geben will (großes p) oder allen Nachbarn fast das gleiche Gewicht (kleines p) wie im Sozialismus. Wenn p=0 ist, haben wir den totalen Sozialismus.

Nachdem wir uns mit den nächsten Nachbarn und GRNN vertraut gemacht haben, stellt sich die nächste naheliegende Frage. Wie misst man den Abstand zwischen dem aktuellen Muster und früheren Mustern, wenn man Verzerrungen auf der Zeitachse berücksichtigt (d. h. frühere Muster können wie das aktuelle Muster aussehen, aber entweder zeitlich gestreckt oder gestaucht). Genau hier liegt das Problem.

 
Vladimir:

Genau hier liegt das Problem.


Ich habe diesen Hund bereits gegessen, die Frage ist jetzt eine andere. Vielleicht ist es nicht ganz richtig :)

Aber Ihre Veröffentlichungen sind sehr interessant, danke, ich werde sie mir ansehen.

 
Vladimir:

wenn die Verzerrung der Zeitachse berücksichtigt wird (d. h. vergangene Muster können wie das aktuelle Muster aussehen, sind aber zeitlich gestreckt oder gestaucht). Hier ist der Hund begraben.

Diese Aussage hat zur Folge, dass dieser Hund derzeit nur aufgrund der begrenzten Rechenressourcen nicht entdeckt wird.

Das scheint ein Widerspruch zu sein: Wenn man so viele Rechenressourcen hat, wie man braucht, kann jeder Hund aufgedeckt werden. So hängt die Lösung eines jeden Problems nur von der Menge der verfügbaren Rechenressourcen ab.

Im Allgemeinen ist die Logik, gelinde ausgedrückt, seltsam. Wenn sie also sagen, "der Hund liegt dort begraben", und sich damit indirekt über die Unlösbarkeit von Berechnungen im Moment beschweren, können wir mit Sicherheit sagen, dass es dort keinen Hund gibt.

 
fxsaber:

Diese Aussage hat zur Folge, dass dieser Hund derzeit nur aufgrund der begrenzten Anzahl von Rechenressourcen nicht freigeschaltet wird.

Das scheint ein Widerspruch zu sein: Wenn es so viele Rechenressourcen gibt, wie es gibt, dann kann jeder Hund aufgeschlossen werden. So hängt die Lösung eines jeden Problems nur von der Menge der verfügbaren Rechenressourcen ab.

Im Allgemeinen ist die Logik, gelinde ausgedrückt, seltsam. Wenn sie also sagen, dass der Hund dort begraben ist", und sich damit indirekt über die Unlösbarkeit von Berechnungen im Moment beschweren, können wir mit Sicherheit sagen, dass es dort keinen Hund gibt.


Das alles geschieht über affine Transformationen... und es erfordert nur minimale Ressourcen... mit dem richtigen Ansatz
 
Maxim Dmitrievsky:

Das alles geschieht durch affine Transformationen... und es erfordert nur minimale Ressourcen... mit dem richtigen Ansatz

Der Gral hat nicht funktioniert - der Ansatz war nicht kompetent genug!

Aus welchem Grund ist diese Aussage so populär geworden?

 
fxsaber:

Der Gral hat nicht funktioniert - der Ansatz war nicht kompetent genug!

Was war der Grund dafür, dass diese Aussage so populär wurde?


Nun, der Teufel steckt immer im Detail... es ist nicht der Gral, den wir brauchen, aber zumindest etwas Nützliches :)

Das Problem ist, dass die Leute nicht wissen, was sie tun, denke ich... und wofür

 
Vladimir:

Vorhersage y = SUM y[k]*exp(-d[k]/2s^2) / SUM exp(-d[k]/2s^2)


wobei y[k] das k-te vergangene Muster und d[k] der Abstand zwischen dem k-ten Muster und dem aktuellen Muster ist. Wenn Abstände eine Gaußsche Verteilung haben, dann ist d[k] = (x - x[k])^2. Für eine beliebige (supergaußsche) Verteilung gilt d[k] = |x - x[k]|^p, wobei p je nachdem gewählt wird, ob man den engsten Nachbarn mehr Gewicht geben will (großes p) oder allen Nachbarn fast das gleiche Gewicht (kleines p), wie im Sozialismus. Wenn p=0 ist, haben wir den totalen Sozialismus.

Nachdem wir uns mit den nächsten Nachbarn und GRNN vertraut gemacht haben, stellt sich die nächste naheliegende Frage. Wie misst man den Abstand zwischen dem aktuellen Muster und früheren Mustern, wenn man Verzerrungen auf der Zeitachse berücksichtigt (d. h. frühere Muster können wie das aktuelle Muster aussehen, aber entweder zeitlich gestreckt oder gestaucht). Genau hier liegt das Problem.

Haben Sie versucht, eine Konfliktanalyse durchzuführen? D.h. die Funktion sollte nicht ein Preis auf Zeit p = x(i) sein, sondern zweidimensional f = z(i, p). Die Entfernung d wird durch zwei Koordinaten bestimmt. Und die anderen Formeln sind die gleichen.
Grund der Beschwerde: