Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2745

 
JeeyCi #:


und statistische Tests für Regressionskoeffizienten dienen wozu? oder zum Testen von Hypothesen über die Gleichheit von Mittelwert und Varianz? (wenn die PCA immer noch zeigt, dass der 1. PC den akzeptablen Anteil der Varianz erklärt [die Restvarianz ist sehr klein] - dann akzeptieren Sie es und prüfen Sie die Bestätigung der Signifikanz der Regressionskoeffizienten)...).

Idealerweise - es ist klar, dass wir, um eine 100%ige Wahrscheinlichkeit zu haben, eher funktionale als Korrelationsbeziehungen verwenden sollten - aber wenn wir einen stochastischen Prozess untersuchen, werden die Ergebnisse nur probabilistisch sein und nur auf einer großen Anzahl von Testdaten bestätigt werden können und nur so lange, bis ein neuer Treiber auf dem Markt erscheint.... [hier ist übrigens auch das faktische/logische Bewusstsein sehr wichtig, nicht nur die robuste Analyse].

Die Anpassung an die Geschichte ist immer vorhanden, solange wir uns auf historische Daten verlassen..... aber wir können die Varianz immer durch F-Statistiken vergleichen - wenn die Varianzreduktion viel größer ist als die verbleibende unerklärte Varianz, dann ist eine neue Regression identifiziert. (mit dr SLOPE)... und das funktioniert nur bis zu einem Zeitpunkt in der Zukunft und nur bei großen Zahlen... nun, oder den Zustand des Akteurs wechseln (wenn DL verwendet wird)... aber der Fahrer weiß besser, als zu warten... aber es ist besser, den Treiber zu kennen, als zu warten, bis die aktuelle Probe gesammelt wird, um sie zu bestätigen.

Feature Engineering, wenn Sie logisch machen, haben Sie richtig bemerkt - "theoretisch" logisch (unter jeder Statistikverarbeitung gibt es irdische physikalisch-logische Gesetze und menschliches Wissen, Muster fallen nicht aus der Luft) -- [aber jemand kann Unwissenheit haben] -- dann wird FS im Prozess der Modellierung weder den Modellierer noch den Entwickler sehr stören.... und ohne Geschichte kommt man nirgendwo hin, um zu wissen, was wann zum Treiber wurde und was nicht - man braucht nicht viel Intelligenz in höherer Mathematik, nur Verständnis für die Gesetze des Geld- und Warenmarktes, des privaten und des staatlichen Sektors, ansonsten werden wir den Apparat der angewandten höheren Mathematik nur "im Nachhinein" benutzen, um zu erfahren, dass die Nachricht, die die Welt verändert hat, schon einmal gehört wurde.... Es ist nur so, dass die Reaktion des Marktes, auch die des Marktes, meist verzögert erfolgt.

p.s..

wem Worte und Buchstaben unbekannt sind, der lese nicht ein unbekanntes Thema mit unbekannten Buchstaben, um sich nicht an Buchstaben zu klammern - suchen Sie sich eine VM-Maschine für Ihre FS.... wenn ihr dann auch noch die statistische Validität eurer Ergebnisse nachweist, und nicht nur %% Trefferquote (die übrigens nicht immer unverzerrt ist)), dann werden die Gespräche anders.... Aber im Moment ist es so, dass jeder seine eigene Terminologie hat....

Es fing damit an, dass die Leute sich zusammenschließen wollten)) zu sortieren begann, stellte sich heraus, dass jeder alles abstreitet, was die anderen tun. Und sie erfinden neue Definitionen. Am Ende hat niemand mehr etwas verstanden. Ich mag den Ansatz von Sanych im Allgemeinen, deshalb habe ich nach Einzelheiten gefragt. Und auch bei Bezeichnungen ist es ein Problem, dass es eine Beziehung und einen Zusammenhang, wenn nicht gar eine Korrelation gibt.

Es ist offensichtlich, dass er sein Know-how schätzt und keine Details preisgibt.
 
Maxim Dmitrievsky #:
Es fing damit an, dass die Leute Co-op wollten.) Ich habe mich damit beschäftigt und herausgefunden, dass jeder alles leugnet, was andere tun. Und sie erfinden neue Definitionen. Am Ende hat niemand mehr etwas verstanden. Ich mag den Ansatz von Sanych im Allgemeinen, also habe ich nach Einzelheiten gefragt. Und auch bei Bezeichnungen, was ist Beziehung und Verbindung, wenn nicht Korrelation.

Offensichtlich schätzt er sein Know-how und gibt keine Details preis.

So wie ich das sehe, gibt es zwei Arten von Korrelation.

Die erste ist kausal, sie wird durch a priori Informationen über den Forschungsgegenstand aus dem Wissen des jeweiligen Fachgebiets bestimmt, nicht durch irgendwelche Berechnungen.

Die zweite Art ist die probabilistische Abhängigkeit, die a posteriori aus einigen Daten berechnet werden kann, die durch Beobachtung des Verhaltens des Objekts gewonnen wurden. Zum zweiten Typ gehören die Korrelation, die deterministische Abhängigkeit (als Extremfall) und so weiter, einschließlich der durch Kopulas und andere Methoden beschriebenen Abhängigkeit. Die Grundlage für die Untersuchung dieses Typs ist die Annahme, dass es eine gemeinsame Verteilung für Prädiktoren und Ziel gibt.

 
Aleksey Nikolayev #:

Meiner Meinung nach gibt es zwei Arten von Kommunikation.

Die erste ist die kausale, die durch a priori Informationen über den Forschungsgegenstand aus dem Wissen des jeweiligen Fachgebiets und nicht durch irgendwelche Berechnungen bestimmt wird.

Die zweite Art ist die probabilistische Abhängigkeit, die a posteriori aus einigen Daten berechnet werden kann, die durch Beobachtung des Verhaltens des Objekts gewonnen wurden. Zum zweiten Typ gehören die Korrelation, die deterministische Abhängigkeit (als Extremfall) und so weiter, einschließlich der durch Kopulas und andere Methoden beschriebenen Abhängigkeit. Die Grundlage für die Untersuchung dieses Typs ist die Annahme, dass es eine gemeinsame Verteilung für die Prädiktoren und das Ziel gibt.

Das ist richtig. In Ermangelung von A-priori-Annahmen wird der zweite Typ verwendet. Ich frage mich, wie Sanych das sieht. Wie zum Beispiel die Ziele konstruiert werden, können sie einfach an jedes Merkmal angepasst werden und umgekehrt.

Mein Ansatz ist ganz auf solche Manipulationen zugeschnitten, vielleicht lässt sich da noch etwas verbessern.
 
mytarmailS #:

Es gibt eine PCA, die das Ziel betrachtet, sie wird die Komponenten hervorheben, die das Ziel charakterisieren,

Das wird sie nie tun. Sie berücksichtigt nicht die Beziehung zum Ziel. - Sie wird lediglich eine orthogonale Projektion in den Merkmalsraum erstellen, die die maximale Varianz erklärt..... (Ich bin mir nur nicht sicher, ob die Rotation manuell durchgeführt werden sollte [ich glaube, im Statistika-Paket gab es etwas darüber - irgendeine Schaltfläche] oder ob es das automatisch herausfindet - andere Bibliotheken haben die Rotation vielleicht schon eingebaut).


mytarmailS #:

aber das Traurige ist, dass das Ziel eine subjektive Variable ist, die "schwebt", sobald die Spur beendet ist.... Und was ist der Unterschied zum normalen Lernen mit einem Lehrer?

Ja, leider haben Sie Ihre eigenen Interpretationen des Zwecks dieser Methode und Ihre eigenen Wege und Ziele, sie anzuwenden.... Ich weiß nicht, wie ich Ihnen mit solchen Ansichten helfen kann... - also brauchen Sie mich auch nicht mehr zu fragen.
 
JeeyCi #:
1) das wird es nie tun - es berücksichtigt keine Verbindungen zum Ziel!!!! - es wird einfach eine Projektion in den Merkmalsraum erstellen, die die maximale Varianz erklärt.... (Ich bin mir nur nicht sicher, ob die Rotation manuell durchgeführt werden sollte [ich glaube, im Statistika-Paket gab es etwas darüber - irgendeine Schaltfläche] oder ob es das automatisch herausfindet - andere Bibliotheken haben die Rotation vielleicht schon eingebaut).


2) ja, traurig - Sie haben Ihre eigenen Interpretationen des Zwecks dieser Methode und Ihre eigenen Wege und Zwecke, sie zu benutzen... Ich weiß nicht, wie es Ihnen mit solchen Ansichten helfen kann..... - also brauchen Sie mich auch nicht mehr zu fragen.

1) Ich sage, dass es RSAs gibt , die das Ziel berücksichtigen.

2) Ich habe nichts gefragt, ich habe es behauptet.

 

mytarmailS #:

1) Ich sage, dass esRSAs gibt, die dieZielsetzung berücksichtigen.

2) Ich habe keine Frage gestellt, sondern eine Behauptung aufgestellt.

dies sind bereits Algorithmen, um PCs künstlich an das Ziel zu binden - unterschiedliche Algorithmen (Software, die manchmal sogar unterschiedlich in verschiedenen Bibliotheken implementiert ist)... du könntest genauso gut PLS verwenden... wie du das Ziel an die Merkmale bindest, ist deine eigene Sache, es macht nicht den Sinn von PCA = "mit dem Lehrer" (der Lehrer ist separat gebunden - in der Tat - auf jede beliebige Art und Weise) -- wieder kommen wir vom Punkt weg und in das Thema "Geschmack und Farbe..." (Bibliotheken). (Bibliotheken).

Ich bin mir nicht einmal sicher, ob Sie wissen, ob Ihre Bibliothek die Rotation beherrscht oder ob Sie sie selbst programmieren müssen... Ungeprüfte und unvollständige/ungenaue Aussagen interessieren hier also niemanden, vor allem dann nicht, wenn sie die Bedeutung und das Wesen von Phänomenen/Objekten verändern, woraufhin du schreist, dass du die Worte nicht verstehst... du verstehst offenbar nicht einmal deine eigenen Worte richtig

 
JeeyCi #:

Ich bin mir nicht einmal sicher, ob Sie selbst wissen, ob Ihre Bibliothek die Rotation unterstützt oder ob Sie sie selbst programmieren müssen....

Urteilen Sie nicht selbst

(Ich bin mir nur nicht sicher, ob die Rotation manuell durchgeführt werden sollte [ich glaube, im Statistika-Paket gab es etwas darüber - irgendeine Schaltfläche] oder ob es automatisch herausgefunden wird - im anderen.

JeeyCi #:

also ungeprüfte und unvollständige/ungenaue Aussagen interessieren hier niemanden

Und wenn man sich nicht sicher ist, dann hat man auch kein Recht, irgendetwas zu behaupten , was geprüft wird. was nicht, wen interessiert das, wen nicht...., wenn der Kopf in Ordnung ist natürlich


ps Und ob es eine Drehung in der Matrix gibt, ist leicht zu prüfen, wenn man es versteht, aber anscheinend gibt es ein Problem damit.....

 

Überprüfen Sie es also, bevor Sie sich auf Leute stürzen,

- wenn du es nicht auf Anhieb verstehst, dann schütte bitte deine gurianischen/ungenauen Töne in deinen Code und deine Ergebnisse, anstatt nach den Extremen zu suchen

 
Was ist der Unterschied zu LDA? Bei den Zitaten erhält man eine enge Anpassung, die bei neuen Daten nicht funktioniert. Aber es reduziert den Fehler des darauf trainierten Modells auf fast Null. Eine ähnliche Situation kann sich beim Ansatz von Sanych ergeben. Das Prinzip ist dasselbe - Anpassung der Fliegen an die Cutlets

Aber ein gleitendes Fenster sollte etwas Freude bereiten, wenn Statistiken darüber gesammelt werden. Ich kann es mir noch nicht vorstellen.
 

Was für eine Steigerung der Beiträge!


Noch einmal.

Ich ordne die Prädiktoren nach ihrer Vorhersagekraft.

Ich verwende meinen eigenen Algorithmus, da die Algorithmen zahlreicher Pakete zu langsam sind - meiner ist weniger genau, aber sehr schnell.

Die Vorhersagefähigkeit ist NICHT die Korrelation und NICHT das Ergebnis der Auswahl der Prädiktoren, die die Modelle erzeugen.

Vorhersagefähigkeit ist Informationskorrelation und NICHT:

1. Korrelation ist die "Ähnlichkeit" einer stationären Reihe mit einer anderen, und es gibt immer einen Wert und keinen Wert für "keine Beziehung". Die Korrelation hat immer irgendeinen Wert, so dass man die Korrelation leicht verwenden kann, um die Beziehung zwischen einem Lehrer und Kaffeesatz zu finden.

2. Die Ficheselektion ist die Häufigkeit der Verwendung von Fichen bei der Erstellung von Modellen. Wenn wir Prädiktoren nehmen, die nichts mit dem Lehrer zu tun haben, erhalten wir immer noch eine Rangfolge der Fiches.

Ein Analogon zu meinem Verständnis von "Vorhersagekraft" ist zum Beispiel caret::classDist(), das Mahalanobis-Sampling-Distanzen für jede Klasse von Schwerpunkten definiert. Oder woeBinning. Es gibt viele Ansätze und viele Pakete in R. Es gibt weitere, die auf der Informationstheorie basieren.

Grund der Beschwerde: