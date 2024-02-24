Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1236
Liebe Förster. Ist es notwendig, einen Klassenausgleich für Bäume und Wälder vorzunehmen (die Anzahl der Beispiele für verschiedene Klassen auszugleichen)?
Nein
Nein
Ich lese gerade: Flach P. - Maschinelles Lernen. Die Wissenschaft und Kunst der Entwicklung von Algorithmen, die Wissen aus Daten gewinnen - 2015
Diesem Thema sind dort mehrere Seiten gewidmet. Das ist die Quintessenz:
Punkt 1 besagt, dass ein Ausgleich sinnvoll ist.
Aber es gibt auch Punkt 2, aus dem wir schließen können, dass bei einer großen Stichprobe, wenn es genügend Beispiele für eine kleine Klasse gibt, die Stichprobe für diese repräsentativ wird. Und dann ist das Abwägen unnötig.
Wie viele Beispiele können als repräsentativ für BP angesehen werden?
Und dann ist da noch Para. 3. aber es ist schwierig zu wissen, ob es eine solche Korrektur in der speziellen Implementierung des Baums in dem gewählten Programm gibt.
Meiner Meinung nach gibt der Afftar für MO das Gesetz der großen Zahlen an.
Wenn Sie 10 Beobachtungen in der ersten und 6 in der zweiten Klasse haben, wird das Modell durch die Hinzufügung von 4 Beobachtungen in der zweiten Klasse zwar verändert (nicht unbedingt verbessert), aber immer noch nicht repräsentativ sein.
Wie viele Beispiele können als repräsentativ für BP angesehen werden? Ich verwende normalerweise nicht weniger als 10000, bei kleinen Klassen sollten es mindestens 1000 sein.
Ja, er hat gerade die Beispiele 10 vs. 8:2 vs. 6:4 betrachtet. Aber wir haben eine Menge Daten.
Wie viele Beispiele können als repräsentativ für BP angesehen werden?
HZ. Ich habe das Maximum genommen, aber ich habe an täglichen Daten für Bäume und Wälder gearbeitet - ein Minimum von 2 Jahren.
Fragen Sie A_K - er hat die Tschebyscheffsche Ungleichung verwendet, um das Optimum zu bestimmen (wenn ich mich richtig erinnere), aber nur für kontinuierliche Variablen.
Versuchen Sie, von der Anzahl der Variablen auszugehen - mindestens 100 für jede.
Im Allgemeinen gilt: je mehr, desto besser, wenn Sie ein "immerwährendes" Muster finden wollen. Wenn das "Muster" fließend ist, müssen Sie nach dem optimalen Fenster suchen.
Allerdings werden wir noch Tausende hinzufügen, und dann kann sich auch das Modell ändern.
Und vielleicht ist es richtig. Der Markt ändert sich, wie man so schön sagt, also sollte sich auch das Modell ändern.
Verwenden Sie dafür Holz?
Ich benutze es noch nicht, aber ich bin dabei, es zu tun. Ich lese immer noch die Theorie, um ihre Vor- und Nachteile zu verstehen. Ich bin mit den Ergebnissen nicht zufrieden, also habe ich beschlossen, mit Wald zu arbeiten. Meines Erachtens ist es für BP besser geeignet.
Für die BP-Analyse, um Geld zu verdienen.
Ich benutze es noch nicht, aber ich bin dabei, es zu tun. Ich bin noch dabei, die Theorie zu lesen, um ihre Vor- und Nachteile zu verstehen. Da ich mit den Ergebnissen nicht zufrieden bin, habe ich mich für die Forstwirtschaft entschieden. Meines Erachtens ist es für BP besser geeignet.
Vor zwei Jahren habe ich an dieser Stelle geschrieben, dass NS ein Spielzeug wie eine Atombombe ist. Wenn JEDES andere Modell zumindest zufriedenstellende Ergebnisse liefert, ist es nicht empfehlenswert, NS zu verwenden - sie finden etwas, das nicht existiert, und man kann nichts dagegen tun.
Durch Bäume ist eine gute Sache, aber es ist besser, ein Gerüst zu benutzen.