Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3388
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Warum sind große Zahlen von Zeichen böse? Interessante Grafik aus einem Buch über Kozulu.
Wahrscheinlichkeit, dass das gleiche Beispiel in der Trainingsstichprobe gefunden wird, abhängig von der Anzahl der Merkmale.
Es ist nicht klar. Die Wahrscheinlichkeit, dass das gleiche Beispiel wie in der Trainingsstichprobe gefunden wird?
Nichts ist klar. Wahrscheinlichkeit des Auffindens, wo ist das gleiche Beispiel wie in der Trainingsstichprobe?
die gleiche Zeile im Datensatz
wenn Sie nur 1.000 Zeilen haben
Grob gesagt, wenn Sie mehr als 18 Merkmale haben, trainieren Sie einen Klassifikator, sich jede Zeile zu merken, weil sie sich nicht einmal wiederholen
und bei kausalen Schlussfolgerungen kann man keine Beispiele vergleichen, um Statistiken zu berechnen.1. Wie kommt man zu dieser Matrix? Wie lauten die Zahlen dort?
2. Ich spreche von Regeln. Bei meinem Ansatz ist es egal, wie und wovon die Regel abgeleitet wird, aber wenn die Antwort einer anderen in der Trainingsstichprobe ähnlich ist, enthält sie keine zusätzlichen Informationen.
Warum sind große Zahlen von Zeichen böse? Interessante Grafik aus einem Buch über Kozulu.
Wahrscheinlichkeit, dass das gleiche Beispiel in der Trainingsstichprobe gefunden wird, abhängig von der Anzahl der Merkmale.
Wenn man mehr als 14 (und sogar 10) Merkmale hat, erhält man eine Menge Regeln, die man nicht ohne Verlust reduzieren kann.
Das liegt alles im Bereich des Zufälligen...
Sie verwenden effiziente Komprimierungsalgorithmen innerhalb von Neuronics, wie z. B. sec2sec, das stimmt also auch.
Es verwendet effiziente Komprimierungsalgorithmen innerhalb von Neuronics, wie sec2sec, und ist daher auch fair.
Wenn es sich um einen Text handelt, wird in 95 % der Fälle der übliche Wortzähler verwendet, z. B. - wie oft kommt ein Wort in dieser Beobachtung vor? 0, 1, 103..
.
Das sind unterschiedliche Architekturen, Schichtkuchen. Es ist schwer zu vergleichen. Wir sprechen über normale Klassifizierung oder Regression. In diesem Fall scheint es ein universelles Gesetz zu sein.
Das sind andere Architekturen, Schichtkuchen. Es ist schwer zu vergleichen. Wir sprechen hier von gewöhnlicher Klassifizierung oder Regression. In diesem Fall sieht es wie ein universelles Gesetz aus.
----------------------------------------------------------------------
Oh, ich erinnere mich, man nennt es eine Tasche voller Wörter.
Was ist neu, ungewohnt, unverständlich, kompliziert?
Die gleiche Zeichentabelle + eine beliebige MO
Wir arbeiten mit unstrukturierten Daten (Text) und übersetzen sie dann in eine Bag-of-Words-Struktur und dann in alles andere, was wir wollen
Es ist alles das Gleiche.
----------------------------------------------------------------------
Oh, ich erinnere mich, man nennt es eine Tasche voller Wörter.
Was ist neu, ungewohnt, unverständlich, kompliziert?
Die gleiche Zeichentabelle + eine beliebige MO
Wir arbeiten mit unstrukturierten Daten (Text) und übersetzen sie dann in eine Bag-of-Words-Struktur und dann in alles andere, was wir wollen.
Das ist eine andere Sache. Unabhängig davon, wie man sie umwandelt, muss die Dimensionalität des Eingangsvektors unter dem angegebenen Schwellenwert liegen, sonst kann man kein Muster erkennen. Bei den kategorialen Verfahren gibt es wahrscheinlich eine größere Grenze für die Vektorlänge. Berücksichtigen Sie außerdem die Abhängigkeit von der Anzahl der Zeilen. Bei großen Datenmengen kann die Anzahl der Merkmale größer sein.