Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3030

 
Forester #:

Das ist eine komplizierte Beschreibung. Sortieren Sie die Spalte und teilen Sie sie in 32 Teile, z. B. wenn es Duplikate gibt, dann werden alle in das Quantum geworfen. Wenn die Spalte nur 0 und 1 hat, dann gibt es 2 Quanten, nicht 32 (weil Duplikate).

Sie meinen die Methode, ich meine das Ziel. Die Methoden können unterschiedlich sein. Lassen Sie es mich so ausdrücken: Empirische Methoden sind oft besser als mathematische Methoden. Vielleicht, weil wir keine vollständigen Daten über die allgemeine Stichprobe haben.

 
Aleksey Nikolayev #:

Im Wesentlichen stellt sich heraus, dass ein Baum für jeden Prädiktor separat erstellt wird.

Ja, so werden C4.5-Bäume für diskrete Werte erstellt. Eine Aufteilung.

 
Aleksey Vyazmikin #:

Sie sprechen von der Methode, ich spreche von dem Ziel. Es kann verschiedene Methoden geben. Lassen Sie es mich so sagen: Empirische Methoden sind oft besser als mathematische Methoden. Wahrscheinlich, weil wir keine vollständigen Daten über die allgemeine Stichprobe haben.

Bei nicht-stationären Daten gibt es überhaupt kein Konzept der "Hauptstichprobe", sondern nur Schwänze. Das ist das Problem, und deshalb sind alle Schätzungen aus dem Training in der Zukunft extrem schwierig zu erhalten.

 
СанСаныч Фоменко #:

Bei nicht-stationären Daten gibt es überhaupt kein Konzept der "Hauptstichprobe", sondern nur Schwänze. Das ist das ganze Problem, und deshalb sind die im Training gewonnenen Schätzungen in der Zukunft extrem schwierig zu erhalten.

Wir kennen sie nicht. Genauer gesagt kennen wir die wahre Dichte der Verteilung nicht, und wir beobachten nur die Ausschnitte - deshalb diese Schwankungen...

Ich lebe nicht von Konzepten :)

Sagen Sie mir also, wie man ein solches Phänomen nennt, das wir nicht beobachten können, weil wir uns in einem Prozess befinden, der vor langer Zeit in den Weiten des Weltraums abgeschlossen wurde....

 
СанСаныч Фоменко #:

Bei nicht-stationären Daten gibt es überhaupt kein Konzept der "Hauptstichprobe", sondern nur Schwänze. Das ist das ganze Problem, und deshalb sind die im Training gewonnenen Schätzungen in der Zukunft extrem schwierig zu erhalten.

Das ist richtig, SanSanych.

Nicht-stationäre Daten unterliegen immer den kumulativen Auswirkungen anderernicht-stationärer Daten. Davon hängen die Ausläufer ab.

 
Aleksey Vyazmikin #:

Der Bereich der Prädiktorwerte, der die Daten beschreibt.

Hier habe ich den Algorithmus praktisch beschrieben - es gibt auch ein Bild mit RSI.

Ich verstehe es. Trennen Sie alles und alles und untersuchen Sie es separat.

Ich verstehe nicht, warum sie ein Quantum sind.
 
Maxim Dmitrievsky #:
Ich verstehe nicht, warum sie Quanten sind.

Weil der Junge sich nicht an die Regeln hält, schrieb er)

 
Maxim Dmitrievsky #:

Verstehe. Trennen Sie alles und jeden und studieren Sie es separat.

Ich verstehe nicht, warum sie Quanten sind.

Nun, das liegt wahrscheinlich an den Übersetzungen. Terminologie.

Es gibt die Quantisierung und ihre verschiedenen Methoden, die Tabelle mit den Teilungspunkten - Quantentabelle - ist schon aus der CatBoost-Anweisung.

Quantensegmente - von Quantentabelle, aber die extremen haben Grenzen. Das ist schon meine Erfindung.

 
Aleksey Vyazmikin #:

Nun, das liegt wahrscheinlich an den Übersetzern. die Terminologie.

Es gibt die Quantisierung und ihre verschiedenen Methoden, die Tabelle mit den Teilungspunkten - die Quantentabelle - sie stammt bereits aus dem CatBoost-Befehl.

Quantensegmente - aus der Quantentabelle, aber die extremen haben Grenzen. Das ist bereits meine Erfindung.

nicht Quantum, quantisiert wahrscheinlich, wie hier.

5.4 Quantisierung von Faltungsneuronalen Netzen

Klassischerweise verwendet man bei der Quantisierung neuronaler Netze aufgrund offensichtlicher Optimierungsschwierigkeiten nicht einfach ganze Zahlen, sondern eine Approximation von Fließkommazahlen durch ganze Zahlen. Ein in der Literaturweit verbreiteter Ansatz [52, 54, 60] zur Approximation von Fließkommazahlen durch Ganzzahlen beliebiger Tiefe ist der in der Google-Bibliothek GEMMLOWP [59] vorgeschlagene Algorithmus. Mit einem Eingabe-Array 𝑋, Grenzwerten [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂], Anzahl der Bits 𝑀, ist das Ergebnis wie folgt definiert:

𝑠𝑐𝑎𝑙𝑒 =(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0),2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

So erhalten wir für jedes Feld von Fließkommazahlen ein ganzzahliges Feld 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡, ganzzahlig 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, die genau die Null darstellt, eine Zahl mit doppelter Genauigkeit 𝑠𝑐𝑎𝑙𝑒, die den Maßstab der Quantisierung definiert.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

 
Maxim Dmitrievsky #:

nicht quantitativ, quantisiert, wie hier.

5.4 Quantisierung von neuronalen Faltungsnetzen

Klassischerweise werden bei der Quantisierung neuronaler Netze aufgrund offensichtlicher Optimierungsschwierigkeiten nicht nur ganze Zahlen verwendet, sondern vielmehr eine Approximation von Fließkommazahlen durch ganze Zahlen. Ein in der Literaturweit verbreiteter Ansatz [52, 54, 60] zur Approximation von Fließkommazahlen durch Ganzzahlen beliebiger Tiefe ist der in der Google-Bibliothek GEMMLOWP [59] vorgeschlagene Algorithmus. Mit einem Eingabefeld 𝑋, Grenzwerten [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂] und der Anzahl der Bits 𝑀 ist das Ergebnis wie folgt definiert:

𝑠𝑐𝑎𝑙𝑒 =(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0),2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

So erhalten wir für jedes Feld von Fließkommazahlen ein ganzzahliges Feld 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡, ganzzahlig 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, eine ganze Zahl, die genau Null darstellt, eine Zahl mit doppelter Genauigkeit 𝑠𝑐𝑎𝑙𝑒, die die Skala der Quantisierung definiert.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

Ich sage dir, es ist eine Frage der Übersetzung - es sind alles Synonyme. Hier sind die Einstellungen von CatBoost.