L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1038

 
Roffild:
Cosa ha a che fare questo con la "soglia" per una foresta casuale?

Non ricordo qual è la soglia, deve essere la tua soglia per entrare in un trade o qualcosa come 0,75 o qualsiasi altra cosa (tipo di probabilità)

 
Roffild:
Cosa c'entra la "soglia" con la foresta casuale?

Nel caso della regressione logit posso immaginare quali siano le probabilità di assegnazione della classe, nel caso della foresta, ahimè. Quindi queste sono pseudo-probabilità molto probabilmente, e non dovrebbe funzionare così. Con una soglia di 0,75 non dovrebbe significare che la probabilità di assegnazione a una classe è più alta che con 0,6, per esempio.

almeno non ho letto nessuna informazione al riguardo
 

E accetto la "probabilità" come una parte importante dell'algoritmo della foresta casuale, perché la formula per calcolare il risultato di tutti gli alberi si basa su di essa.

Ho anche impostato il numero di alberi con questa "probabilità" in mente.

 
Roffild:

E accetto la "probabilità" come una parte importante dell'algoritmo della foresta casuale, perché la formula per contare il risultato di tutti gli alberi è costruita su questo.

Ho anche impostato il numero di alberi con questa "probabilità" in mente.

Tieni conto di quante foglie occupano la trama del campione? La dimensione del comitato che vota effettivamente sulla situazione, data l'alta probabilità di competenza di ogni foglia di un tale albero?

 
Aleksey Vyazmikin:

Tieni conto di quante foglie occupano l'area del campione? La dimensione del comitato che vota effettivamente sulla situazione data l'alta probabilità di competenza di ogni foglia di tale albero?

Il ramo finale è responsabile di almeno 25 varianti del campione addestrato. È impostato nei parametri di Spark. Non esiste un tale parametro in AlgLib.
 
Roffild:
Il ramo finale è responsabile di almeno 25 varianti del campione addestrato. È impostato nei parametri di Spark. Non esiste un tale parametro in AlgLib.

Forse non l'ho messa in questo modo.

Supponiamo di avere 100 alberi, ogni foglia d'albero alla volta (nel caso semplice di 2 scelte) fa una classificazione, quindi teniamo conto del fatto che la votazione può coinvolgere alberi con un margine di errore molto grande - per esempio, 49/51, che falserebbe significativamente la previsione media. Forse dovremmo eliminare del tutto queste foglie dal voto? Perché la mancanza di capacità predittiva dice di più su un modello di foglie d'albero povero quando si tratta di dati specifici.

 
Nuova classifica dei linguaggi di programmazione tra cui Python e R
 
SanSanych Fomenko:
Nuova classifica dei linguaggi di programmazione tra cui python e R
Roba buona. Ma le tue conclusioni su R e Python sono inverosimili. Non si possono assolutamente paragonare con i vostri criteri - è come caldo e morbido.
 
Yuriy Asaulenko:
Roba buona. Ma le tue conclusioni su R e Python sono inverosimili. Non puoi assolutamente paragonarli secondo i tuoi criteri - è come caldo e morbido.

Più precisamente?

Sto confrontando l'apparato di riferimento delle lingue.

Come lo vuoi?

 
SanSanych Fomenko:

Più precisamente?

Sto confrontando l'apparato di riferimento delle lingue.

Come lo vuoi?

Quantitativamente, ci sono più veicoli a motore che trattori, ma non ha senso confrontarli tra loro.
In termini di aiuto, entrambi sono estesi. In termini di moduli, si sovrappongono parzialmente.
Python ha un port in R, credo, e R in Python.
Se avete un compito complesso, dovete portare qualcosa dall'esterno se lavorate in qualsiasi ambiente e in qualsiasi lingua. Che vi piaccia o no, dovete avere un camion, un trattore e un escavatore in più.
Motivazione: