L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2426

 
mytarmailS:

Ora la risposta alla prima domanda.

Grazie!

Cercherò di capirlo, ma è difficile capirlo subito - la sintassi del codice è abbastanza diversa dal C++, però.

 
elibrarius:

Non pensi che stai sintonizzando il tuo modello sulla versione di maggior successo in prova?

A che punto pensi che io possa sintonizzarmi per testare? Il campionamento "test" è usato per fermare l'addestramento, in Progetti, tranne uno, non esiste affatto, poi l'ho usato nell'addestramento finale - bene si può sostituire con un numero fisso di alberi - 50/100/300/500/800 e vedere il risultato su tutti i campioni, allora credi che otterrai risultati significativamente peggiori?

 
Aleksey Vyazmikin:

Grazie!

Cercherò di capirlo, ma è difficile capirlo subito, perché la sintassi del codice è molto diversa dal C++.

Un sacco di funzioni non familiari perché il linguaggio è di alto livello.
Ma quello che tu scrivi in 300 righe in C++ io lo posso scrivere in 3 righe)

 
Aleksey Vyazmikin:

A che punto sono in sintonia con il test, secondo voi? Il campione "test" è usato per fermare l'addestramento, in Projects, tranne uno, non c'è affatto, poi l'ho usato nell'addestramento finale - bene, puoi sostituirlo con un numero fisso di alberi - 50/100/300/500/800 e vedere il risultato su tutti i campioni, poi pensi che il risultato sarà molto peggio?

Sì - smettere di allenarsi è anche un test di adattamento. Non conosco altri dettagli del tuo sistema, non posso dire altro.
Nella crosvalidazione tutti i dati sono un test e tutti sono anche treni. È solo uno alla volta. Volevi solo aumentare la trama del vassoio del 40%.
 
mytarmailS:
Un sacco di funzioni non familiari, perché il linguaggio è di alto livello.
Ma quello che tu scrivi in 300 righe in c++ io lo posso scrivere in 3 righe ))

Non credo che tutte le mie perversioni possano essere facilmente implementate in R :)

 
elibrarius:
Sì - smettere di allenarsi è anche un test fit. Non conosco altri dettagli del tuo sistema, non posso dire altro

Sono d'accordo che questo in teoria aumenta il risultato sul campione d'esame, ma io sto valutando il risultato sul campione d'esame!

Bene, penso di aver coperto tutti i dettagli, se avete domande chiedete pure.

elibrarius:
Nella crosvalidazione, tutti i dati sono un test e tutti sono anche una traina. È solo uno alla volta. Volevi solo aumentare la trama del vassoio del 40%.

Bene, qual è lo scopo di usare la crosvalidazione? Vedo il suo punto fino a questo punto come la ricerca di iper-parametri del modello, in quanto mostrerà in media quali impostazioni sono migliori di tutte sulle trame casuali.

 
Aleksey Vyazmikin:

Non credo che si possano facilmente implementare tutte le mie perversioni in R :)

Ahahaha))))

Se io posso realizzare le mie perversioni, le vostre sono come un riposo)

 
Aleksey Vyazmikin:

OK, qual è lo scopo di usare la crosvalidazione? Vedo il suo scopo finora come trovare gli iperparametri del modello, in quanto mostrerà in media quali impostazioni sono migliori di tutte sulle trame casuali.

È esattamente a questo che serve. C'è qualcos'altro di cui hai bisogno? E un insieme specifico di caratteristiche. Con attributi diversi, è probabile che gli iperparametri siano diversi. Se scegliete quelli con i migliori iperparametri, dovete lavorare con loro.

Aleksey Vyazmikin:
Bene, penso di aver descritto tutti i dettagli, se avete domande.

Sono troppo pigro per entrare nei dettagli.

 
mytarmailS:

Ahahaha))))

Se io posso attuare le mie perversioni, le vostre sono come un riposo)

Bene, eccomi qui, dal momento che facendo uno script per preparare i dati, ho ancora bisogno di fare un file che elenchi le colonne escluse, che includono:

1. Colonne con predittori correlati (a proposito, come si sceglie quale colonna scartare, diciamo 5 predittori correlati?)

2. Colonne scartate dal primo file-table, tranne la colonna con l'obiettivo.

Inoltre, la colonna con l'etichetta di destinazione dovrebbe essere scritta nel file, preferibilmente ricercata per il nome della colonna.

La struttura del file è

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary
 
elibrarius:

È esattamente a questo che serve. C'è qualcos'altro di cui hai bisogno? E un insieme specifico di caratteristiche. Con attributi diversi, è probabile che gli iperparametri siano diversi. Quelli selezionati con i migliori iperparametri sono quelli da mettere al lavoro.

Sono troppo pigro per approfondire.

Ho bisogno di selezionare i predittori giusti in meno tempo. Passare di nuovo attraverso i predittori significa aumentare il tempo di elaborazione di cento volte. Il mio metodo si basa sulla logica che un buon predittore (compreso uno adatto a un particolare metodo di apprendimento) sarà richiesto dal modello a tutti gli intervalli di campionamento, il che esclude l'adattamento all'area di campionamento.

Motivazione: