L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2374

 

Marcatura dell'affare Prada

4 simple ways to label financial data for Machine Learning ⋆ Quantdare
4 simple ways to label financial data for Machine Learning ⋆ Quantdare
  • quantdare.com
We have seen in previous posts what is machine learning and even how to create our own framework. Combining machine learning and finance always leads to interesting results. Nevertheless, in supervised learning, it is crucial to find a set of appropriate labels to train your model . In today’s post, we are going to see 3 ways to transform our...
 
Maxim Dmitrievsky:

Marcatura dell'affare Prada.

Questa roba è più interessante. Non capisco, funziona solo dalla linea di comando? Qualcuno l'ha guardato?

SigCWGAN, a new generation GAN architecture for Time Series Generation. ⋆ Quantdare
SigCWGAN, a new generation GAN architecture for Time Series Generation. ⋆ Quantdare
  • quantdare.com
As a continuation to our last post on Time Series Signatures and our running list of posts regarding GANs and synthetic data we now want to present the Signature Conditional Wasserstein GAN, shortened as SigCWGAN, a new GAN architecture presented in [1] that is specifically designed to generate time series of arbitrary length and dimensions. 2...
 
Vladimir Perervenko:

Questo materiale è più interessante.

Questo è un altro argomento, che non è limitato ai GAN.

 
Maxim Dmitrievsky:

Marcatore dell'affare Prada

Linguaggio oscuro e funzioni sconosciute... e l'autore è fuorviante.

In fixed_time_horizon() c'è questa linea:

idx_lower = dati[dati[nome] < - soglia].indice

ha scritto sopra che

soglia : int
La soglia costante predefinita per calcolare le etichette.

E le immagini qui sotto non sono int (cioè 0,1,2,3...), ma 0,05, 0,01...

È diventato più chiaro con il doppio - questa è la stessa cosa che ho fatto con TP=SL=qualche valore di cambiamento di prezzo.

Ma non è chiaro perché ho chiamato il metodo e la funzione fixed_time_horizon(); dov'è il tempo fisso? Si tratta di un cambio di prezzo fisso, non di tempo.

---------

Per quanto riguarda il metodo quantized_labelling() - non ho ottenuto nulla dal codice. Suppongo che non si tratti di un valore fisso, ad esempio 0,05, ma di un quantile che cambia con la volatilità del prezzo.

 
elibrarius:

Linguaggio oscuro e funzioni sconosciute... e l'autore è fuorviante.

In fixed_time_horizon() c'è questa linea:

idx_lower = dati[dati[nome] < - soglia].indice

ha scritto sopra che

soglia : int
La soglia costante predefinita per calcolare le etichette.

E le immagini qui sotto non sono int (cioè 0,1,2,3...), ma 0,05, 0,01...

Con il doppio - è diventato più chiaro - è la stessa cosa che ho fatto con TP=SL=qualche valore di cambiamento di prezzo.

Ma non è chiaro perché ho chiamato il metodo e la funzione fixed_time_horizon(); dov'è il tempo fisso? Si tratta di un cambio di prezzo fisso, non di tempo.

---------

Per quanto riguarda il metodo quantized_labelling() - non ho ottenuto nulla dal codice. Suppongo che non sia un valore fisso, per esempio 0,05, ma il valore quantile che continua a cambiare con la volatilità del prezzo.

Non ho esaminato il codice. La cosa principale è il markup non per grafico ma per incrementi. Questo porta ad una serie di caratteristiche interessanti, per esempio, per applicare il markup ad un grafico compresso o ad alcuni componenti BP specifici

ci deve essere un errore di stampa sull'int, non è stato Prado a scriverlo, ma alcuni tipi.

L'orizzonte fisso si riferisce a un ritardo incrementale selezionato, probabilmente

 
Maxim Dmitrievsky:

Non ho letto il codice. Il principale non è il partizionamento per grafico, ma per incrementi. Questo porta a una serie di caratteristiche interessanti, come l'applicazione del partizionamento a un grafico squelched, o a specifici componenti BP

ci deve essere un errore di stampa sull'int, non è stato Prado a scrivere questo, sono stati i tipi

L'orizzonte fisso si riferisce a un ritardo incrementale selezionato, credo.

Qualcuno là fuori è Prado o i suoi tipi.

 

Con il metodo quantized_labelling()

Vedo poco senso nell'insegnarlo. Dopo tutto, si può imparare bene la classificazione a bassa volatilità e peggio ad alta volatilità. E poi un errore del 40% a bassa volatilità + 51% di errore ad alta volatilità riporterà la redditività del sistema a circa 0. Perché molti piccoli guadagni possono essere superati da diverse grandi perdite.
 
elibrarius:

Qualcuno là fuori è stupido o Prado o i suoi tipi.

tutto è zshibizzy, dovremmo provare, ma lo farò in modo diverso

Il suo libro è un po' diverso, credo. Sono troppo pigro per cercare.
 
Maxim Dmitrievsky:

Va bene, ci proverò, ma lo farò in modo diverso

Il suo libro lo descrive in modo diverso, credo. Sono troppo pigro per cercarlo.
TP=SL=valore fisso l'ho provato. Il risultato è del 50% su nuovi dati di convalida incrociata.
Sui quantili non vedo il punto, vedi post sopra
 
elibrarius:
TP=SL ho provato. Il risultato è del 50% su nuovi dati di convalida incrociata.
Sui quantili non vedo il punto, vedi post sopra

Ecco gli incrementi, senza sl e tp

Ho fatto questo attraverso il clustering, segnato. Nel complesso la curva sui dati marcati non è grande, ma più robusta sui nuovi dati
Motivazione: