L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 838

 
Mihail Marchukajtes:

In generale, uso questo particolare pacchetto per selezionare i predittori. È chiaro che ci sono degli svantaggi, soprattutto la mancanza di interazione di diversi predittori in relazione all'obiettivo. Ma nel complesso è sufficiente per la mia ottimizzazione finora... Quindi se ci sono altri pacchetti per la pre-elaborazione dei dati li prenderei volentieri in considerazione...

Dalla mia esperienza posso raccomandare il pacchetto RandomUniformForest come il più completo e professionale nel trattare i vari aspetti dell'importanza dei predittori. Alcuni esempi possono essere visti qui

Buona fortuna

PS: A proposito, uno dei pochi che permette di riqualificare il modello su nuovi dati. Il che fa risparmiare un sacco di tempo.

 
Ildottor Trader:

Un nuovo tour ogni settimana. In una settimana devi addestrare il modello e inviargli le previsioni. Ma la stima in avanti del tuo modello sarà nota solo dopo altre tre settimane, le tue previsioni saranno confrontate con quelle reali per quelle 3 settimane.

Credo che tengano almeno il 90%.

Cosa intendi con "credo che tengano almeno il 90%"? Pensi che scambiano queste previsioni che gli vengono inviate? In generale, come si possono trovare i segni per calcolare la previsione in anticipo? Per interpolazione o qualcosa del genere? Lo hanno scritto nel loro documento, che è solo una "prova di lavoro", come nel mining e il vincitore è scelto a caso, probabilmente la metà dei risultati sono quasi gli stessi, poi buttato a caso un filtro che classifica in più, beh è un casino vergognoso, e dataset è probabilmente puro sintetico, nois con bassa preponderanza di segnale, non c'è mercato a tutti. Tutta questa merda sugli hedge fund ecc. è puramente per guadagnare popolarità per la loro moneta.

 
Maxim Dmitrievsky:

Allora, mikhail, ti sei ripreso dalla tua frenesia, comincerai presto a valutare i tuoi ts in modo sensato e senza fanatismo? :)

Non avevo la rabbia. Solo il calcolo a freddo, che non è cambiato in alcun modo dall'ultima volta. Per non parlare della teoria dell'approccio, che funziona ancora. Per un momento...

 
govich:

In particolare quanto tengono per sé - non è scritto ufficialmente. Tutti i tipi di riviste finanziarie hanno scritto di un profitto di 1,5 milioni nel 2016, e se si confronta quanto di questo pagavano ai partecipanti, non è molto.

> Credi che commercializzino queste previsioni che gli vengono inviate?
Sì, questa è la strategia. Per esempio, creerò un mucchio di funzioni, creerò un foglio di calcolo di formazione, lo invierò al forum, 10 persone daranno le loro previsioni e io farò trading in base ad esse - è così semplice.
Non hanno avuto la loro criptovaluta per molto tempo, hanno pagato in bitcoin. Hanno appena preso alcune migliaia di dollari in bitcoin ogni settimana per un anno. Poi hanno rilasciato la propria criptovaluta per non avere a che fare con i bitcoin.

> Come si fa a sapere in anticipo i segni di cui calcolare la previsione? È un'interpolazione?
Interpolazione, previsione per vicini più vicini, clustering, ci sono molte opzioni, non vi diranno la risposta specifica, potete solo indovinare.

 
Vladimir Perervenko:

Dalla mia esperienza posso raccomandare il pacchetto RandomUniformForest come il modo più completo e professionale per trattare i vari aspetti dell'importanza dei predittori. Esempi possono essere trovati qui

Buona fortuna

PS: A proposito, uno dei pochi che permette di riqualificare il modello su nuovi dati. Il che fa risparmiare un mare di tempo.

Provato. Non è stato possibile ottenere alcun risultato.

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

In 5 minuti genera.
Errore in OOB.votes - Y: matrici multidimensionali non simili

Struttura delle matrici da alimentare:

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 0 ...

Non è chiaro - somiglianza di cosa con ciò che richiede.
Provato senza xtest = x2, ytest = y2 - stesso risultato.
Passando al prossimo pacchetto.

 
elibrario:

Provato. Non ho potuto ottenere alcun risultato...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

Dopo 5 minuti.
Errore in OOB.

La struttura delle matrici che vengono immesse:

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 0 ...

Non è chiaro - la somiglianza di ciò che con ciò che richiede.
Provato senza xtest = x2, ytest = y2 - stesso risultato.
Passando al prossimo pacchetto.

Non so perché non ha funzionato, per me funziona.

Ho ottenuto buoni risultati in caret. Ci sono tre funzioni di selezione dei predittori - hanno un'efficienza diversa e consumano varie risorse computazionali.


C'è un altro pacchetto molto interessante - CORElearn. Questo pacchetto contiene due funzioni per selezionare i predittori, le ho usate insieme e hanno dato ottimi risultati sui miei predittori. Particolarmente curioso è attrEval con un insieme assolutamente fantastico di metodi di valutazione di selezione, tra cui un posto speciale è il gruppo Relief, che valuta non solo un'osservazione (stringa) ma anche le stringhe più vicine.


Buona fortuna.


PS.

Non dimenticate che la selezione dei predittori dovrebbe consistere almeno nei seguenti passi:

  • Selezione per: predittori rilevanti per l'obiettivo. Wizard qui ha dato un link alla teoria di questo passo. Si possono distinguere due metodi: la statistica e l'entropia. Per entrambi, c'era del codice qui
  • selezione per pacchetti enumerati che NON sono rilevanti per il modello futuro
  • Selezione che viene fatta sui risultati del modello. Molto efficace nei modelli lineari. Per esempio, con glm selezioniamo solo i predittori significativi e poi solo questi nella rete. Il risultato può essere sorprendente.


Prima di selezionare i predittori può essere necessaria una pre-elaborazione, per esempio la centratura. È ben descritto nell'articolodi Vladimir Perervenko

 
elibrario:

Provato. Non ho potuto ottenere alcun risultato...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

Dopo 5 minuti.
Errore in OOB.

La struttura delle matrici che vengono immesse:

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 0 ...

Non è chiaro - la somiglianza di ciò che con ciò che richiede.
Provato senza xtest = x2, ytest = y2 - stesso risultato.
Passando al prossimo pacchetto.

Puoi postare i set originali?

Dovete specificare che non si tratta di una regressione, poiché il vostro obiettivo non è un fattore. Aggiungere parametri

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regression = FALSE)

o

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

Buona fortuna

 
SanSanych Fomenko:

C'è un altro pacchetto molto interessante: CORElearn. Ci sono due funzioni in quel pacchetto per selezionare i predittori, le ho usate in coppia, danno ottimi risultati sui miei predittori. Particolarmente curioso è attrEval con un insieme assolutamente fantastico di metodi di valutazione di selezione, tra cui un posto speciale è il gruppo Relief, che valuta non solo un'osservazione (stringa) ma anche le stringhe più vicine.


D'accordo. In linea di principio questo è probabilmente il pacchetto più serio per RF. Dovreste prestare attenzione allo sviluppatore Marko Robnik-Sikonja.

Buona fortuna

 
Vladimir Perervenko:

Puoi postare i set originali?

Dovete specificare che non si tratta di una regressione, poiché il vostro obiettivo non è un fattore. Aggiungere parametri

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regression = FALSE)

o

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

Buona fortuna

Questo ha aiutato. Grazie!
 
Ildottor Trader:

In particolare, quanto tengono per sé non è scritto ufficialmente. Tutti i tipi di riviste finanziarie hanno scritto circa 1,5 milioni di profitti nel 2016, e se si confronta quanto pagavano ai partecipanti, non è molto.

> Credi che commercializzino queste previsioni che gli vengono inviate?
Sì, questa è l'intera strategia. Per esempio, creerò un mucchio di funzioni, creerò un foglio di calcolo di formazione, lo invierò al forum, 10 persone daranno le loro previsioni e io farò trading in base ad esse - tutto è semplice.
Non hanno avuto la loro criptovaluta per molto tempo, hanno pagato in bitcoin. Hanno appena preso alcune migliaia di dollari in bitcoin ogni settimana per un anno. Poi hanno rilasciato la propria criptovaluta per non avere a che fare con i bitcoin.

> Come si fa a sapere in anticipo i segni di cui calcolare la previsione? È un'interpolazione?
Se non si conosce la risposta esatta, si può solo indovinare.

1.5m$ sono spiccioli, come per l'Intero Kantor, ho sentito che in quel momento quando hanno messo la loro cripto in scambio, alcuni partecipanti (che era in cima) hanno preso ogni se non milioni$, poi centinaia di migliaia$, si poteva ottenere il primo posto una volta e 4000NMR per 200$ per moneta = 800.000k$, ma questa palla si è rapidamente esaurita e NMR è crollato e ha iniziato a dare monete meno, ma forse qualcuno ha avuto fortuna.

IMHO penso che all'inizio possono aver cercato di scambiare le previsioni, e anche i luoghi erano più o meno prevedibili, probabilmente il 90% dei soldi che hanno pagato se stessi, la maggior parte dei primi cento erano probabilmente i loro dudes, il denaro non è trapelato a chissà cosa. Ma ora è un casinò puro con "prove di lavoro" e un sacco di casualità, questa è la voce almeno.


PS: prima della loro moneta, pagavano 6k$ a settimana (ma a chi?), cioè 288k$ all'anno viene fuori proprio quell'"onesto" ~20% da 1,5m di profitti ai quants))) Ma chiaramente, tutte queste cifre possono essere fabbricate.

Motivazione: