L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 450

 
Reshetov si è presentato a Dio?
Non ho...
Recentemente ha scritto qualcosa come.... L'inverno...
 
Alexander Ivanov:
Reshetov si è presentato a Dio?
Non ho fatto...
Recentemente ha scritto qualcosa come.... In inverno...

È quello che volevo sapere cosa gli è successo.

 
La fine del mondo sta arrivando. E Dio sta prendendo la sua via....
E l'Anticristo apparirà.....
 
L' uscita:

Hmmm... usi il software del defunto Yury Reshetov? XGB macina questo set al 65-67% di precisione in un minuto. Quando ML è in esecuzione da più di un'ora, presumo che qualcosa non vada, quindi ho un debole per le reti neurali da molto tempo.

No, non è la rete neurale di Jura. Ma non alleno il modello una volta sola, ma provo diverse combinazioni di predittori e diversi parametri del modello. L'output dovrebbe essere costituito da dati statistici sull'importanza di ogni predittore e dei parametri del modello in modo che tutto possa essere addestrato senza fitting.

 

Ci sono arrivato finora, la selezione dei parametri del modello e dei pesi dei predittori è ancora lontana dall'essere completa, dovrebbe essere molto meglio in futuro.

Ho preso il 10% di train.csv (a caso) per la formazione, altrimenti è un processo abbastanza lungo.
I pesi dei predittori sono.
0
0
3467.50163547078
0
0
184258.95892851
22315.6831463224
0.144079977475357
0
0
0.000324672622477092
39775.9969139879
6053.73861534689
0
0

Ciò che è zero e vicino ad esso è spazzatura e inutile, più alto è il peso maggiore è l'influenza del predittore sul risultato.

logloss sulla formazione (10% delle linee da train.csv) - 0.6895723, precisione 0.6402786

Il logloss sul test (l'intero test.csv) è 0,6928974, la precisione è 0,6239073.
Ho bisogno di aumentare il numero di esempi di allenamento, il 10% che ho preso è molto basso, quindi il logloss è sceso notevolmente nel test. Per esempio per numerai ho bisogno di prendere almeno il 50% degli esempi di allenamento, altrimenti i risultati sui nuovi dati non sono nulla.


Devo prendere almeno il 50% degli esempi di allenamento, altrimenti i risultati sui nuovi dati non sono affatto buoni:

XGB macina questo set al 65-67% di precisione in un minuto.

Rispetto XGB, in mani capaci cosa forte. Sono peggiorato in 4 ore.


Che tipo di dati sono? Forex, borsa, abbonamenti a pagamento? Il 62% produrrebbe realisticamente un profitto se io stesso raccogliessi un insieme simile di predittori?

 
Ildottor Trader:

Che tipo di dati sono questi? forex, borsa, abbonamenti a pagamento? Il 62% produrrebbe realisticamente un profitto se dovessi raccogliere un simile insieme di predittori?


Penso che questa domanda dovrebbe essere fatta all'inizio )) senza capire la fonte dei dati è di alto livello :)

È come andare in giro con una ragazza, fare conoscenza attraverso i conoscenti, e poi solo verso la fine della serata - senti, come ti chiami :) e lei dice che hai una buona reazione nella vita, andrai lontano

 
Alexander Ivanov:
Reshetov si è presentato a Dio?
Non sapevo...
Recentemente ha scritto qualcosa come.... In inverno...

Scioccato io stesso.

Possa riposare in pace.

 
Vladimir Gribachev:

Scioccato io stesso.

Possa riposare in pace.

Che Dio faccia riposare la sua anima.
 
Alexander Ivanov:
Che Dio abbia pietà della sua anima.
Ma la sua causa continuerà a vivere, ho letto il suo lavoro, un uomo molto interessante con un pensiero non convenzionale. Sono stato anche sorpreso dal fatto che prima che io tirassi fuori di nuovo l'argomento nessuno ne aveva discusso molto prima, tranne Mikhail.
 
Ildottor Trader:

Per la formazione ha preso il10%di train.csv

Logloss di allenamento (10% delle linee da train.csv) - 0.6895723, precisione 0.6402786

Il logloss sul test (l'intero test.csv) è 0,6928974, la precisione è 0,6239073.

Ho bisogno di aumentare il numero di esempi di allenamento, il 10% che ho preso è molto basso, quindi il logloss è sceso notevolmente nel test.

Non ha cercato di prendere il 10%, ma penso che 62% è buono, ho avuto circa 66% nel test, Wizard ha detto che aveva 67%, naturalmente al 100% dei campioni lerna in formazione.

Per esempio per numerai ho bisogno di prendere almeno il 50% dei campioni di allenamento, altrimenti i risultati sui nuovi dati non sono nulla.

Ad essere onesti con loro è tutto piuttosto poco chiaro, non riesco a capire quanto sia buono l'indicatore, l'hanno reso molto nebbioso, non è chiaro perché abbiano messo delle risposte nel torneo, con le quali contano i loglos preliminari, non è chiaro perché ne abbiano bisogno, gente che era al primo posto improvvisamente si precipita per 500-th con loglos >0.7, tutto puzza di casuale...

Rispetto XGB, nelle mani giuste una cosa forte. Ho avuto di peggio in 4 ore.

Forte, specialmente quando l'ho ricostruito io stesso in C++.

Che tipo di dati sono questi? Forex, borsa, abbonamenti a pagamento? Il 62% produrrebbe realisticamente un profitto se mi pompassi un simile set di predittori?

I dati sono tutti da FORTS con Quickquick, Metatrader e quelli gratuiti parsed da pagine web come http://www.investing.com ecc secondi, sembrava essere firmato su che tipo di parametri. È realistico, ma l'infrastruttura di trading per l'HFT moderato (10 sec-1min di mantenimento della posizione) dovrebbe essere fatta su Quick o Plaz, da zero questo è un lavoro di un anno uomo. Prof. C++/Java/C# coder (25-50K$ se locale), ma dovremmo considerare che le prospettive di HFT nel mondo stanno diminuendo tutto il tempo, specialmente ultra, cioè sono monopolizzate da organizzazioni molto strettamente finanziate e non sono disponibili per i commercianti di base, dovremmo concentrarci sulla previsione del prossimo minuto, non secondo, c'è ~55% di questo è il limite dei sogni

Motivazione: