L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2131

 

Sto pensando alla "ricerca completa" di regolarità, senza un obiettivo come "cosa succederà sulla prossima candela" e simili...

La ricerca consiste nel cercare solo regolarità, l'obiettivo è trovare una regolarità, e non "cosa ci sarà sulla prossima candela", anche le regolarità possono essere allungate nel tempo, per esempio se oggi era "l'evento 1" e poi "l'evento 2", e poi "l'evento 3"... per esempio se oggi abbiamo "evento 1" e poi " evento 3", allora domani alle 14:05 sarà una candela crescente o qualcosa del genere))

Ho un'idea migliore di come dovrebbe essere e quale algoritmo applicare, ma probabilmente avrei bisogno di una certa potenza di calcolo, che non ho (


A proposito, una domanda: quante ripetizioni di un evento per considerarlo un pattern?

 
elibrarius:

Teoricamente, dovrebbe essere lo stesso.
Il numero di opzioni diverse in giorni, ore e minuti è uguale al numero di opzioni in seni e coseni. Entrambi ci sono 10080 valori diversi in 7 giorni, che cambiano una volta al minuto.
Se c'è qualche randomizzazione nell'addestramento, questo può essere il motivo della differenza.

Con cosa ti sei allenato, con un catbust?

Gli esperimenti sono sempre più importanti.

Guardate il primo predittore T1 (Den_Nedeli_S), o più esattamente la sua griglia

T2


E i giorni della settimana senza trasformazione del tempo.

Come vedete, le griglie sono diverse e ci sono diversi delta tra le cifre, anche se le impostazioni di partizionamento sono le stesse:

catboost-0.24.1.exe fit  --learn-set train.csv   --test-set test.csv     --column-description %%a        --has-header    --delimiter ;   --model-format CatboostBinary,CPP       --train-dir ..\Rezultat\RS_208\result_4_%%a     --depth 6       --iterations 1000       --nan-mode Forbidden    --learning-rate 0.03    --rsm 1         --fold-permutation-block 1      --boosting-type Plain   --l2-leaf-reg 6         --loss-function Logloss         --use-best-model        --eval-metric Logloss   --custom-metric Logloss         --od-type Iter  --od-wait 100   --random-seed 0         --random-strength 1     --auto-class-weights SqrtBalanced       --sampling-frequency PerTreeLevel       --border-count 208      --feature-border-type MinEntropy        --output-borders-file quant_4_00208.csv         --bootstrap-type Bayesian       --bagging-temperature 1         --leaf-estimation-method Newton         --leaf-estimation-iterations 10        

Il che significa che si può abbinare la spaccatura in modo più preciso, il che può risultare in un adattamento o in un risultato migliore...

 
mytarmailS:

Sto pensando alla "ricerca completa" di regolarità, senza un obiettivo come "cosa succederà sulla prossima candela" e simili...

La ricerca consiste nel cercare solo regolarità, l'obiettivo è trovare una regolarità, e non "cosa ci sarà sulla prossima candela", anche le regolarità possono essere allungate nel tempo, per esempio se oggi era "l'evento 1" e poi "l'evento 2", e poi "l'evento 3"... per esempio se oggi abbiamo "evento 1" e poi " evento 3", allora domani alle 14:05 sarà una candela crescente o qualcosa del genere))

Ho un'idea migliore di come dovrebbe essere, e quale algoritmo applicare, ma probabilmente richiederebbe molta potenza di calcolo, che non ho (

Oh, anch'io farò qualcosa di simile :))))


mytarmailS:

Per inciso, una domanda del genere, quante ripetizioni di un evento per considerarlo un modello?

Uso il criterio - non meno dell'1% dell'intero campione ed è la "frequenza" del ripetersi di un evento con lo stesso risultato che conta. Non so come misurare la "frequenza".

 
Aleksey Vyazmikin:

Gli esperimenti sono sempre più importanti.

Guardate il primo predittore T1 (Den_Nedeli_S), o meglio la sua griglia

T2


E i giorni della settimana senza conversione del tempo

Come vedete, le griglie sono diverse e ci sono diversi delta tra le cifre, anche se le impostazioni di partizionamento sono le stesse:

Il che significa che si può abbinare la spaccatura in modo più preciso, il che può risultare in un adattamento o in un risultato migliore...

OK. Seno+ coseno è meglio non solo per NS, ma anche per gli alberi.

 
elibrarius:

Bene. Seno+coseno è meglio non solo per NS, ma anche per gli alberi.

Non salterei a questa conclusione - finora possiamo dire che il risultato non è identico.

 

ruota del tempo


.

 
mytarmailS:

Sto pensando di fare una "ricerca completa" .....

Ho solo messo l'ora e il giorno della settimana e il colore della candela...

i dati come una singola settimana, quaranta settimane in tutto, e ha cercato dei modelli al loro interno


Friday_18:20_dw significa venerdì - 18:20 - candela cadente


fiducia - la percentuale di funzionamento della regola 1 è del 100%

count - quante di queste regole sono state trovate

 lhs                          rhs           support confidence coverage lift     count
[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[2]  {Пт_16:15_up}             => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[3]  {Пн_21:0_dw}              => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[4]  {Ср_12:50_dw}             => {Чт_22:55_up} 0.525   1          0.525    1.538462 21   
[5]  {Пт_18:40_dw,Ср_22:15_dw} => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[6]  {Пн_0:0_dw,Пн_9:20_dw}    => {Пн_23:55_dw} 0.500   1          0.500    1.428571 20   
[7]  {Вт_20:40_up,Пн_0:0_dw}   => {Вт_21:5_up}  0.500   1          0.500    1.481481 20   
[8]  {Вт_9:40_dw,Пн_14:50_up}  => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[9]  {Пн_0:0_dw,Чт_1:10_dw}    => {Чт_2:55_dw}  0.500   1          0.500    1.379310 20   
[10] {Пт_9:25_up,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[11] {Пн_14:50_up,Пт_9:25_up}  => {Ср_2:5_dw}   0.500   1          0.500    1.538462 20   
[12] {Вт_13:0_dw,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[13] {Чт_23:55_dw,Чт_4:20_dw}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[14] {Вт_18:55_dw,Пт_1:0_up}   => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[15] {Вт_18:55_dw,Чт_1:0_up}   => {Пн_14:50_up} 0.525   1          0.525    1.290323 21   
[16] {Вт_2:45_up,Пн_9:50_dw}   => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[17] {Вт_2:45_up,Ср_20:40_up}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   


questa regola

[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   

significa che se giovedì all'1AM c'era una candela crescente, venerdì alle 6:20 PM sarà in calo. 20 regole sono state trovate, quindi la regola ha funzionato 20 volte su 20 trovate

IDD...

 
Aleksey Vyazmikin:


Uso il criterio di almeno l'1% dell'intero campione e la "frequenza" di un evento con lo stesso risultato è importante. Non so come misurare la "frequenza".

Gli stessi eventi sono eventi con lo stesso risultato.

100% del campione / % di ripetizione. L'1% è la frequenza, ma senza regolarità. È qui che diventa difficile. Bisogna suddividere in periodi e vedere quanto sono regolari gli eventi. Potete semplicemente usare il minimo e il massimo in un periodo e dividere il minimo per il massimo per ottenere la regolarità relativa e potete usare la radice quadrata media).

 
Oleg avtomat:

la ruota del tempo

si possono aggiungere altri minuti armonici, e sommare le sinusoidi, si otterrà una curva per descrivere i tre segni

Ma che dire delle vacanze e dei fine settimana, bisogna tenere conto di tutto questo, a che diavolo serve tutto questo?
 
mytarmailS: A proposito, quante volte deve essere ripetuto un evento per essere considerato una regolarità?

Ho provato la mia metrica , ma funziona solo per SL=TP, per altri rapporti bisogna contare Hearst.