交易中的机器学习:理论、模型、实践和算法交易 - 页 2131

 

我想的是对规律性的 "全面搜索",没有像 "下一根蜡烛会发生什么 "之类的目标......。

搜索包括只搜索规律性,目标是找到一个规律性,而不是"下一根蜡烛上会有什么",规律性也可以在时间上拉长,例如,如果今天是 "事件1",然后 "事件2",然后是 "事件3"... 例如,如果今天我们有 "事件1",然后是 " 事件3",那么明天14:05将是一个上升的蜡烛或类似的东西)

我对它应该是什么样子以及应用什么算法有了更好的想法,但我可能需要一些计算能力,而我没有(


顺便问一个问题,一个事件重复多少次才算是一个模式?

 
elibrarius:

理论上,应该是一样的。
日、时、分的不同选项数量等于正弦和余弦的选项数量。7天内有10080个不同的值,每分钟都在变化。
如果在训练中存在任何随机性,这可能是造成差异的原因。

你一直在用什么进行训练,猫粮吗?

实验总是更重要。

看看第一个预测器T1(Den_Nedeli_S),或者更确切地说,它的网格

T2


以及没有时间转换的一周内的日子

正如你所看到的,尽管分区设置是相同的,但网格是不同的,数字之间也有不同的三角关系。

catboost-0.24.1.exe fit  --learn-set train.csv   --test-set test.csv     --column-description %%a        --has-header    --delimiter ;   --model-format CatboostBinary,CPP       --train-dir ..\Rezultat\RS_208\result_4_%%a     --depth 6       --iterations 1000       --nan-mode Forbidden    --learning-rate 0.03    --rsm 1         --fold-permutation-block 1      --boosting-type Plain   --l2-leaf-reg 6         --loss-function Logloss         --use-best-model        --eval-metric Logloss   --custom-metric Logloss         --od-type Iter  --od-wait 100   --random-seed 0         --random-strength 1     --auto-class-weights SqrtBalanced       --sampling-frequency PerTreeLevel       --border-count 208      --feature-border-type MinEntropy        --output-borders-file quant_4_00208.csv         --bootstrap-type Bayesian       --bagging-temperature 1         --leaf-estimation-method Newton         --leaf-estimation-iterations 10        

这意味着你可以更精确地匹配分裂,这可能导致适合或更好的结果......

 
mytarmailS:

我想的是对规律性的 "全面搜索",没有像 "下一根蜡烛会发生什么 "之类的目标......。

搜索包括只搜索规律性,目标是找到一个规律性,而不是"下一根蜡烛上会有什么",规律性也可以在时间上拉长,例如,如果今天是 "事件1",然后 "事件2",然后是 "事件3"... 例如,如果今天我们有 "事件1",然后是 " 事件3",那么明天14:05将是一个上升的蜡烛或类似的东西)

我对它应该是什么样子,以及应用哪种算法有更好的想法,但这可能需要大量的计算能力,而我并没有这种能力(

哦,我也会做类似的事情 :))))


mytarmailS:

顺便说一句,这样的问题,一个事件重复多少次才算是一个模式?

我使用的标准是--不低于整个样本的1%,重要的是相同结果的事件重复出现的 "频率"。我不知道如何测量 "频率"。

 
Aleksey Vyazmikin:

实验总是更重要。

看看第一个预测器T1(Den_Nedeli_S),或者说它的网格

T2


一周的日子,没有时间转换

正如你所看到的,尽管分区设置是相同的,但网格是不同的,数字之间有不同的三角洲。

这意味着你可以更准确地匹配分裂,这可能导致适合或改进的结果...

好的。正弦+余弦不仅对NS来说更好,对树来说也是如此。

 
elibrarius:

很好。正弦+余弦不仅对NS来说更好,而且对树木来说也更好。

我不会跳到这个结论--到目前为止,我们可以说结果并不完全相同。

 

时间之轮


.

 
mytarmailS:

我在考虑做一个 "全面搜索".....。

我只是把时间和星期 以及蜡烛的颜色填进去...

将数据作为一个星期,共40个星期,并在其中寻找模式。


周五_18:20_dw意味着周五--18:20--下降的蜡烛


信度 - 规则1工作的百分比是100%

计数 - 找到多少条这样的规则

 lhs                          rhs           support confidence coverage lift     count
[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[2]  {Пт_16:15_up}             => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[3]  {Пн_21:0_dw}              => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[4]  {Ср_12:50_dw}             => {Чт_22:55_up} 0.525   1          0.525    1.538462 21   
[5]  {Пт_18:40_dw,Ср_22:15_dw} => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[6]  {Пн_0:0_dw,Пн_9:20_dw}    => {Пн_23:55_dw} 0.500   1          0.500    1.428571 20   
[7]  {Вт_20:40_up,Пн_0:0_dw}   => {Вт_21:5_up}  0.500   1          0.500    1.481481 20   
[8]  {Вт_9:40_dw,Пн_14:50_up}  => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[9]  {Пн_0:0_dw,Чт_1:10_dw}    => {Чт_2:55_dw}  0.500   1          0.500    1.379310 20   
[10] {Пт_9:25_up,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[11] {Пн_14:50_up,Пт_9:25_up}  => {Ср_2:5_dw}   0.500   1          0.500    1.538462 20   
[12] {Вт_13:0_dw,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[13] {Чт_23:55_dw,Чт_4:20_dw}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[14] {Вт_18:55_dw,Пт_1:0_up}   => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[15] {Вт_18:55_dw,Чт_1:0_up}   => {Пн_14:50_up} 0.525   1          0.525    1.290323 21   
[16] {Вт_2:45_up,Пн_9:50_dw}   => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[17] {Вт_2:45_up,Ср_20:40_up}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   


这条规则

[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   

这意味着,如果周四凌晨1点有一根上升的蜡烛,那么周五下午6点20分它就会下降。

国际残疾人联合会...

 
Aleksey Vyazmikin:


我使用的标准是至少占整个样本的1%,具有相同结果的事件的 "频率 "很重要。我不知道如何衡量 "频率"。

相同事件是指具有相同结果的事件。

100%的样品/%的重复率。1%是频率,但没有规律性。这就是它变得棘手的地方。你需要把它分成几个时期,看看这些事件有多大的规律性。你可以简单地使用一个时期的最小值和最大值,用最小值除以最大值来得到相对的规律性,你可以使用均方根)。

 
Oleg avtomat:

时间之轮

你可以添加更多的谐波分量,并将正弦波相加,你将得到一条曲线来描述三个标志。

但是节假日和周末呢,你需要考虑到这一切,这一切到底有什么意义呢?
 
mytarmailS:顺便问一下,一个事件应该重复多少次才能被认为是规律性的?

我试过自己的衡量标准 ,但它只适用于SL=TP,对于其他比例,你必须计算赫斯特。

原因: