交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2020.11.18 09:31 #21301

我想的是对规律性的 "全面搜索"，没有像 "下一根蜡烛会发生什么 "之类的目标......。

搜索包括只搜索规律性，目标是找到一个规律性，而不是"下一根蜡烛上会有什么"，规律性也可以在时间上拉长，例如，如果今天是 "事件1"，然后是 "事件2"，然后是 "事件3"... 例如，如果今天我们有 "事件1"，然后是 " 事件3"，那么明天14:05将是一个上升的蜡烛或类似的东西)

我对它应该是什么样子以及应用什么算法有了更好的想法，但我可能需要一些计算能力，而我没有(

顺便问一个问题，一个事件重复多少次才算是一个模式？

Aleksey Vyazmikin 2020.11.18 09:44 #21302

elibrarius:

理论上，应该是一样的。
日、时、分的不同选项数量等于正弦和余弦的选项数量。7天内有10080个不同的值，每分钟都在变化。
如果在训练中存在任何随机性，这可能是造成差异的原因。

你一直在用什么进行训练，猫粮吗？

实验总是更重要。

看看第一个预测器T1（Den_Nedeli_S），或者更确切地说，它的网格

T2

以及没有时间转换的一周内的日子。

正如你所看到的，尽管分区设置是相同的，但网格是不同的，数字之间也有不同的三角关系。

catboost-0.24.1.exe fit  --learn-set train.csv   --test-set test.csv     --column-description %%a        --has-header    --delimiter ;   --model-format CatboostBinary,CPP       --train-dir ..\Rezultat\RS_208\result_4_%%a     --depth 6       --iterations 1000       --nan-mode Forbidden    --learning-rate 0.03    --rsm 1         --fold-permutation-block 1      --boosting-type Plain   --l2-leaf-reg 6         --loss-function Logloss         --use-best-model        --eval-metric Logloss   --custom-metric Logloss         --od-type Iter  --od-wait 100   --random-seed 0         --random-strength 1     --auto-class-weights SqrtBalanced       --sampling-frequency PerTreeLevel       --border-count 208      --feature-border-type MinEntropy        --output-borders-file quant_4_00208.csv         --bootstrap-type Bayesian       --bagging-temperature 1         --leaf-estimation-method Newton         --leaf-estimation-iterations 10

这意味着你可以更精确地匹配分裂，这可能导致适合或更好的结果......

Aleksey Vyazmikin 2020.11.18 09:48 #21303

mytarmailS:

我想的是对规律性的 "全面搜索"，没有像 "下一根蜡烛会发生什么 "之类的目标......。

搜索包括只搜索规律性，目标是找到一个规律性，而不是"下一根蜡烛上会有什么"，规律性也可以在时间上拉长，例如，如果今天是 "事件1"，然后是 "事件2"，然后是 "事件3"... 例如，如果今天我们有 "事件1"，然后是 " 事件3"，那么明天14:05将是一个上升的蜡烛或类似的东西)

我对它应该是什么样子，以及应用哪种算法有更好的想法，但这可能需要大量的计算能力，而我并没有这种能力(

哦，我也会做类似的事情 :))))

mytarmailS:

顺便说一句，这样的问题，一个事件重复多少次才算是一个模式？

我使用的标准是--不低于整个样本的1%，重要的是相同结果的事件重复出现的 "频率"。我不知道如何测量 "频率"。

Forester 2020.11.18 10:13 #21304

Aleksey Vyazmikin:

实验总是更重要。

看看第一个预测器T1（Den_Nedeli_S），或者说它的网格

T2

和一周的日子，没有时间转换

正如你所看到的，尽管分区设置是相同的，但网格是不同的，数字之间有不同的三角洲。

这意味着你可以更准确地匹配分裂，这可能导致适合或改进的结果...

好的。正弦+余弦不仅对NS来说更好，对树来说也是如此。

Aleksey Vyazmikin 2020.11.18 10:24 #21305

elibrarius:

很好。正弦+余弦不仅对NS来说更好，而且对树木来说也更好。

我不会跳到这个结论--到目前为止，我们可以说结果并不完全相同。

[删除] 2020.11.18 10:45 #21306

时间之轮

.

mytarmailS 2020.11.18 10:52 #21307

mytarmailS:

我在考虑做一个 "全面搜索".....。

我只是把时间和星期以及蜡烛的颜色填进去...

将数据作为一个星期，共40个星期，并在其中寻找模式。

周五_18:20_dw意味着周五--18:20--下降的蜡烛

信度 - 规则1工作的百分比是100%

计数 - 找到多少条这样的规则

 lhs                          rhs           support confidence coverage lift     count
[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[2]  {Пт_16:15_up}             => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[3]  {Пн_21:0_dw}              => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[4]  {Ср_12:50_dw}             => {Чт_22:55_up} 0.525   1          0.525    1.538462 21   
[5]  {Пт_18:40_dw,Ср_22:15_dw} => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[6]  {Пн_0:0_dw,Пн_9:20_dw}    => {Пн_23:55_dw} 0.500   1          0.500    1.428571 20   
[7]  {Вт_20:40_up,Пн_0:0_dw}   => {Вт_21:5_up}  0.500   1          0.500    1.481481 20   
[8]  {Вт_9:40_dw,Пн_14:50_up}  => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[9]  {Пн_0:0_dw,Чт_1:10_dw}    => {Чт_2:55_dw}  0.500   1          0.500    1.379310 20   
[10] {Пт_9:25_up,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[11] {Пн_14:50_up,Пт_9:25_up}  => {Ср_2:5_dw}   0.500   1          0.500    1.538462 20   
[12] {Вт_13:0_dw,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[13] {Чт_23:55_dw,Чт_4:20_dw}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[14] {Вт_18:55_dw,Пт_1:0_up}   => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[15] {Вт_18:55_dw,Чт_1:0_up}   => {Пн_14:50_up} 0.525   1          0.525    1.290323 21   
[16] {Вт_2:45_up,Пн_9:50_dw}   => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[17] {Вт_2:45_up,Ср_20:40_up}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20

这条规则

[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20

这意味着，如果周四凌晨1点有一根上升的蜡烛，那么周五下午6点20分它就会下降。

国际残疾人联合会...

Valeriy Yastremskiy 2020.11.18 10:54 #21308

Aleksey Vyazmikin:

我使用的标准是至少占整个样本的1%，具有相同结果的事件的 "频率 "很重要。我不知道如何衡量 "频率"。

相同事件是指具有相同结果的事件。

100%的样品/%的重复率。1%是频率，但没有规律性。这就是它变得棘手的地方。你需要把它分成几个时期，看看这些事件有多大的规律性。你可以简单地使用一个时期的最小值和最大值，用最小值除以最大值来得到相对的规律性，你可以使用均方根）。

mytarmailS 2020.11.18 10:57 #21309

Oleg avtomat:

时间之轮

你可以添加更多的谐波分量，并将正弦波相加，你将得到一条曲线来描述三个标志。

但是节假日和周末呢，你需要考虑到这一切，这一切到底有什么意义呢？

Rorschach 2020.11.18 11:00 #21310

mytarmailS：顺便问一下，一个事件应该重复多少次才能被认为是规律性的？

我试过自己的衡量标准，但它只适用于SL=TP，对于其他比例，你必须计算赫斯特。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2131