交易中的机器学习:理论、模型、实践和算法交易 - 页 238

 
Vizard_

我现在对模型参数进行了充分的选择,训练,预测,现在得到了0.69102。用上一个数据集是0.69121,这周要好一些,但这是由机会造成的,模型基本上是一样的。下周它将再次把我扔到+-0.0002的地方。

对我来说,这已经是目前的极限了,我的模型是在21个初始预测器上训练的,没有任何技巧。以外汇为例,我从终端下载不同的指标并选择其参数。也就是说,我从4个预测因子(ohlc)中得到数千个指标,然后我把它们筛选出来,只留下三十件,然后教给模型。
理想情况下,我应该以某种方式制作数以千计的这21个numerai预测器,并筛选出不必要的东西。但是,指标是可以使用ohlc行的,但不是如此均匀 的行,我应该考虑如何从它们中产生更多的新指标。

我已经给他们发了另一个文件,所有预测值=0.5,得分=0.69315,你可以用它来比较。
 
蜴_
No....

我明白了,那我就不给这个话题添乱了

Dr.Trader:

我得想办法从他们身上产生更多的新的东西。

也许应该增加一个滑动的窗口?
 
Dr.Trader:

我现在对模型参数进行了充分的选择,训练,预测,现在得到了0.69102。最后一个数据集是0.69121...

而我已经失去了这一切,情况更糟,在RF上的最低值为0.69120,试过MLP,但它根本不起作用。

SZS看这里的帖子是在某种奇怪的算法上擦的(()。

 
蜴_
我不知道该怎么处理它们,但它们都是这样的)。而且都以同样的方式结束。这是正常的+,论坛早就是一个集市了。而这个实验是可以做的。
越是这样,因为其中也有积极的方面。只要看看树是如何建立在随机和BP上的。如何看待模型--T
关于不同的随机性。诸如此类,不一而足。十年前,我曾经把梅花和天狗都放进网格,世界上不同港口的潮汐数据,以及梅花的洄游路径
的动物等,这是一个正常人不会想到的)。想怎么写就怎么写,想怎么用就怎么用,只是不要轻易下结论。

#生成随机,至少10K个观察值
write.csv2(x, file = "D:/1.csv", row.names = FALSE, quote = FALSE) #写到磁盘D:/的1.csv文件中

-----------

好一个窗口))))顺便说一下,这个Chelong虽然没有用,但也有有趣的时刻。例如,参赛者上传校准数据的方式。
这使我们能够推测任务的作者所使用的数据预处理......。

福雷斯特早就不在了,只是在前两篇文章中,然后我写道,我开始以 "我的方式 "选择模式,即我在寻找好的集群时描述的方式--又称模式...

我附上图案。

这是一个训练有素的同居者

你给它提供过去10个价格中位数的值

MD <- 价格中位数

MD <- scale(MD,T,T) # 像这样归一化

library(SOMbrero) # 用cohonen运行软件包。

MD[is.na(MD)] <- 0 # 替换可能的NA值

pred <- predict(model,MD) predict cluster

如果集群是41号(pred==41),那么就可以买入,不要再品尝了......

试试吧,也许会对你有用

附加的文件:
 

想来想去也想不出个所以然来)),谁有什么想法....

我们有两种蜡烛的配置

я

从图中可以看出,其实烛台形态是一样的,区别在于波动率,我们如何在数学上将这两种形态归为同一形态?

你可能会说,是的,我们应该把它正常化,但零点的转移,这很重要......。

就像图片中一样。

с

解释一下,想象一下,我们想知道当前、前一个和上一个烛台的颜色,我们该怎么做。

关闭-打开 , 关闭[-1]-打开[-1] , 关闭[-2]-打开[-2]

我们得到一个如图"1 " 的图表,一切都很清晰明了,零点以上的都是白色蜡烛,零点以下的都是黑色蜡烛。

现在让我们来解决波动性问题(第一个图表中出现的问题)。 我们需要在一定范围内对图表进行归一化处理,如图"2 " 所示,但归一化处理后我们得到一个新的零轴,其中不包含任何信息。

如何 将数据归一化,使 "零是公平的",解决波动性问题?你有什么想法?


 
mytarmailS:

如何 对数据进行归一化,以消除 "零是公平的 "和波动性问题?你有什么想法?

我是这样做的--

你在图表上总共有8个点--O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)
此外,这些点O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)可以被赋予序列值1,2,3,4,5,6,7, 8。
OHLC - 开盘、高点、低点、收盘
(0)和(1)--栏位数

这些点可以按照图表上的价格降序排列,从高到低--H(0), H(1), O(0), C(1), L(0), C(0), O(1), L(1)

而现在H(0), H(1), O(0), C(1), O(0), L(0), O(1), L(1)可以变成一个向量(2, 6, 1, 8, 3, 4, 1, 7),如果需要,可以将它归一化为0-1。

结果会发现,两个情节都会有相同的 "模式"(2,6,1,8,3,4,1,7),它描述了这些点在情节中下降的顺序

不幸的是,我没有能够从中榨取任何好处。只有2根蜡烛,就可以有40320种模式。三支蜡烛=(4*3)!= 479001600图案,等等。现实上它会更少,因为例如在同一个蜡烛中,H总是比O、H、L多;而C则更少。但模式的数量仍然是巨大的。

也就是说,任何烛台的配置都可以被分配一个数字向量,并利用它来检测未来的类似配置。但是通过这种方式获得的可能配置的数量是如此之大,以至于可能不可能找到一些图形模式,之后价格将总是向上/向下走。例如,在 "比尔-威廉姆斯的分形 "策略中,该模式由5根蜡烛组成,在所有可能的数十亿种组合中只有几个组合被交易。

这里有一个更清楚的图片,比如说3个烛台。

 
Vizard_:

不,谢谢)))。我只建议从不同的机器中随机抽取...

你没有得到的想法,我可以产生噪音和自己几次,不需要把它推到不同的机器上)

这个想法的要点是这样的。

我正在训练反转的MO,在报价历史上没有这么多的 反转......。报价在波浪中移动(波浪),事实上,如果你想一想,反转的变体数量是相当确定的,它们是头肩顶、双顶、三顶等不同的变体。而这些数字的出现并不是因为它们对市场有什么神话般的影响,而是因为反转的非常变体在波浪运动中是有限的,要么像这样,要么像那样,或者没有别的,事实上,如果我们建立一个市场的图表或累积的Random,或类似于波浪结构的东西,我们会看到,反转的发生有相同的数字,相同的头和肩会在Random...

所以在这里,在D.Trader 抛出的那篇文章中,作者告诉我们,除了我们已经有的抽样之外,还可以为网络产生一些类似的抽样,通过这种方式增加网络的知识基础,从而提高网络的准确性。

由于市场上的反转不多,我想出了一个办法,那就是通过累积随机化,可以得到无限的反转知识库......

你看,我不是在寻找任何可以预测市场的神话力量,)))))。通过测试这个理论,我得到了结果,我把它贴了出来,因为我认为这个结果是乐观的。

Vizard_:

如何将数据归一化,使零点公平,消除波动性问题?

Dr.Trader:

我就是这样做的--

谢谢,我将尝试....

 
Dr.Trader:

我是这样做的...........

如果我理解正确的话,这个方法太粗糙了...

让我们来看看最简单的单一蜡烛形态

我们有三个三个模式。

ч

它们都符合一个逻辑模式

o<h , o<c , o>l

阁下 , 阁下 , 阁下

C>O , C>L , C<H

l<o , l<c , l<h

如果我理解正确的话,你的方法将所有三个蜡烛图归类为一个模式,而这并不是好事

 
Vizard_

如何 使数据正常化,从而消除 "零是公平的 "和波动性问题?百分比

你到底是如何计算出差异的?

例如,高与低的区别

a=高

b = 关闭

(a*100)/b所以?

我不能这样做,网络是地狱,甚至烛台的颜色都是混乱的。

 
mytarmailS:

如果我理解正确的话,这个方法太粗糙了。

尝试用两个数字来描述蜡烛,每个数字都在[-1.0; 1.0]的范围内。这些是O和C相对于H和L的位置。
从你的例子来看,情况是这样的。
1.[-0.8; 0.8]
2.[-0.2; 0.2]
3.[-0.9; -0.1]