交易中的机器学习：理论、模型、实践和算法交易

Dr. Trader 2016.12.03 00:17 #2371

Vizard_。

我现在对模型参数进行了充分的选择，训练，预测，现在得到了0.69102。用上一个数据集是0.69121，这周要好一些，但这是由机会造成的，模型基本上是一样的。下周它将再次把我扔到+-0.0002的地方。

对我来说，这已经是目前的极限了，我的模型是在21个初始预测器上训练的，没有任何技巧。以外汇为例，我从终端下载不同的指标并选择其参数。也就是说，我从4个预测因子（ohlc）中得到数千个指标，然后我把它们筛选出来，只留下三十件，然后教给模型。
理想情况下，我应该以某种方式制作数以千计的这21个numerai预测器，并筛选出不必要的东西。但是，指标是可以使用ohlc行的，但不是如此均匀的行，我应该考虑如何从它们中产生更多的新指标。

我已经给他们发了另一个文件，所有预测值=0.5，得分=0.69315，你可以用它来比较。

mytarmailS 2016.12.03 09:42 #2372

蜥蜴_。
No....

我明白了，那我就不给这个话题添乱了

Dr.Trader:

我得想办法从他们身上产生更多的新的东西。

也许应该增加一个滑动的窗口？

toxic 2016.12.03 11:25 #2373

Dr.Trader:

我现在对模型参数进行了充分的选择，训练，预测，现在得到了0.69102。最后一个数据集是0.69121...

而我已经失去了这一切，情况更糟，在RF上的最低值为0.69120，试过MLP，但它根本不起作用。

SZS看这里的帖子是在某种奇怪的算法上擦的（（）。

mytarmailS 2016.12.03 13:24 #2374

蜥蜴_。
我不知道该怎么处理它们，但它们都是这样的）。而且都以同样的方式结束。这是正常的+，论坛早就是一个集市了。而这个实验是可以做的。
越是这样，因为其中也有积极的方面。只要看看树是如何建立在随机和BP上的。如何看待模型--T
关于不同的随机性。诸如此类，不一而足。十年前，我曾经把梅花和天狗都放进网格，世界上不同港口的潮汐数据，以及梅花的洄游路径
的动物等，这是一个正常人不会想到的）。想怎么写就怎么写，想怎么用就怎么用，只是不要轻易下结论。

#生成随机，至少10K个观察值
write.csv2(x, file = "D:/1.csv", row.names = FALSE, quote = FALSE) #写到磁盘D:/的1.csv文件中

-----------

好一个窗口））））顺便说一下，这个Chelong虽然没有用，但也有有趣的时刻。例如，参赛者上传校准数据的方式。
这使我们能够推测任务的作者所使用的数据预处理......。

福雷斯特早就不在了，只是在前两篇文章中，然后我写道，我开始以 "我的方式 "选择模式，即我在寻找好的集群时描述的方式--又称模式...

我附上图案。

这是一个训练有素的同居者

你给它提供过去10个价格中位数的值

MD <- 价格中位数

MD <- scale(MD,T,T) # 像这样归一化

library(SOMbrero) # 用cohonen运行软件包。

MD[is.na(MD)] <- 0 # 替换可能的NA值

pred <- predict(model,MD) predict cluster

如果集群是41号(pred==41)，那么就可以买入，不要再品尝了......

试试吧，也许会对你有用

附加的文件：

som.model.10scales.41buy.RData.zip 7585 kb

mytarmailS 2016.12.03 21:53 #2375

想来想去也想不出个所以然来))，谁有什么想法....

我们有两种蜡烛的配置

从图中可以看出，其实烛台形态是一样的，区别在于波动率，我们如何在数学上将这两种形态归为同一形态？

你可能会说，是的，我们应该把它正常化，但零点的转移，这很重要......。

就像图片中一样。

解释一下，想象一下，我们想知道当前、前一个和上一个烛台的颜色，我们该怎么做。

关闭-打开 , 关闭[-1]-打开[-1] , 关闭[-2]-打开[-2]

我们得到一个如图"1 " 的图表，一切都很清晰明了，零点以上的都是白色蜡烛，零点以下的都是黑色蜡烛。

现在让我们来解决波动性问题（第一个图表中出现的问题）。我们需要在一定范围内对图表进行归一化处理，如图"2 " 所示，但归一化处理后我们得到一个新的零轴，其中不包含任何信息。

如何将数据归一化，使 "零是公平的"，解决波动性问题？你有什么想法？

Dr. Trader 2016.12.04 02:02 #2376

mytarmailS:

如何对数据进行归一化，以消除 "零是公平的 "和波动性问题？你有什么想法？

我是这样做的--

你在图表上总共有8个点--O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)
此外，这些点O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)可以被赋予序列值1,2,3,4,5,6,7, 8。
OHLC - 开盘、高点、低点、收盘
(0)和(1)--栏位数

这些点可以按照图表上的价格降序排列，从高到低--H(0), H(1), O(0), C(1), L(0), C(0), O(1), L(1)

而现在H(0), H(1), O(0), C(1), O(0), L(0), O(1), L(1)可以变成一个向量（2, 6, 1, 8, 3, 4, 1, 7），如果需要，可以将它归一化为0-1。

结果会发现，两个情节都会有相同的 "模式"（2，6，1，8，3，4，1，7），它描述了这些点在情节中下降的顺序

不幸的是，我没有能够从中榨取任何好处。只有2根蜡烛，就可以有40320种模式。三支蜡烛=（4*3）!= 479001600图案，等等。现实上它会更少，因为例如在同一个蜡烛中，H总是比O、H、L多；而C则更少。但模式的数量仍然是巨大的。

也就是说，任何烛台的配置都可以被分配一个数字向量，并利用它来检测未来的类似配置。但是通过这种方式获得的可能配置的数量是如此之大，以至于可能不可能找到一些图形模式，之后价格将总是向上/向下走。例如，在 "比尔-威廉姆斯的分形 "策略中，该模式由5根蜡烛组成，在所有可能的数十亿种组合中只有几个组合被交易。

这里有一个更清楚的图片，比如说3个烛台。

并行粒子群优化解读经典和隐藏背离的新途径。第二部分使用 OpenCL 测试烛形形态

mytarmailS 2016.12.04 12:01 #2377

Vizard_:

不，谢谢）））。我只建议从不同的机器中随机抽取...

你没有得到的想法，我可以产生噪音和自己几次，不需要把它推到不同的机器上)

这个想法的要点是这样的。

我正在训练反转的MO，在报价历史上没有这么多的 反转......。报价在波浪中移动（波浪），事实上，如果你想一想，反转的变体数量是相当确定的，它们是头肩顶、双顶、三顶等不同的变体。而这些数字的出现并不是因为它们对市场有什么神话般的影响，而是因为反转的非常变体在波浪运动中是有限的，要么像这样，要么像那样，或者没有别的，事实上，如果我们建立一个市场的图表或累积的Random，或类似于波浪结构的东西，我们会看到，反转的发生有相同的数字，相同的头和肩会在Random...

所以在这里，在D.Trader 抛出的那篇文章中，作者告诉我们，除了我们已经有的抽样之外，还可以为网络产生一些类似的抽样，通过这种方式增加网络的知识基础，从而提高网络的准确性。

由于市场上的反转不多，我想出了一个办法，那就是通过累积随机化，可以得到无限的反转知识库......

你看，我不是在寻找任何可以预测市场的神话力量，)))))。通过测试这个理论，我得到了结果，我把它贴了出来，因为我认为这个结果是乐观的。

Vizard_:

如何将数据归一化，使零点公平，消除波动性问题？

Dr.Trader:

我就是这样做的--

谢谢，我将尝试....

mytarmailS 2016.12.04 13:50 #2378

Dr.Trader:

我是这样做的...........

如果我理解正确的话，这个方法太粗糙了...

让我们来看看最简单的单一蜡烛形态

我们有三个三个模式。

它们都符合一个逻辑模式

o<h , o<c , o>l

阁下 , 阁下 , 阁下

C>O , C>L , C<H

l<o , l<c , l<h

如果我理解正确的话，你的方法将所有三个蜡烛图归类为一个模式，而这并不是好事

mytarmailS 2016.12.04 13:56 #2379

Vizard_。

你如何使数据正常化，从而消除 "零是公平的 "和波动性问题？百分比？

你到底是如何计算出差异的？

例如，高与低的区别

a=高

b = 关闭

(a*100)/b所以？

我不能这样做，网络是地狱，甚至烛台的颜色都是混乱的。

Andrey Dik 2016.12.04 14:00 #2380

mytarmailS:

如果我理解正确的话，这个方法太粗糙了。

尝试用两个数字来描述蜡烛，每个数字都在[-1.0; 1.0]的范围内。这些是O和C相对于H和L的位置。

从你的例子来看，情况是这样的。

1.[-0.8; 0.8]

2.[-0.2; 0.2]

3.[-0.9; -0.1]

交易中的机器学习：理论、模型、实践和算法交易 - 页 238