交易中的机器学习:理论、模型、实践和算法交易 - 页 238 1...231232233234235236237238239240241242243244245...3399 新评论 Dr. Trader 2016.12.03 00:17 #2371 Vizard_。我现在对模型参数进行了充分的选择,训练,预测,现在得到了0.69102。用上一个数据集是0.69121,这周要好一些,但这是由机会造成的,模型基本上是一样的。下周它将再次把我扔到+-0.0002的地方。对我来说,这已经是目前的极限了,我的模型是在21个初始预测器上训练的,没有任何技巧。以外汇为例,我从终端下载不同的指标并选择其参数。也就是说,我从4个预测因子(ohlc)中得到数千个指标,然后我把它们筛选出来,只留下三十件,然后教给模型。 理想情况下,我应该以某种方式制作数以千计的这21个numerai预测器,并筛选出不必要的东西。但是,指标是可以使用ohlc行的,但不是如此均匀 的行,我应该考虑如何从它们中产生更多的新指标。 我已经给他们发了另一个文件,所有预测值=0.5,得分=0.69315,你可以用它来比较。 mytarmailS 2016.12.03 09:42 #2372 蜥蜴_。 No....我明白了,那我就不给这个话题添乱了Dr.Trader:我得想办法从他们身上产生更多的新的东西。 也许应该增加一个滑动的窗口? toxic 2016.12.03 11:25 #2373 Dr.Trader:我现在对模型参数进行了充分的选择,训练,预测,现在得到了0.69102。最后一个数据集是0.69121...而我已经失去了这一切,情况更糟,在RF上的最低值为0.69120,试过MLP,但它根本不起作用。SZS看这里的帖子是在某种奇怪的算法上擦的(()。 mytarmailS 2016.12.03 13:24 #2374 蜥蜴_。 我不知道该怎么处理它们,但它们都是这样的)。而且都以同样的方式结束。这是正常的+,论坛早就是一个集市了。而这个实验是可以做的。 越是这样,因为其中也有积极的方面。只要看看树是如何建立在随机和BP上的。如何看待模型--T 关于不同的随机性。诸如此类,不一而足。十年前,我曾经把梅花和天狗都放进网格,世界上不同港口的潮汐数据,以及梅花的洄游路径 的动物等,这是一个正常人不会想到的)。想怎么写就怎么写,想怎么用就怎么用,只是不要轻易下结论。#生成随机,至少10K个观察值 write.csv2(x, file = "D:/1.csv", row.names = FALSE, quote = FALSE) #写到磁盘D:/的1.csv文件中----------- 好一个窗口))))顺便说一下,这个Chelong虽然没有用,但也有有趣的时刻。例如,参赛者上传校准数据的方式。 这使我们能够推测任务的作者所使用的数据预处理......。福雷斯特早就不在了,只是在前两篇文章中,然后我写道,我开始以 "我的方式 "选择模式,即我在寻找好的集群时描述的方式--又称模式...我附上图案。这是一个训练有素的同居者你给它提供过去10个价格中位数的值MD <- 价格中位数MD <- scale(MD,T,T) # 像这样归一化library(SOMbrero) # 用cohonen运行软件包。MD[is.na(MD)] <- 0 # 替换可能的NA值pred <- predict(model,MD) predict cluster如果集群是41号(pred==41),那么就可以买入,不要再品尝了......试试吧,也许会对你有用 附加的文件: som.model.10scales.41buy.RData.zip 7585 kb mytarmailS 2016.12.03 21:53 #2375 想来想去也想不出个所以然来)),谁有什么想法....我们有两种蜡烛的配置从图中可以看出,其实烛台形态是一样的,区别在于波动率,我们如何在数学上将这两种形态归为同一形态?你可能会说,是的,我们应该把它正常化,但零点的转移,这很重要......。就像图片中一样。解释一下,想象一下,我们想知道当前、前一个和上一个烛台的颜色,我们该怎么做。关闭-打开 , 关闭[-1]-打开[-1] , 关闭[-2]-打开[-2]我们得到一个如图"1 " 的图表,一切都很清晰明了,零点以上的都是白色蜡烛,零点以下的都是黑色蜡烛。现在让我们来解决波动性问题(第一个图表中出现的问题)。 我们需要在一定范围内对图表进行归一化处理,如图"2 " 所示,但归一化处理后我们得到一个新的零轴,其中不包含任何信息。如何 将数据归一化,使 "零是公平的",解决波动性问题?你有什么想法? Dr. Trader 2016.12.04 02:02 #2376 mytarmailS:如何 对数据进行归一化,以消除 "零是公平的 "和波动性问题?你有什么想法?我是这样做的--你在图表上总共有8个点--O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1) 此外,这些点O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)可以被赋予序列值1,2,3,4,5,6,7, 8。 OHLC - 开盘、高点、低点、收盘(0)和(1)--栏位数这些点可以按照图表上的价格降序排列,从高到低--H(0), H(1), O(0), C(1), L(0), C(0), O(1), L(1)而现在H(0), H(1), O(0), C(1), O(0), L(0), O(1), L(1)可以变成一个向量(2, 6, 1, 8, 3, 4, 1, 7),如果需要,可以将它归一化为0-1。结果会发现,两个情节都会有相同的 "模式"(2,6,1,8,3,4,1,7),它描述了这些点在情节中下降的顺序不幸的是,我没有能够从中榨取任何好处。只有2根蜡烛,就可以有40320种模式。三支蜡烛=(4*3)!= 479001600图案,等等。现实上它会更少,因为例如在同一个蜡烛中,H总是比O、H、L多;而C则更少。但模式的数量仍然是巨大的。也就是说,任何烛台的配置都可以被分配一个数字向量,并利用它来检测未来的类似配置。但是通过这种方式获得的可能配置的数量是如此之大,以至于可能不可能找到一些图形模式,之后价格将总是向上/向下走。例如,在 "比尔-威廉姆斯的分形 "策略中,该模式由5根蜡烛组成,在所有可能的数十亿种组合中只有几个组合被交易。这里有一个更清楚的图片,比如说3个烛台。 真实与生成的分时 - 算法交易, 交易机器人 平台启动 - 高级用户选项 - mytarmailS 2016.12.04 12:01 #2377 Vizard_: 不,谢谢)))。我只建议从不同的机器中随机抽取...你没有得到的想法,我可以产生噪音和自己几次,不需要把它推到不同的机器上)这个想法的要点是这样的。我正在训练反转的MO,在报价历史上没有这么多的 反转......。报价在波浪中移动(波浪),事实上,如果你想一想,反转的变体数量是相当确定的,它们是头肩顶、双顶、三顶等不同的变体。而这些数字的出现并不是因为它们对市场有什么神话般的影响,而是因为反转的非常变体在波浪运动中是有限的,要么像这样,要么像那样,或者没有别的,事实上,如果我们建立一个市场的图表或累积的Random,或类似于波浪结构的东西,我们会看到,反转的发生有相同的数字,相同的头和肩会在Random...所以在这里,在D.Trader 抛出的那篇文章中,作者告诉我们,除了我们已经有的抽样之外,还可以为网络产生一些类似的抽样,通过这种方式增加网络的知识基础,从而提高网络的准确性。由于市场上的反转不多,我想出了一个办法,那就是通过累积随机化,可以得到无限的反转知识库......你看,我不是在寻找任何可以预测市场的神话力量,)))))。通过测试这个理论,我得到了结果,我把它贴了出来,因为我认为这个结果是乐观的。Vizard_: 如何将数据归一化,使零点公平,消除波动性问题?Dr.Trader: 我就是这样做的--谢谢,我将尝试.... mytarmailS 2016.12.04 13:50 #2378 Dr.Trader:我是这样做的...........如果我理解正确的话,这个方法太粗糙了...让我们来看看最简单的单一蜡烛形态我们有三个三个模式。它们都符合一个逻辑模式o<h , o<c , o>l阁下 , 阁下 , 阁下C>O , C>L , C<Hl<o , l<c , l<h如果我理解正确的话,你的方法将所有三个蜡烛图归类为一个模式,而这并不是好事 mytarmailS 2016.12.04 13:56 #2379 Vizard_。你如何 使数据正常化,从而消除 "零是公平的 "和波动性问题?百分比?你到底是如何计算出差异的?例如,高与低的区别a=高b = 关闭(a*100)/b所以?我不能这样做,网络是地狱,甚至烛台的颜色都是混乱的。 Andrey Dik 2016.12.04 14:00 #2380 mytarmailS:如果我理解正确的话,这个方法太粗糙了。 尝试用两个数字来描述蜡烛,每个数字都在[-1.0; 1.0]的范围内。这些是O和C相对于H和L的位置。从你的例子来看,情况是这样的。1.[-0.8; 0.8]2.[-0.2; 0.2]3.[-0.9; -0.1] 1...231232233234235236237238239240241242243244245...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
我现在对模型参数进行了充分的选择,训练,预测,现在得到了0.69102。用上一个数据集是0.69121,这周要好一些,但这是由机会造成的,模型基本上是一样的。下周它将再次把我扔到+-0.0002的地方。
对我来说,这已经是目前的极限了,我的模型是在21个初始预测器上训练的,没有任何技巧。以外汇为例,我从终端下载不同的指标并选择其参数。也就是说,我从4个预测因子(ohlc)中得到数千个指标,然后我把它们筛选出来,只留下三十件,然后教给模型。
我已经给他们发了另一个文件,所有预测值=0.5,得分=0.69315,你可以用它来比较。理想情况下,我应该以某种方式制作数以千计的这21个numerai预测器,并筛选出不必要的东西。但是,指标是可以使用ohlc行的,但不是如此均匀 的行,我应该考虑如何从它们中产生更多的新指标。
No....
我明白了,那我就不给这个话题添乱了
我得想办法从他们身上产生更多的新的东西。
我现在对模型参数进行了充分的选择,训练,预测,现在得到了0.69102。最后一个数据集是0.69121...
而我已经失去了这一切,情况更糟,在RF上的最低值为0.69120,试过MLP,但它根本不起作用。
SZS看这里的帖子是在某种奇怪的算法上擦的(()。
我不知道该怎么处理它们,但它们都是这样的)。而且都以同样的方式结束。这是正常的+,论坛早就是一个集市了。而这个实验是可以做的。
越是这样,因为其中也有积极的方面。只要看看树是如何建立在随机和BP上的。如何看待模型--T
关于不同的随机性。诸如此类,不一而足。十年前,我曾经把梅花和天狗都放进网格,世界上不同港口的潮汐数据,以及梅花的洄游路径
的动物等,这是一个正常人不会想到的)。想怎么写就怎么写,想怎么用就怎么用,只是不要轻易下结论。
#生成随机,至少10K个观察值
write.csv2(x, file = "D:/1.csv", row.names = FALSE, quote = FALSE) #写到磁盘D:/的1.csv文件中
-----------
好一个窗口))))顺便说一下,这个Chelong虽然没有用,但也有有趣的时刻。例如,参赛者上传校准数据的方式。
这使我们能够推测任务的作者所使用的数据预处理......。
福雷斯特早就不在了,只是在前两篇文章中,然后我写道,我开始以 "我的方式 "选择模式,即我在寻找好的集群时描述的方式--又称模式...
我附上图案。
这是一个训练有素的同居者
你给它提供过去10个价格中位数的值
MD <- 价格中位数
MD <- scale(MD,T,T) # 像这样归一化
library(SOMbrero) # 用cohonen运行软件包。
MD[is.na(MD)] <- 0 # 替换可能的NA值
pred <- predict(model,MD) predict cluster
如果集群是41号(pred==41),那么就可以买入,不要再品尝了......
试试吧,也许会对你有用
想来想去也想不出个所以然来)),谁有什么想法....
我们有两种蜡烛的配置
从图中可以看出,其实烛台形态是一样的,区别在于波动率,我们如何在数学上将这两种形态归为同一形态?
你可能会说,是的,我们应该把它正常化,但零点的转移,这很重要......。
就像图片中一样。
解释一下,想象一下,我们想知道当前、前一个和上一个烛台的颜色,我们该怎么做。
关闭-打开 , 关闭[-1]-打开[-1] , 关闭[-2]-打开[-2]
我们得到一个如图"1 " 的图表,一切都很清晰明了,零点以上的都是白色蜡烛,零点以下的都是黑色蜡烛。
现在让我们来解决波动性问题(第一个图表中出现的问题)。 我们需要在一定范围内对图表进行归一化处理,如图"2 " 所示,但归一化处理后我们得到一个新的零轴,其中不包含任何信息。
如何 将数据归一化,使 "零是公平的",解决波动性问题?你有什么想法?
如何 对数据进行归一化,以消除 "零是公平的 "和波动性问题?你有什么想法?
我是这样做的--
你在图表上总共有8个点--O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)
此外,这些点O(0), H(0), L(0), C(0), O(1), H(1), L(1), C(1)可以被赋予序列值1,2,3,4,5,6,7, 8。
OHLC - 开盘、高点、低点、收盘
(0)和(1)--栏位数
这些点可以按照图表上的价格降序排列,从高到低--H(0), H(1), O(0), C(1), L(0), C(0), O(1), L(1)
而现在H(0), H(1), O(0), C(1), O(0), L(0), O(1), L(1)可以变成一个向量(2, 6, 1, 8, 3, 4, 1, 7),如果需要,可以将它归一化为0-1。
结果会发现,两个情节都会有相同的 "模式"(2,6,1,8,3,4,1,7),它描述了这些点在情节中下降的顺序
不幸的是,我没有能够从中榨取任何好处。只有2根蜡烛,就可以有40320种模式。三支蜡烛=(4*3)!= 479001600图案,等等。现实上它会更少,因为例如在同一个蜡烛中,H总是比O、H、L多;而C则更少。但模式的数量仍然是巨大的。
也就是说,任何烛台的配置都可以被分配一个数字向量,并利用它来检测未来的类似配置。但是通过这种方式获得的可能配置的数量是如此之大,以至于可能不可能找到一些图形模式,之后价格将总是向上/向下走。例如,在 "比尔-威廉姆斯的分形 "策略中,该模式由5根蜡烛组成,在所有可能的数十亿种组合中只有几个组合被交易。
这里有一个更清楚的图片,比如说3个烛台。
不,谢谢)))。我只建议从不同的机器中随机抽取...
你没有得到的想法,我可以产生噪音和自己几次,不需要把它推到不同的机器上)
这个想法的要点是这样的。
我正在训练反转的MO,在报价历史上没有这么多的 反转......。报价在波浪中移动(波浪),事实上,如果你想一想,反转的变体数量是相当确定的,它们是头肩顶、双顶、三顶等不同的变体。而这些数字的出现并不是因为它们对市场有什么神话般的影响,而是因为反转的非常变体在波浪运动中是有限的,要么像这样,要么像那样,或者没有别的,事实上,如果我们建立一个市场的图表或累积的Random,或类似于波浪结构的东西,我们会看到,反转的发生有相同的数字,相同的头和肩会在Random...
所以在这里,在D.Trader 抛出的那篇文章中,作者告诉我们,除了我们已经有的抽样之外,还可以为网络产生一些类似的抽样,通过这种方式增加网络的知识基础,从而提高网络的准确性。
由于市场上的反转不多,我想出了一个办法,那就是通过累积随机化,可以得到无限的反转知识库......
你看,我不是在寻找任何可以预测市场的神话力量,)))))。通过测试这个理论,我得到了结果,我把它贴了出来,因为我认为这个结果是乐观的。
如何将数据归一化,使零点公平,消除波动性问题?
我就是这样做的--
谢谢,我将尝试....
我是这样做的...........
如果我理解正确的话,这个方法太粗糙了...
让我们来看看最简单的单一蜡烛形态
我们有三个三个模式。
它们都符合一个逻辑模式
o<h , o<c , o>l
阁下 , 阁下 , 阁下
C>O , C>L , C<H
l<o , l<c , l<h
如果我理解正确的话,你的方法将所有三个蜡烛图归类为一个模式,而这并不是好事
你如何 使数据正常化,从而消除 "零是公平的 "和波动性问题?百分比?
你到底是如何计算出差异的?
例如,高与低的区别
a=高
b = 关闭
(a*100)/b所以?
我不能这样做,网络是地狱,甚至烛台的颜色都是混乱的。
如果我理解正确的话,这个方法太粗糙了。