交易中的机器学习:理论、模型、实践和算法交易 - 页 257

 

我有点糊涂了。

这是有代价的。我采取了最后200条,试图对它们进行两类(买入/卖出)的模型训练。我可以训练任何东西,甚至是森林,甚至是神经元,但这将是无用的,因为如果我们把所有的训练实例想象成200维空间中的点,那么这两个类别都均匀地混在那里,试图用超平面来分离它们是不够精确的。

现在有一个更好的选择--各种对冲基金根据价格创建新的预测器(指标、群组、一些公式等等)。而在这些新的预测器上,他们训练与第一点相同的模型,但在这种情况下,他们削减了白菜。

因此,在第二种情况下,任何新的信息都不是在那里形成和添加的,它是200维空间中的所有相同的点,它们在更小的空间中被移动。即这种奇特的降维,将同一类别的点在空间中相互靠近。但机器学习模型 也会这样做,它们也会用自己的算法来降低维度,并将类别移到一起。这两种方法之间有什么区别?

为什么如果你半自动地对空间中的点进行近似,用不同的技巧,然后训练模型,那么它就能发挥作用。但如果你相信模型本身能与原始空间配合,那么它就会失败?在这两种情况下,这些都是类似的操作。

 
Dr.Trader:

现在有一个更好的选择--各种对冲基金根据价格创建新的预测器(指标、群组、一些公式和其他东西)。而在这些新的预测器上,他们训练与第一点相同的模型,但在这种情况下,他们把白菜切开。

...

为什么呢,如果你用各种技巧半自动地对空间中的点进行近似,然后再对模型进行教学,那么就可以了。而如果你相信这个模型能与原始空间本身一起工作,它就会失败?这两种情况下的操作是相似的,不是吗?

难道你没有考虑到大型市场参与者对价格的影响吗?
 
Dr.Trader:

我有点糊涂了。

这是有代价的。我采取了最后200条,试图对它们进行两类(买入/卖出)的模型训练。我可以训练任何东西,甚至是森林,甚至是神经元,但这将是无用的,因为如果我们把所有的训练实例想象成200维空间中的点,那么这两个类别都均匀地混在那里,试图用超平面来分离它们是不够准确的。

现在有一个更好的选择--各种对冲基金根据价格创建新的预测器(指标、群组、一些公式等等)。而在这些新的预测器上,他们训练与第一点相同的模型,但在这种情况下,他们削减了白菜。

因此,在第二种情况下,任何新的信息都不是在那里形成和添加的,它是200维空间中的所有相同的点,它们在更小的空间中被移动。即这样一种奇特的降维,将同一类别的点在空间中相互靠近。但机器学习模型也会这样做,它们也会用自己的算法来降低维度,并将类别移到一起。这两种方法之间有什么区别?

为什么如果你半自动地对空间中的点进行近似,用不同的技巧,然后训练模型,那么它就能发挥作用。但如果你相信模型本身能与原始空间配合,那么它就会失败?毕竟在这两种情况下,这些都是类似的操作。

而我们为什么在原则上需要这个模型?

为什么我们在无线电工程中需要不同的过滤器,而在计量经济学 中也需要?抚平等等,等等....

统计学是一门非常狡猾的科学--你很容易滑向数字游戏。在任何一个步骤。

如果你已经定义了一个目标变量,那么你需要将预测因子与该目标变量相匹配,不是任何预测因子,而是只有那些与该目标变量明确相关的预测因子。始终看着预测器,并试图回答这个问题:"我的这个预测器在我的目标变量中反映了什么属性、特质?而且无论如何:预测者与金融市场有什么关系?

例如,RSI:似乎反映了超买/超卖市场。显然与逆转有关。以此类推。

或者让我们记住伯纳科夫(据我所知,此人已被洪水赶出了现场):具有相当大的滞后期的增量是周期性的一个风向标。

而从总体上讲,需要制定一个一般的、口头上的金融市场模型。

例如,Hindiman的(预测包)。在他看来,市场包括:。

  • 三种趋势
  • 三种类型的噪音
  • 周期性,他有一个恒定的周期,这和生产数据是一致的,比如说农业生产。
这可能不是唯一的方法。但它是确定性的,而不是噪音

用这种方法,你会在咖啡渣、土星环(见占星师名单)上打勾。

也不要忘记金融数据的祸害,称为 "非静止性"。

而且也不要忘记,金融市场的模型几乎总是被过度训练。

我们都赢了吗?熏制竹子...

 
Dr.Trader:

我莫名其妙地感到困惑。

1)也许只是因为基金会不这样做?

2)你需要了解市场是什么,尽管是以你自己的方式...

3)你需要清楚地知道你应该从谁那里拿钱,为什么要拿钱,你需要有自己的具体想法

4)所有的MO等等......这只是一个描述 你的具体想法 的工具箱,但 不是 想法本身,这就是这个分支中的大多数人认为MO会自己想出来的方式

不管这听起来多么华而不实,但我已经设法做出或多或少足够的市场预测,我有一个相当复杂的算法,它需要大约6分钟来计算一个蜡烛,但一些基本元素将在C++中重写。

而这个复杂的算法计算出来的结果必须用我的眼睛来分析,它原来不是自动的,而是半自动的,但在最近的将来,我将尝试用一些模式识别的MO来代替我的视觉分析,顺便说一下,它对MO的识别非常好,不像预测。我用我的眼睛去看每一个输出,然后说:"这个我认为是买入信号,这个我不认为是信号",我根据我的看法创建了目标,这是一个实验,因为我还没有用这个目标做很多数据。..我有100个训练过的样本和50个对照,我训练了一个普通的Forest,你怎么看? Forest认出了90%的新样本

 

下午好,任务。

- 有一个X、Y、Z值的数组。

- 让我们做一个切片--按X从1到1000对第n个Y进行切片。

-有一些最小和最大的点。 如果我们按X切分,那么任何>1的值都很重要。

要看哪种方式来重新计算相对于轴的权重类型。

就是说,开始测量物体。

如果在x-55 y-163单元上收到信号,任务是确定该点与X和Y轴(可能沿对角线)的关系值(重量),以感受该点在物体上的位置。

我认为你需要看向主要的统计特征,分散性、中位数、模式、不对称性。

一般来说,有必要以某种方式开始测量物体,每个单位之间的关系,同时,在物体上的一个点的价值中,要考虑到其他物体的存在。

附加的文件:
eiova.jpg  382 kb
1.jpg  320 kb
 
Top2n:

好时间,任务。

你能不能保持简单,我不知道你想做什么。
 
桑桑尼茨-弗门科


谢谢你,我明白了一些事情。

模型本质上只是将预测器空间优化划分为两个子空间--类-购买和类-销售。
如果我们开始随机地、长时间地创建新的预测器,我们可以帮助模型一点,自己做一些它的工作。但它不一定要给出更好的稳定性和可预测性,它只是可以帮助模型在更少的迭代中完成它的工作,而这种操作的效用确实没有我们想的那么大。

但你提到的那些操作--噪音清理、平滑、趋势等--并不仅仅是创建对模型友好的预测器。这就是建立预测器,以某种方式描述市场的内部过程。
我看了不同的旧工作策略,它们总是有一些常量--如果是MA,则是21,如果是RSI,则是14。所有这些常数和用它们建立的指标不仅帮助模型更容易地进行数据分类,而且还具有描述内部市场过程的一些属性。另外,预测器的公式中的不同常数是一些新的数据,所以我们在原始数据上增加了新的信息。

事实证明,如果你开始不假思索地生成新的预测因子,它们只是帮助模型在训练中获得更好的准确性,但它们无助于描述市场内部的过程,因此用它们进行预测是不可靠的。所以你必须用大量的思考来生成它们,我同意 :)

而且,对我来说,预测器还有一个有趣的新属性--对原始数据的内部过程的描述。
换句话说,如果我有,比如说,一打预测器可以轻松地重建数百个价格条,那么它们显然包含必要的市场属性,建立在它们之上的模型应该更好。

 
Top2n:


可能是误解了你的需求,但我想采取一些半径,比方说4,对于每一个点,找出该半径的平均值。
也就是说,如果X=BC,Y=158,Z=1,那么你可以找到这个半径R=4的所有点的平均值。 这将是点(BC,158,1)和它附近的平均重量。对阵列中的所有点都这样做,你就会得到一个新的阵列,数字越大--原阵列附近的信号就越多。
然后我们可以把它投射到某个轴上(放弃Z坐标,把所有相关的X和Y单元加起来,这些单元有不同的Z坐标)。然后,也要舍弃Y本身,并将所有单元格按X相加。

附加的文件:
w5rtduyghjbn.png  388 kb
 
Dr.Trader:


事实证明,如果你开始不假思索地生成新的预测因子,它们只是帮助模型在训练中获得更好的准确性,但它们无助于描述市场内部的过程,因此用它们进行预测是不可靠的。所以你必须用大量的思考来生成它们,我同意 :)


不过,从中舞动的烤箱是对市场的一些口头的、直观的描述。

我一直在琢磨,在金融市场上,这种直观的描述是由ZZ给出的。如果你看一下。

  • 可以看到的趋势
  • 你可以把噪音看作是对直线的偏离
  • 你可以看到周期性

在我看来,我们所有的麻烦都在这个周期性中,它在两个轴上都是混乱地变化的。这就是我们被卡住的原因。如果我们至少学会以某种方式处理这种非平稳性,剩下的就比较容易了。

 
桑桑尼茨-弗门科

所有这些,人们应该起舞的烤箱是对市场的一些口头的、直观的描述。

我长期以来一直抱着这样的想法:在金融市场上,这种直观的描述是由ZZ给出的。如果你看一下。

  • 可以看到的趋势
  • 你可以把噪音看作是对直线的偏离
  • 你可以看到周期性

在我看来,我们所有的麻烦都在这个周期性中,它在两个轴上都是混乱地变化的。这就是我们被卡住的原因。如果我们至少学会以某种方式处理这种非平稳性,剩下的就比较容易了。

不要严格评判,也不要问我的意思,也许白色_噪音发生器可以帮助。顺便说一下,如果有人可以,请分享一下你在傅里叶_拉普拉斯_Z变换方面的经验。