交易中的机器学习:理论、模型、实践和算法交易 - 页 1780

 
阿列克谢-维亚兹米 金。

报告没有参与过培训。

那么结果就会好上加好。

 
mytarmailS:

高精度不是70%

同意,为自己做了一个不低于95%的决定。

 
法尔哈特-古扎罗夫

战略......所以在MO之后,你仍然需要一个整体战略?我以为MO的目的是最终给你输出交易(多/空)或不交易的建议。

好吧,这个目标不是我的,只是对我来说很有意思,可以借此机会看看预测器对另一个目标的有效性。

法尔哈特-古扎罗夫

同意,为自己做了一个至少95%的决定。

这在很大程度上取决于目标,对于我的主要目标,这将是一个非常好的结果,因为它在趋势中发挥作用。

 
mytarmailS:

送走它,让我们看看....但我今天不看了,对不起,我正在忙别的事情。

好的,我会的,稍后。

 
阿列克谢-维亚兹米 金。

好吧,我稍后再发。

是的,你可以,我只是说,我不能马上看到

 
mytarmailS:

高精度不是70%

你一定是在跟我开玩笑。70%是非常高的输入准确性。如果不坐等亏损就进行交易,就不可能取得更高的结果。而95%是脱离了幻想的东西。我现在为了兴趣,已经计算了我的超频存款的交易。因此,在我的第一次尝试中,我进行了42次交易,其中6次是失败的。在我的第二次尝试中,有67笔交易被关闭,其中10笔是亏损的。因此,即使是这样一个看似不高的入账准确性,账目也增加了十倍。我忘了说,你拿了+1分,却输了-200分的情况,我还没有考虑过。当然,你可以达到95%的输入准确性。

 
MrBobr1:

你拿了+1个点,损失了-200个点,我没有考虑过。当然有可能达到95%的录入精度。

首先,拿1和给200点对我来说最初是不能接受的,主要是因为没有经纪商会允许自己长期处于这样的模式,而且连续收益的比例应该是你说的"67个10",我个人从未取得过这样的结果。如果你不知道如何处理它们,你将从它们身上获得利润,并对它们有什么期望。所有的交易都是在系统预测准确率超过95%时进行的。

我想马上说,你的MO可以预测100%的入市概率,但实际会发生什么以及如何发生,我认为这不是MO的任务,而是AI的任务,除了数学统计之外,还会考虑到口头环境因素。



 
mytarmailS:

是的,你去吧,我只是说不可能马上就看到它。

好的。档案中有两个文件--一个用于训练的样本和一个用于测试训练过的模型的样本,对于这两个文件,我们都需要预测器。

这样一个特殊性是,每条新线 都是一个新的条形--读数是在条形开盘的时刻取的,读数本身是前一个条形的,所以如果预测器使用零条形的开盘数据,那么就从下一个条形取这个读数。

附加的文件:
CB_ZZ_M1.zip  2957 kb
 
阿列克谢-维亚兹米 金。

好的。档案中有两个文件--一个用于训练的样本和一个用于测试训练过的模型的样本,对于这两个文件我们都需要预测器。

这样的特殊性是,每条新线 都是一个新的条形图--读数是在条形图打开的那一刻取的,读数本身是前一个条形图的,所以如果预测器使用零条形图的打开数据,那么就从下一个条形图取这个指标。

好吧,你可以把目标的也附上,否则你怎么能比较呢?

那你为什么要把日期去掉呢?

你是认真的吗?你为40万行训练了模型吗?



UPD=====

对不起,但我的旧笔记本把我搞糊涂了......当我只是试图处理数据时,如果我只做100个属性,它就会变成一个100*400 000的矩阵,在RAM中保持这样一个矩阵,我需要同时训练模型,笔记本只是尝试就死了......


我不能把它作为一个有50000个左右的数据集,我不需要一分钟来创建这些大的数据集,5分钟甚至一个小时就够了。不要扭曲数据,使用日期时间OHLCV格式,并添加一个你已经训练好的模型的目标,这样你就可以在以后比较误差了

 
mytarmailS:

好吧,他们也可以附上他们的目标,否则他们怎么能比较?

那你为什么要删除日期呢?

火车上有400 000条线? 你是认真的吗? 你为400 000条线训练了模型吗?

我没有删除日期,我只是没有保存它以节省文件空间。

是的,我在2年多的时间里按分钟训练。


mytarmailS:


UPD=====

对不起,但我的旧笔记本电脑只是宠坏了我......当我只是试图操纵数据,如果我只做100个属性,它变成了矩阵100 * 400 000,并在内存中保持这样一个矩阵,也应该在同一时间训练一个模型,笔记本电脑只是死的尝试......

你不能在一开始就把预测器按顺序保存到一个文件中,然后直接加载它们进行训练吗?

我现在有一个用于训练的样本,不到一千兆字节--CatBoost 可以轻松应对,但我现在不会冒险在R中建立遗传树。

mytarmailS:

你第一次尝试建立一个50000左右的数据集,不要花一分钟,5分钟甚至一个小时就够了。 不要扭曲数据,给他们相同的格式,因为他们应该是日期时间OHLCV,添加你的目标,你训练你的模型,这样你就可以在以后比较错误。

50,000个观察值太少了,对于坚实的这种观察,它只能是大约300个ZZ段。我把主要的预测器在分钟上磨光了,还有来自上层TF的预测器,但它们可能不够用。

你是用音量还是用音量方便?

你不需要ZZ参数来调整预测器?

我不明白关于数据失真的问题--你是否需要转移数据以了解零条上的所有条形数据?如果是这样,你难道没有偷看过零条吗?