交易中的机器学习：理论、模型、实践和算法交易

Farkhat Guzairov 2020.05.10 20:24 #17791

阿列克谢-维亚兹米 金。

报告没有参与过培训。

那么结果就会好上加好。

Farkhat Guzairov 2020.05.10 20:25 #17792

mytarmailS:

高精度不是70%

同意，为自己做了一个不低于95%的决定。

Aleksey Vyazmikin 2020.05.10 21:18 #17793

法尔哈特-古扎罗夫。

战略......所以在MO之后，你仍然需要一个整体战略？我以为MO的目的是最终给你输出交易（多/空）或不交易的建议。

好吧，这个目标不是我的，只是对我来说很有意思，可以借此机会看看预测器对另一个目标的有效性。

法尔哈特-古扎罗夫。

同意，为自己做了一个至少95%的决定。

这在很大程度上取决于目标，对于我的主要目标，这将是一个非常好的结果，因为它在趋势中发挥作用。

Aleksey Vyazmikin 2020.05.10 21:18 #17794

mytarmailS:

送走它，让我们看看....但我今天不看了，对不起，我正在忙别的事情。

好的，我会的，稍后。

mytarmailS 2020.05.11 09:00 #17795

阿列克谢-维亚兹米 金。

好吧，我稍后再发。

是的，你可以，我只是说，我不能马上看到

MrBobr1 2020.05.11 09:59 #17796

mytarmailS:

高精度不是70%

你一定是在跟我开玩笑。70%是非常高的输入准确性。如果不坐等亏损就进行交易，就不可能取得更高的结果。而95%是脱离了幻想的东西。我现在为了兴趣，已经计算了我的超频存款的交易。因此，在我的第一次尝试中，我进行了42次交易，其中6次是失败的。在我的第二次尝试中，有67笔交易被关闭，其中10笔是亏损的。因此，即使是这样一个看似不高的入账准确性，账目也增加了十倍。我忘了说，你拿了+1分，却输了-200分的情况，我还没有考虑过。当然，你可以达到95%的输入准确性。

Farkhat Guzairov 2020.05.11 10:59 #17797

MrBobr1:

你拿了+1个点，损失了-200个点，我没有考虑过。当然有可能达到95%的录入精度。

首先，拿1和给200点对我来说最初是不能接受的，主要是因为没有经纪商会允许自己长期处于这样的模式，而且连续收益的比例应该是你说的"67个10"，我个人从未取得过这样的结果。如果你不知道如何处理它们，你将从它们身上获得利润，并对它们有什么期望。所有的交易都是在系统预测准确率超过95%时进行的。

我想马上说，你的MO可以预测100%的入市概率，但实际会发生什么以及如何发生，我认为这不是MO的任务，而是AI的任务，除了数学统计之外，还会考虑到口头环境因素。

Aleksey Vyazmikin 2020.05.11 11:47 #17798

mytarmailS:

是的，你去吧，我只是说不可能马上就看到它。

好的。档案中有两个文件--一个用于训练的样本和一个用于测试训练过的模型的样本，对于这两个文件，我们都需要预测器。

这样一个特殊性是，每条新线都是一个新的条形--读数是在条形开盘的时刻取的，读数本身是前一个条形的，所以如果预测器使用零条形的开盘数据，那么就从下一个条形取这个读数。

附加的文件：

CB_ZZ_M1.zip 2957 kb

mytarmailS 2020.05.11 12:40 #17799

阿列克谢-维亚兹米 金。

好的。档案中有两个文件--一个用于训练的样本和一个用于测试训练过的模型的样本，对于这两个文件我们都需要预测器。

这样的特殊性是，每条新线都是一个新的条形图--读数是在条形图打开的那一刻取的，读数本身是前一个条形图的，所以如果预测器使用零条形图的打开数据，那么就从下一个条形图取这个指标。

好吧，你可以把目标的也附上，否则你怎么能比较呢？

那你为什么要把日期去掉呢？

你是认真的吗？你为40万行训练了模型吗？

UPD=====

对不起，但我的旧笔记本把我搞糊涂了......当我只是试图处理数据时，如果我只做100个属性，它就会变成一个100*400 000的矩阵，在RAM中保持这样一个矩阵，我需要同时训练模型，笔记本只是尝试就死了......

我不能把它作为一个有50000个左右的数据集，我不需要一分钟来创建这些大的数据集，5分钟甚至一个小时就够了。不要扭曲数据，使用日期时间OHLCV格式，并添加一个你已经训练好的模型的目标，这样你就可以在以后比较误差了

Aleksey Vyazmikin 2020.05.11 15:16 #17800

mytarmailS:

好吧，他们也可以附上他们的目标，否则他们怎么能比较？

那你为什么要删除日期呢？

火车上有400 000条线？你是认真的吗？你为400 000条线训练了模型吗？

我没有删除日期，我只是没有保存它以节省文件空间。

是的，我在2年多的时间里按分钟训练。

mytarmailS:

UPD=====

对不起，但我的旧笔记本电脑只是宠坏了我......当我只是试图操纵数据，如果我只做100个属性，它变成了矩阵100 * 400 000，并在内存中保持这样一个矩阵，也应该在同一时间训练一个模型，笔记本电脑只是死的尝试......

你不能在一开始就把预测器按顺序保存到一个文件中，然后直接加载它们进行训练吗？

我现在有一个用于训练的样本，不到一千兆字节--CatBoost 可以轻松应对，但我现在不会冒险在R中建立遗传树。

mytarmailS:

你第一次尝试建立一个50000左右的数据集，不要花一分钟，5分钟甚至一个小时就够了。不要扭曲数据，给他们相同的格式，因为他们应该是日期时间OHLCV，添加你的目标，你训练你的模型，这样你就可以在以后比较错误。

50,000个观察值太少了，对于坚实的这种观察，它只能是大约300个ZZ段。我把主要的预测器在分钟上磨光了，还有来自上层TF的预测器，但它们可能不够用。

你是用音量还是用音量方便？

你不需要ZZ参数来调整预测器？

我不明白关于数据失真的问题--你是否需要转移数据以了解零条上的所有条形数据？如果是这样，你难道没有偷看过零条吗？

交易中的机器学习：理论、模型、实践和算法交易 - 页 1780