大家好
我正在使用深度强化学习（使用Python），学习已经在进行（如图所示）。
今天，我只把移动平均线作为市场观察来学习。
这个模型执行了几个动作（买入、卖出和等待）。因此，经过训练，该模型在许多行动中收敛，只用最佳行动来 "等待"。
然而，在这个模型中，训练是非常缓慢的，因为它使用了所有的ticks。
你有什么建议作为市场观察数据来提高准确性和减少损失？
你建议用什么作为市场观察数据来提高准确性和减少损失？
1）创建一个 市场模型，并在其中训练一个代理，这将降低维度，加快训练速度，即使 在这里 也是这样做的
2）特征的选择，正如他们所说，这是一个创造性的任务，如果有很多特征，那么也会有助于降低维度，有很多的特征，从聚类到pca，umap等等。
如果我们采取支持和阻力水平，并决定只在价格处于该水平时买入或卖出，我们可以将训练样本减少几个数量级。
你可以把所有的点结合在一起。
将蜱虫的数量减少到可接受的误差。
识别在去除所有标记后，误差超过可接受误差的区域。
训练模型找到这样的区域，如果它可以的话，当然))))。
好吧，这些都是状态空间模型，它们每隔一段时间也会发挥作用。
而且你可以把目标与趋势的变化联系起来。任务不是为了获利，而是为了认识和预测。很明显，它们是完全不同的任务，NS不能够同时识别和预测))))。目标利润，平衡间接地承认转折点，而不直接承认。
如果我们把日线、4小时线、小时线（或任何其他）的人字形反转，并以每个（所有）时间段的120个柱子和转折点前后的120个点为例进行观察。日线和4h线只看到下一个和上一个反转，或者不知道怎么做更好。当然，那时应该手动写一些东西来准备数据。
或者是否有类似的东西。
我认为深度强化只是用于多变量的任务，而不是用于1-5维的，如金融市场。因此，你可以尝试更简单、更快速的方法，如带有神经网络或线性近似器的REINFORCE。
这很容易通过人字形断裂之间存在的规律性来检查，即熵的减少。如果与sb有区别，那么你可以看看。但我没有发现这样的事情。有一些特殊的软件包，在医学上用于分析dna和推导药物配方。例如，包络熵或更复杂的情况，有近似器、优化器如q-learning。
不，骨折的规律性是不行的))))在不考虑规律性的情况下，需要抓住骨折前的东西）一般来说，有机会抓住那些与骨折前的SB有相同差异的骨折。你不能用普通的包裹来做这个。而且我不认为在趋势中间的休息有什么意义，除了太长的趋势持续时间))))。
嗯，我明白了，通过与TF相关的类比。可以尝试
如果你看一下不同的TFs，你会得到更多的维度))))。
我明白了，通过与TF相关的类比。我们可以尝试。
是的，只有TFs都要看，哪些是一次性需要的，不能确定。也许一个或两个TF会更好，也可能所有的TF都需要）））。很难想清楚。））。