Imagine you have just started a new data science project. The goal is to build a model predicting Y, the target variable. You have already received some data from the stakeholders/data engineers, did a thorough EDA, and selected some variables you believe are relevant for the problem at hand. Then you finally built your first model. The score...
价格越过任何一条线(以及触发指标信号)的概率取决于一天中的时间和一周中的哪一天。
有必要在 NN 和 DL 上添加周期时间。最简单的方法是正弦波。依赖关系是非线性的,因此只需将其平方,并考虑符号。还有两个额外的输入负责时间参考。午夜/正午在任何地方都是不同的,因此最好提前计算并给出相位。这就是模型与现实世界及其时间的联系。
如果没有明确给出这两个时间点,那么在我看来,要么你会得到一个南瓜,要么整个模型会自己尝试获取并输出它们。
或者您也可以只输入日号和时号。没有区别。它们同样好记。
别忘了加上实时时间......否则你就会和其他人一样:-)
a la 2 pcs:y=abs(sin(x))*sin(x) ;频率为 1 天和 1 周;相移最好提前计算出来
因为指标和直线交叉的概率取决于它们。
顺便说一句,傅里叶在这里是有害的、令人讨厌的:-)
不好的方法是,最好使用Van Hot 编码或 径向函数。
它不会增加或减少任何东西。
至少我是这么做的。
这是因为由于异方差性(波动性),任何振荡符号在不同时间的波动都不同,这就是为什么它们已经被考虑在内了。
https://developer.nvidia.com/blog/three-approaches-to-encoding-time-information-as-features-for-ml-models/
正弦和余弦必须以 2 帧的形式提供。否则,0,5 和 dr 每转一圈将出现 2 次,就像 2 个相同的时间...... 或者您也可以只提供日数和时数。没有区别。它们同样好记。
天数/小时数看起来也不好--会定期出现一个很大的 23-0 "间隙"。
那么,为了避免重复,可以添加另一个符号,如 "正午前/正午后"(正弦波导数的符号),然后让 sin^2 对时间进行计时(同时对信号进行缩放)。
或者像同名人建议的那样。在我看来,这是过度的。
(在大的 TF 上,周期是假象,但在小的日/周上,周期就是存在的,它们不能被丢弃或不被考虑,它们是 "载体")。
0)是的,我是......)
市场没有精确性。
只有有误差的概率)。
日数/小时数看起来也不乐观--周期性地会出现很大的 "差距 "23-0
那么,为了避免重复,可以添加另一个符号,如 "正午前/正午后"(正弦波导数的符号),然后让 sin^2 对时间进行计时(同时对信号进行缩放)。
或者像同名人建议的那样。我认为过度了。
(在大的 TF 上,周期是假象,但在小的日/周上,周期就是存在的,它们不能被丢弃或不被考虑,它们是 "载体")。
正弦的平方是每转 0.5 的 4 倍。
见上文(全部),我说的是 "考虑到符号" - sin(x)*abs(sin(x)).
见上文(全部),我说的是 "考虑到符号" - sin(x)*abs(sin(x))
"这是一个很大的特点)。
画出你的发明的图形。市场没有精确性。
只有概率,也有误差)。
你不明白我在说什么...
1. 存在维度诅咒和组合爆炸的问题,但这在理论上是可以解决的,有利于 精确性 ...
请阅读维度诅咒和组合爆炸是什么,维基会有所帮助...
从准确性 角度看,这是可以解决的。 - 这意味着你可以处理上述问题,但准确性会受到影响,也就是说,这只是解的近似值,而不是解。
再简单点说,假设你有 10,000 个特征,要找到所有特征的模式需要很长时间,而且有很多组合(维度诅咒)。
你可以将这10,000 个特征的维度降低到 2-5 个,但会损失 准确性,但你可以利用它。
现在,我希望大家都清楚我们在谈论什么样的准确性了吧?
"伟大 "的功能)
把你的发明画成图表。是这样的......如果你不使用 NN、DL,它就是这样交易的。
有什么熟悉的地方吗?
事实上......如果你不去 NN、DL,它就是这样交易的。
你看到什么熟悉的东西了吗?
2次,每回合0.5。))))))