交易中的机器学习:理论、模型、实践和算法交易 - 页 1255

 
马克西姆-德米特里耶夫斯基

如果市场或多或少是稳定的,是一种趋势或什么的,那么这次就会成功,至少对我来说......模式是一样的,为什么不?

我已经把学习曲线简化为按下一个按钮,我不需要任何预测器))这台机器看起来很有趣,我可能会把它作为人类疯狂的展览品出售。

好吧,我一开始并没有理会那些预测者。不过,我甚至没有尝试用一个按钮。有了一个按钮,我除了同样的优化外,什么都没有,只是在配置文件中。你如何用一个按钮来规避它是一个谜)。

 
尤里-阿索连科

好吧,我一开始并没有理会那些预测者。但我甚至还没有尝试过用一个按钮。我不能用一个按钮做任何事情,除了同样的优化,只有在配置文件中。你如何用一个按钮绕过它是一个谜)。

我只是在寻找测试样本中的最佳误差,仅此而已。

优化器 优化器 aha
 
马克西姆-德米特里耶夫斯基

蒙特卡洛和寻找测试样本中的最佳误差,就是这样。

我不能没有蒙特卡洛)。但最好的错误并不那么简单。最优化是一个有很多因素的东西,而且是模糊的,什么是最优化也远非明显。

 
尤里-阿索连科

你不能没有蒙特卡洛)。而最好的错误也不是那么简单。最优化是一个多因素的、模糊的东西,什么是最优化也远非明显。

我明白了。我采取任何周期性方程,其中最优化是显而易见的,系统将在它上面至少永远赚钱)。

市场上没有最优,只有本地的。

 
 

在树上读理论。
我正在考虑剪枝(修剪)。

可以使用以下简单的规则:建立一棵树,切断或用子树替换那些不会导致误差增加的分支。

也许在不修剪叶子的情况下建立一棵树会更容易和更快,除非你找到一个至少能减少某个值的误差的划分,例如0.1-0.5%?
结果应该是一样的,但速度更快。

还是有可能在几个模型改进0.0001%的分支之后,找到一个能一下子改进1-5%的分支?

 
Maxim Dmitrievsky:

快多少? 已经非常快了。

而你要建立自己的助推器,不是吗?

贝叶斯方法很慢,而且不适合大样本,但它们的工作方式不同,而且不会被开箱重训。每个模型都有自己的具体情况。我从贝叶斯中得到了启发,在不重新培训的情况下,优化TC的力量很大。

良好的视角--他们可以升级而不是重新培训

如果你有一百万个字符串,有200-1000个预测器,那可能是一个很长的时间...
修剪需要把树造到最后,然后再进行修剪。
而随着停止分支的最小错误的改进,我想在类似的结果下会有很大的节省。在xgboost 中,参数被称为gamma,但似乎没有修剪。显然,开发商也决定这些东西是可以互换的。
 
elibrarius
好吧,如果一百万分钟的线,有200-1000个预测者,那可能是一个很长的时间...
而对于修剪--你必须把树造到最后,然后再修剪。
而随着按最小误差停止分支的改进,我认为在类似的结果下会有很大的节省。在xgboost中,参数被称为gamma,但我认为没有修剪。显然,开发商也决定这些东西是可以互换的。

好吧,他们知道如何做,有一些专家团队正在进行升压、测试。

催化器似乎工作得很好,它的速度很快,树木一开始就很浅。

数以百万计的外汇数据...我怀疑这是否有必要

 
顺便说一下,我想出了一种情况,即第一次除法几乎没有改善误差,而第二次除法则改善了100%。

4个部门,每个部门10分。沿着X轴或Y轴进行1次划分。几乎不会改善误差,它将保持在50%左右。例如,首先在中间垂直分割。在水平方向的中间进行第二次分割,会使误差有非常大的改善(从50%到0)。
但这是人为创造的情况,在生活中不会发生。
 
样本量从来都很大。如果N太小,无法得到足够精确的估计,你需要获得更多的数据(或做出更多的假设)。但是,一旦N "足够大",你就可以开始细分数据以了解更多(例如,在民意调查中,一旦你对整个国家有一个很好的估计,你就可以在男人和女人、北方人和南方人、不同年龄组中进行估计,等等)。N永远是不够的,因为如果它是 "足够的",你就已经进入了下一个问题,你需要更多的数据。