交易中的机器学习:理论、模型、实践和算法交易 - 页 858

 
马克西姆-德米特里耶夫斯基

我不使用其他人的算法。

当然,库里宾精神是个好东西,但最有趣和必要的东西已经被发明出来了,而且就在我的手掌上。我不会拒绝世界各地几十年的研究。

 
马克西姆-德米特里耶夫斯基

我也有这样的人,也有赚到钱但不一定能赚到钱的人,而我想一直赚到钱(或几乎一直赚到钱)。只有这样,我才能够给出建议。

在猪圈里!每次你开始在你不知道的地方给出提示时,我都会插入它 :)

 
交易员博士

当然,库里宾精神是个好东西,但最有趣和必要的东西已经被发明了,就在你的手掌上。我不介意在世界各地进行几十年的研究。

你在这里用你的空洞的断言杀了我。

 
交易员博士

在猪圈里!每次你开始在你不知道的地方给出建议时,我都会把它放进去 :)

我已经知道,让一匹死马说些明白话是没有用的,更容易的是下车,不作任何反应。

 
Vizard_: 我们来了!为那些手淫者提供新鲜的油脂......。


在使用13x6400矩阵(比例子大10倍)工作2分钟后
这种情况发生了。
错误:我不能放置3.2Gb的向量。
而且它试图占用12-13Gb,而我总共有16Gb。


 
R通常是以大块的方式每次占用一点内存。他已经拿了12-13个,还想要3个,不知道以后还需要多少个。
 
交易员博士
R通常是以大块的方式每次占用一点内存。他已经拿了12-13个,还想要3个,谁知道以后还需要多少个。

减少了矩阵--甚至无法计算13x500...显然,没有模式的市场数据让他发疯了))。这不像是用葡萄糖来判断糖尿病。

有人用市场数据试过吗?有什么收获吗?

最后...我已经用13x100来管理:(但用100行来筛选东西是很愚蠢的)。2号输入的东西似乎是最重要的,在以前的包裹中,它是最后的。也许,这是由于评估是基于100行,而不是6400行的事实造成的。

有序变量(重要性 递减)。
2 5 10 12 64 7 8 9 1 11
分数 0.24 0.025 0.019 -0.048 -0.055 -0.057 -0.05 -0.063 -0.067 -0.072
3
分数NA

---

分数矩阵。
2 5 10 12 64 7 8 9 1 11
2 0.24
5 0.128 0.025
10 0.186 -0.002 0.019
12 0.015 -0.043 -0.051 -0.048
6 0.086 -0.053 -0.011 -0.068 -0.05
4 0.066 -0.029 -0.073 -0.054 -0.065 -0.055
7 0.134 -0.088 -0.101 -0.188 -0.121 -0.099 -0.057
8 0.12 -0.202 -0.069 -0.1 -0.068 -0.089 -0.061 -0.05
9 0.092 -0.004 -0.138 -0.097 -0.088 -0.069 -0.112 -0.088 -0.063
1 0.086 -0.06 -0.088 -0.107 -0.083 -0.084 -0.066 -0.081 -0.076 -0.067
11 0.095 -0.017 -0.183 -0.115 -0.083 -0.078 -0.066 -0.086 -0.066 -0.082 -0.072
3 0.059 -0.132 -0.102 -0.146 -0.114 -0.126 -0.109 -0.113 -0.131 -0.117 -0.135


 

你好!


带有人工智能的机器人神经准备好了吗?


试一试吧。)))



同时,我发现了如何制作一个蜱虫机器人--使其像在测试器上一样工作 ))))

 

格雷塔简介


我被greta 吓了一跳。我曾认为,tensorflowreticulate 软件包最终会使R开发人员超越深度学习应用,利用TensorFlow 平台创建各种生产级统计应用。但我并没有想到贝叶斯。毕竟,斯坦 可能是一个贝叶斯模型师所想要的一切。Stan是一个强大的、生产级的概率分布建模引擎,有一个光滑的R界面、深入的文档和一个专门的开发团队。

但greta可以让用户直接在R中编写基于TensorFlow的贝叶斯模型!greta消除了学习中间建模语言的障碍,同时仍然承诺提供高性能的MCMC模型,可以在TensorFlow可以去的任何地方运行。

在这篇文章中,我将用Richard McElreath在其标志性著作《统计学反思:带有R和Stan实例的贝叶斯课程》第8.3节中使用的一个简单模型向你介绍greta。这个模型试图根据对地形崎岖程度的衡量来解释一个国家的GDP对数,同时控制该国是否在非洲。我打算用它来说明用greta进行MCMC采样。然而,McElreath书中的扩展例子是对建模互动的微妙性的沉思,非常值得研究。

首先,我们加载所需的包并获取数据。 DiagrammeR用于绘制模型的TensorFlow流程图,bayesplot用于绘制马尔科夫链的追踪图。崎岖不平的数据集为234个变量提供了52个变量,这相当有趣,但我们将使用只有170个县和三个变量的修剪过的数据集。


library(rethinking)
library(greta)
library(DiagrammeR)
library(bayesplot)
library(ggplot2)

以下是要使用的代码。


你好,骑自行车的发明家们

 
Vizard_

)))

对于第一次搜索,建议使用"peng"(更快)或 "esteves"。
(更可靠,但对大数据集来说要慢得多),而且,如果是对大数据集的数量
变量较大(>100),将 "向前 "搜索限制为 "n.var = 100"。ǞǞǞ
进度条会给你一个剩余运行时间的概念。


library(varrank)

data(nassCDS, package = "DAAG")

nassCDS.varrank <- varrank(data.df = nassCDS,
方法="peng"
变量。重要="死亡"。
variable.method = "dead", variable.method = "sturges",
算法="前进"。
方案="中"。
verbose = FALSE)

summary(nassCDS.varrank)
plot(nassCDS.varrank, notecex = 0.5)

这种特殊的算法,它选择预测器是好是坏?


一般来说,在预测器选择中,什么是好的,什么是坏的?

表面上看,这是一个将预测器的选择与模型的性能联系起来的问题。

在我看来,这听起来像是第二步。

第一步始终是处理模型的过度训练,即模型在未来的行为与它在过去的行为不一致的情况。如果我们对此没有任何想法,那么这一切都是数字游戏。


回到你的帖子。

我相信,如果预测因子的PRESCRIBUTION随着窗口的移动不会有太大的变化,那么模型的未来行为将与历史数据的行为没有什么区别。

该软件包计算的等级在某些预测因素上是否会改变?显然,对于不同的预测器组,结果可能是不同的,尽管如此,如果(像我上面做的那样)这样的帖子被张贴在这里......