交易中的机器学习：理论、模型、实践和算法交易

Реter Konow 2020.04.16 16:32 #17081

阿列克谢-尼古拉耶夫。

你不能不做实验。据我所知，主要的想法只是大幅减少允许用于实验的物质清单。这里有一个链接，是关于这项研究的更明智的俄语描述，重点是生物学，没有MO的细节。

一篇好的、科学的文章，没有关于人工智能无所不能和接近万能药的 "冒泡 "热情。显示了大自然是多么 "狡猾"，以及人们认为自己已经找到了关键，而现在又是多么的天真。

使用MO从庞大的化合物 "库 "和它们对不同菌株影响的数据中找到一个合适的选择，其结果是成功的。但是，这几乎是一个孤立的结果，并不能保证在未来取得类似的胜利。为什么？- 因为教育部使用的是统计和概率方法。这种搜索的其他应用可能根本不可能成功。

我将专注于学习微生物复制的一般原理，并创建一个在某些菌株中进行选择性阻断的工具。这就是智能方法与统计和概率方法之间的区别。也就是说，一个普遍的解决方案，与一个特殊的解决方案）。

Aleksey Nikolayev 2020.04.16 17:08 #17082

路透科诺。

一篇好的、科学的文章，没有关于人工智能无所不能和接近万能药的 "冒泡 "热情。显示了大自然是多么的 "狡猾"，而人又是多么的天真，以为自己已经找到了钥匙，现在...

使用MO从庞大的化合物 "库 "和它们对不同菌株影响的数据中找到一个合适的选择，其结果是成功的。但是，这几乎是一个孤立的结果，并不能保证在未来取得类似的胜利。为什么？- 因为教育部使用的是统计和概率方法。这种搜索的其他应用可能根本不可能成功。

我将专注于学习微生物复制的一般原理，并创建一个在某些菌株中进行选择性阻断的工具。这就是智能方法与统计和概率方法的区别（即普遍的解决方案，与特殊的解决方案）。

在单个DNA分子的层面上，量子效应是不可避免的，这在本质上是概率性的，原则上没有理论家和matstat就不能考虑。而在所有更高的层次上，直到并包括临床药物试验，这些科学都是不可缺少的。因此，像本研究中使用的方法对生物学来说绝不陌生，甚至导致了 "硅"（类似于体内和体外）一词的诞生。

Реter Konow 2020.04.16 17:19 #17083

阿列克谢-尼古拉耶夫。

在单个DNA分子的水平上，量子效应是不可避免的，这在本质上是概率性的，原则上没有理论家和matstat就不能考虑。而在所有更高的层次上，直到并包括临床药物试验，这些科学都是不可缺少的。因此，像本研究中使用的方法对生物学来说绝不陌生，甚至导致了in silico一词的出现（类似于体内和体外）。

是的，我也注意到禅宗上有一篇关于DNA中的量子'波动'产生其突变的文章。当然，在许多研究领域，MO是一个很好的工具。但是，我个人意识到--MO，不是人工智能，不应该与之混淆。人工智能会寻找一个绝对的解决方案，而MO则会寻找一个私人的解决方案。他们有绝对不同的工作方法，MO不会 "成长 "为AI。

3565832 Корнев 2020.04.16 17:31 #17084

晚上好，对一个新手有什么建议吗...

如果我买了一个EA（5份），以后的所有更新都可以用吗？所有5份都是免费的吗？

[删除] 2020.04.16 17:51 #17085

阿列克谢-尼古拉耶夫。

你认为黑格尔的绝对理念是什么？)

不熟悉或不记得 :) 我现在更喜欢基督教，解决难题

[删除] 2020.04.16 18:19 #17086

3565832:
晚上好，你能给一个新手建议吗------。

如果你买了一个EA（5份），以后的所有更新都可以用吗？所有5份都是免费的吗？

是

Aleksey Nikolayev 2020.04.16 18:44 #17087

Maxim Dmitrievsky:
不熟悉或不记得了 :) 我现在更喜欢基督教，解决难题。

通过亚历山大-托德勒，你创造了一个圣杯的学说？）

Aleksey Vyazmikin 2020.04.16 22:28 #17088

elibrarius:

阿列克谢，你做叶子分析，显然你可以回答......或有人这样做。

以下是对一棵树的劈裂的描述，其深度与2个卡博斯一样。

"价值 "是什么意思？它是叶子的答案吗？负数是什么意思？

如果是这样，多类分类的价值是什么？下面是其中一棵在3个类上训练的树的分割图。
在每个叶子上，我们看到一个由3个值组成的数组。答案是什么呢？最高价值？那么为什么要存储多余的两个值呢？负值是什么意思？

有趣的是，这三个值的总和是0。

是的，在二元分类中，这是属于 "主要 "类别的概率值。

我没有在CatBoost中做过多分类，但我认为它是属于某个特定类别的概率。

这个数字需要进行转换以得到实际的概率值--有一个逻辑函数。

模型中被激活的叶子被加起来--因此，除此之外，标志可以带有不同的标志--这是一个平衡的过程，只是在模型建立后可以将其变薄，垃圾叶子和树木可以被丢弃掉。

Aleksei Kuznetsov 2020.04.16 22:52 #17089

阿列克谢-维亚兹米 金。

是的，在二元分类中，这是属于一个 "主要 "类别的概率值。

我没有在CatBoost中做过多分类，但我认为它是属于某个特定类别的概率。

这个数字需要进行转换以得到实际的概率值--有一个逻辑函数。

模型中被激活的叶子被加起来--因此，除此之外，标志可以与不同的标志--这是一个平衡的过程，只是它可以在模型建立后被稀释，垃圾叶子和树木可以被丢弃。

谢谢你。我大致上是这么想的。
不太清楚他们是如何计算这个数值的。
例如，我训练了1棵深度为1的树。

    "left": {
      "value": -0.5202020202020202,
      "weight": 384
    },
    "right": {
      "value": -0.0019267822736030828,
      "weight": 507
    },
    "split": {
      "border": 12.587499618530273,
      "float_feature_index": 0,
      "split_index": 0,
      "split_type": "FloatFeature"
    }

当我要求从树上得到回应时，我得到的是。

cmodel.predict(X, prediction_type='RawFormulaVal') = -0.520202020202 - 这是表单描述中的数值。

cmodel.predict_proba(X)=0.372805 是第1类概率
用公式检查
x1=-0.52020202
prob=math.exp(x1)/(1+math.exp(x1))=0.3728049958676699

计算正确。

数据集中总共有891行。

我计算了一下第一类的出现次数，在
边界< 12.587499618

我总共得到了384个例子，与叶子的描述中的重量相对应，其中89个是1类例子。

第1类的概率必须是
89 / 384 = 0,2317708

但该模型给出的概率为0.372805。

事实证明，那里使用了一些其他算法来获得概率。

Machine learning in trading:

Aleksey Vyazmikin 2020.04.16 23:46 #17090

elibrarius。

事实证明，那里正在使用一些其他的概率算法。

是的，结果很奇怪。难道他们不从参与培训的测试样本中抽取概率吗？但这里似乎有一个错误。

样本中总共有多少个单位（目标线）？

交易中的机器学习：理论、模型、实践和算法交易 - 页 1709