交易中的机器学习:理论、模型、实践和算法交易 - 页 1709

 
阿列克谢-尼古拉耶夫

你不能不做实验。据我所知,主要的想法只是大幅减少允许用于实验的物质清单。这里有一个链接, 是关于这项研究的更明智的俄语描述,重点是生物学,没有MO的细节。

一篇好的、科学的文章,没有关于人工智能无所不能和接近万能药的 "冒泡 "热情。显示了大自然是多么 "狡猾",以及人们认为自己已经找到了关键,而现在又是多么的天真。

使用MO从庞大的化合物 "库 "和它们对不同菌株影响的数据中找到一个合适的选择,其结果是成功的。但是,这几乎是一个孤立的结果,并不能保证在未来取得类似的胜利。为什么?- 因为教育部使用的是统计和概率方法。这种搜索的其他应用可能根本不可能成功。

我将专注于学习微生物复制的一般原理,并创建一个在某些菌株中进行选择性阻断的工具。这就是智能方法与统计和概率方法之间的区别。 也就是说,一个普遍的解决方案,与一个特殊的解决方案)。

 
路透科诺

一篇好的、科学的文章,没有关于人工智能无所不能和接近万能药的 "冒泡 "热情。显示了大自然是多么的 "狡猾",而人又是多么的天真,以为自己已经找到了钥匙,现在...

使用MO从庞大的化合物 "库 "和它们对不同菌株影响的数据中找到一个合适的选择,其结果是成功的。但是,这几乎是一个孤立的结果,并不能保证在未来取得类似的胜利。为什么?- 因为教育部使用的是统计和概率方法。这种搜索的其他应用可能根本不可能成功。

我将专注于学习微生物复制的一般原理,并创建一个在某些菌株中进行选择性阻断的工具。这就是智能方法与统计和概率方法的区别(即普遍的解决方案,与特殊的解决方案)。

在单个DNA分子的层面上,量子效应是不可避免的,这在本质上是概率性的,原则上没有理论家和matstat就不能考虑。而在所有更高的层次上,直到并包括临床药物试验,这些科学都是不可缺少的。因此,像本研究中使用的方法对生物学来说绝不陌生,甚至导致了 "硅"(类似于体内和体外)一词的诞生。

 
阿列克谢-尼古拉耶夫

在单个DNA分子的水平上,量子效应是不可避免的,这在本质上是概率性的,原则上没有理论家和matstat就不能考虑。而在所有更高的层次上,直到并包括临床药物试验,这些科学都是不可缺少的。因此,像本研究中使用的方法对生物学来说绝不陌生,甚至导致了in silico一词的出现(类似于体内和体外)。

是的,我也注意到禅宗上有一篇关于DNA中的量子'波动'产生其突变的文章。当然,在许多研究领域,MO是一个很好的工具。但是,我个人意识到--MO,不是人工智能,不应该与之混淆。人工智能会寻找一个绝对的解决方案,而MO则会寻找一个私人的解决方案。他们有绝对不同的工作方法,MO不会 "成长 "为AI。

 
晚上好,对一个新手有什么建议吗...


如果我买了一个EA(5份),以后的所有更新都可以用吗? 所有5份都是免费的吗?

[删除]  
阿列克谢-尼古拉耶夫

你认为黑格尔的绝对理念是什么?)

不熟悉或不记得 :) 我现在更喜欢基督教,解决难题
[删除]  
3565832:
晚上好,你能给一个新手建议吗------


如果你买了一个EA(5份),以后的所有更新都可以用吗? 所有5份都是免费的吗?

 
Maxim Dmitrievsky:
不熟悉或不记得了 :) 我现在更喜欢基督教,解决难题。

通过亚历山大-托德勒,你创造了一个圣杯 的学说?)

 
elibrarius:

阿列克谢,你做叶子分析,显然你可以回答......或有人这样做。

以下是对一棵树的劈裂的描述,其深度与2个卡博斯一样。


"价值 "是什么意思?它是叶子的答案吗?负数是什么意思?

如果是这样,多类分类的价值是什么?下面是其中一棵在3个类上训练的树的分割图。
在每个叶子上,我们看到一个由3个值组成的数组。答案是什么呢?最高价值?那么为什么要存储多余的两个值呢?负值是什么意思?

有趣的是,这三个值的总和是0。

是的,在二元分类中,这是属于 "主要 "类别的概率值。

我没有在CatBoost中做过多分类,但我认为它是属于某个特定类别的概率。

这个数字需要进行转换以得到实际的概率值--有一个逻辑 函数。

模型中被激活的叶子被加起来--因此,除此之外,标志可以带有不同的标志--这是一个平衡的过程,只是在模型建立后可以将其变薄,垃圾叶子和树木可以被丢弃掉。

 
阿列克谢-维亚兹米 金。

是的,在二元分类中,这是属于一个 "主要 "类别的概率值。

我没有在CatBoost中做过多分类,但我认为它是属于某个特定类别的概率。

这个数字需要进行转换以得到实际的概率值--有一个逻辑函数。

模型中被激活的叶子被加起来--因此,除此之外,标志可以与不同的标志--这是一个平衡的过程,只是它可以在模型建立后被稀释,垃圾叶子和树木可以被丢弃。

谢谢你。我大致上是这么想的。
不太清楚他们是如何计算这个数值的。
例如,我训练了1棵深度为1的树。

    "left": {
      "value": -0.5202020202020202,
      "weight": 384
    },
    "right": {
      "value": -0.0019267822736030828,
      "weight": 507
    },
    "split": {
      "border": 12.587499618530273,
      "float_feature_index": 0,
      "split_index": 0,
      "split_type": "FloatFeature"
    }

当我要求从树上得到回应时,我得到的是。

cmodel.predict(X, prediction_type='RawFormulaVal') = -0.520202020202 - 这是表单描述中的数值。

cmodel.predict_proba(X)=0.372805 是第1类概率
用公式检查
x1=-0.52020202
prob=math.exp(x1)/(1+math.exp(x1))=0.3728049958676699

计算正确。

数据集中总共有891行。

我计算了一下第一类的出现次数,在
边界< 12.587499618

我总共得到了384个例子,与叶子的描述中的重量相对应,其中89个是1类例子。

第1类的概率必须是
89 / 384 = 0,2317708

但该模型给出的概率为0.372805

事实证明,那里使用了一些其他算法来获得概率。

 
elibrarius

事实证明,那里正在使用一些其他的概率算法。

是的,结果很奇怪。难道他们不从参与培训的测试样本中抽取概率吗?但这里似乎有一个错误。

样本中总共有多少个单位(目标线)?