结合段的范围的算法--帮助创建 - 页 5

 


)

 
Dmitry Fedoseev:

1.完全无法理解,已经是完全不同的东西。

一般来说,任务是什么?实际的目的是什么?也许它的解决方式完全不同。

好吧,如果你有兴趣,让我更详细地告诉你。在CatBoost机器学习算法中,通过建立一个预网格(量化)来解决从观察(数组)中获得的变量(预测器)集合值的枚举问题,因此数字被划分为区间(周期/范围),数值的枚举不是发生在所有数字上,而是只发生在这些区间上。有不同的内置方法来构建网格,包括那些具有不同的所需边界数的网格。从视觉上看,网格的一个变体看起来就像下图,数组的每100个值都会使y刻度上的值增加1,这显示了值的可重复性。

任务是建立一个对学习最有利的网格,即这样一个网格,其中间隔(段)之间的信息将更多地属于目标之一(0/1),同时保持依赖性的一致性和观察的充分性。

现在我得到不同的网格,根据给定的标准(我之前写的)选择它们的间隔,我需要把选择的间隔相互结合起来,把它们合并成一个网格。

 
Aleksey Nikolayev:


)

如果我能帮忙,我就帮忙,如果不能,我也会毫不犹豫地请求帮助。

另外,最近这里的问题很少,我想大家会有兴趣参与解决这些问题。

 
Aleksey Vyazmikin:

///

现在我得到不同的网格,根据给定的标准(我之前写的)选择它们的段,我需要将选择的段相互结合起来,将它们合并成一个网格。

这就是问题的关键所在。你想怎么做?

 
Dmitry Fedoseev:

这就是问题的关键所在。你想怎么做?

嗯......所以你写的脚本几乎可以完成所有的工作。有其他选择吗?我建议选择减少组合的数量。


仍在考虑这个 方案 :)

Почему амеба справилась с вычислениями лучше современного компьютера
Почему амеба справилась с вычислениями лучше современного компьютера
  • www.popmech.ru
В 2018 году группа исследователей из токийского университета Кейо решила использовать амебу для решения так называемой «задачи коммивояжера», известной в области компьютерных наук проблемы. Суть ее такова: представьте, что вы – путешествующий от города к городу...
 
Aleksey Vyazmikin:

嗯......所以你写的脚本几乎可以完成所有的工作。还有其他选择吗?我建议选择减少组合的数量。


仍在考虑这个 方案 :)

也许在段数少的时候。而当有很多人的时候,应该如何呢?

你是在什么意义上建议减少组合数量的选择?不是所有的组合都足够,还是有一个标准?

 
Dmitry Fedoseev:

也许当有很少的部分。但是,当有很多人的时候,应该如何呢?

你是在什么意义上建议减少组合数量的选择?不是所有的组合都足够,还是有一个标准?

当有很多的时候,你必须考虑...

作为一种选择,我建议以同样的方式从每段开始,但限制从每个点开始的组合数量。

这里,图中以圆圈的形式显示了分段,以箭头长度的形式显示了它们的评价,图中只选择了两个最短的箭头,其余的 "路径 "被切断(排除)了。在这些箭头(本质上是图形)的形式中,可以有一个评价系数(指标)。


我想,这样一来,我们就不会选择最差的选项,同时减少计算成本。
 
Aleksey Vyazmikin:

当有很多人时,你必须考虑...

作为一种选择,我建议以同样的方式从每段开始,但限制从每个点开始的组合数量。

该图以圆圈的形式显示段,以箭头长度的形式显示其评价,图中只选择了两个最短的箭头,其他 "路径 "被切断(排除)。在这些箭头(本质上是图形)的形式中,可以有一个评价系数(指标)。


通过这种方式,我假设,我们不会选择最差的选项,同时减少计算成本。
这是对长短比例大致相等,没有只长不短的区域的情况而言的。
 
Valeriy Yastremskiy:
这是针对离开该点的长路径和短路径的比例大致相等的情况,没有只存在长路径或短路径的区域。

路径是长是短有什么区别,还是估计的问题(图中类比的箭头的长度)?

我们有意愿踩在例子中的两条最佳路径上,如果数量较少则只有一条路径。

请解释为什么这可能是一个问题。

 

也可以通过按范围将段划分为段(组)来减少组合的数量。

在图中4个有范围界限的组,只在组内做列举,然后将组内的最佳选择在其他组之间组合。

很难平均划分,所以按组别边界划分的片段可以分离出来,在合并组间结果时使用。