交易中的机器学习:理论、模型、实践和算法交易 - 页 2831

 
Aleksey Nikolayev #:

我没有详细研究过这个问题。这个想法看似简单,但实施起来却有很多技术上的微妙之处。

还有一个问题是,什么叫在噪声函数中寻找最大值....?

根据我对 "优化噪声函数 "定义的理解,这意味着函数很复杂,很难找到最大值,梯度算法不适用,等等......粗略地说,这没什么大不了的,应用全局优化算法,他去寻找全局最大....


但我的看法不同,我想找到一个噪声函数的最大值,但要去除噪声,不是噪声函数中的全局最大值,而是去噪声函数中的全局最大值....。

(这并非易事,因为函数未知,噪声参数未知....)

What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space
What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space
  • 2022.12.07
  • mr.T mr.T 113 6 6 bronze badges
  • stats.stackexchange.com
I tried several algorithms that seem to be able to handle this, but it didn't work for me. Here is my fitness function which just looks for the max by index
[删除]  
СанСаныч Фоменко #:

1.Dick 的问题完全正确。我不使用 NS,但我知道任何 R 软件包中的任何函数都必然包含算法作者的参考文献,对于严肃的算法,还必然包含描述在 R 中实现算法的文章/书籍的参考文献。既然您对 NS 非常熟悉,那么如果您使用 R,就可以在 R 中搜索相应类型的 NS,找到描述相应算法的相应参考文献,找到关于该算法的讨论,找出专业人士的所有细微差别......并以最高的专业水平回答迪克,而不是喃喃自语说些猥亵的话。


2. R 的名称:统计和图形语言。R 的本质揭示了其参考仪器的标准。

以下是 R 软件包涵盖的主题列表。其中一个主题是机器学习。

以下是 与机器学习相关的软件包列表。

几年前,我们还能在其他专业统计语言中找到 R 的竞争对手。例如,SPPS,但今天我已经找不到了。R 仍是唯一受支持和管理的统计语言,拥有大量镜像,包含在微软软件中。


将 R 与 Python 相提并论是完全没有道理的。

R 是一种专用语言。Python 是一种通用语言。Python 的用户数量远远超过 R,但 Python 的大众用户是网页设计。Python 拥有统计软件包这一事实并不能将其归类为统计语言。在此基础上,C++(R 和 Python 使用的软件包都是用 C++ 实现的)可以归类为统计语言。由于 R 有详细的标准和对拟议函数算法的参考,它可以用来研究统计学的理论和实践,而 Python 则不能。

在此,我将引用普拉多的话,但不是逐字逐句,因为我忘了 "与经典统计学相比,机器学习在交易中提供了更多可能性"。

而 MO bibles 在 Python 上开发得非常好,尽管其他语言也喜欢 statsmodels。因此,与这些事实争论和相互证明是毫无意义的。

在我看来,R 是为学生、教授和业余爱好者准备的。所以你们可以互相引用,吹嘘一番。对于教授来说,也许是一些教书的教授。Python 用于严肃的项目和生产。我还没听说过有哪个大型 MO 项目使用 R 进行生产。
 
Maxim Dmitrievsky #:

在此,我将引用普拉多的话,但不是逐字逐句,因为我忘了 "与经典统计学相比,机器学习为交易提供了更多可能性"。

而 MO bibles 在 Python 上的开发也非常完善,尽管其他语言也喜欢 statsmodels。因此,与这些事实争论和相互证明是毫无意义的。

在我看来,R 是为学生、教授和业余爱好者准备的。所以你们可以互相引用,吹嘘一番。对于教授来说,也许有些教授是教书的。Python 用于严肃的项目和生产。我还没听说过用 R 进行的任何重大 MO 项目。

你为什么要争论你自己都声称不知道的东西?

微软已经做出了一些努力,使 R 成为大量开发人员开发大型项目的工具。

以下是允许我们使用 R 的微软产品/服务列表:
  1. 微软 R 服务器/面向 Azure HDInsight 的 R 服务器
  2. 数据科学虚拟机
  3. Azure 机器学习
  4. SQL Server R 服务
  5. Power BI
  6. Visual Studio R 工具

什么样的业余爱好者、什么样的教授需要 Microsoft R Server 生态系统?



以及能让你统一一切的 VM 虚拟机?

Azura云服务及其机器学习软件包和协作开发工具?


现在,R 已成为微软集成到自身和非微软开发项目中的工业系统。


而你是 "业余爱好者"...

[删除]  
СанСаныч Фоменко #:

你为什么要猜测你自己也声称不知道的事情?

微软已经做出了一些努力,使 R 成为大量开发人员开发大型项目的工具。

以下是允许我们使用 R 的微软产品/服务列表:
  1. 微软 R 服务器/面向 Azure HDInsight 的 R 服务器
  2. 数据科学虚拟机
  3. Azure 机器学习
  4. SQL Server R 服务
  5. Power BI
  6. Visual Studio R 工具

什么样的业余爱好者、什么样的教授需要 Microsoft R Server 生态系统?



以及能让你统一一切的 VM 虚拟机?

Azura云服务及其机器学习软件包和协作开发工具?


现在,R 已成为微软集成到自身和非微软开发项目中的工业系统。


而你是 "业余爱好者"...

很明显,"那里有些东西"。

我说的是与实施者交流的经验,其中包括大型实施者,至少在俄罗斯是这样。

他们都是用 Python 开发的。

微软有 C# 和 Asure 语言的机器学习 sdk,但没人用。

你用 R 语言做了一个大项目,放在服务器上,谁来维护?没有人,因为没有这样的专家,也没有人愿意因为一个统计数据而学习 R。

至于 python,随便雇个学生,一根香肠就能搞定。

"没人 "是指没有人以任何借口用 R 语言写作。因为有 python。

而你却驱使那些 "学究 "们用 R 语言写作,这样他们会怎样?

 
mytarmailS #:

还有一个问题是,在噪声函数中找到最大值是什么意思...

按照我的理解,"噪声函数的优化 "是指函数很复杂,很难找到其中的最大值,梯度算法不适用,等等....。粗略地说,这没什么大不了的,你应用全局优化算法,它就会去寻找全局最大值....。


但我的看法不同,我想找到一个噪声函数的最大值,但要去掉噪声,不是噪声函数中的全局最大值,而是去噪声函数中的全局最大值....。

(这并非易事,因为函数未知,噪声参数未知....)

你需要关于噪声的先验信息。此外,你还需要一个清晰的噪声矩阵模型--加法、乘法或其他模型。没有模型,就无法制作滤波器。而这个模型应该与真实数据相似。

也许你应该研究一下处理二维或三维数据的地理数据处理方法。或者是像 jpg 图像中的傅立叶变换,或者是新版 jpg 中的小波,或者是多维样条等。

 
Maxim Dmitrievsky #:

我想引用一句口号 "战斗和搜索--发现和隐藏"。

将任何标准设置为自定义指标,尤其是这些标准指标。它仍会通过 logloss 进行优化,但会停止在这些自定义指标上,这或许有些意义

事实上也是如此,因为停在同一位置总是基于某些投射标准,如准确性。

到目前为止,我想只有这种情况。你也可以根据自定义标准进行树形修剪。

 
Maxim Dmitrievsky #:

可见 "有"

我是根据与实施者(包括大型实施者)交流的经验说这番话的,至少在俄罗斯联邦是这样

一切都是用 Python 语言完成的

微软有 C# 和 Asure 语言的机器学习 sdk,但没人使用它们

你用 R 语言做了一个大项目,把它放在服务器上,谁来维护它呢?没有人,因为在如此庞大的数字中没有专家,也没有人愿意因为一个统计数据而学习 R。

至于 Python,随便雇个学生,一根香肠就能搞定。

"没有人 "是指没有人以任何借口用 R 语言写作。因为有 python。

而你却驱使外行人用 R 语言写作,这样他们会怎样?

RF 就是一个糟糕的例子,因为从 matstat 的意义上讲,它是极度休眠的。我们的论坛上有很多技术人员,但他们中的大多数人对 matstat 的认识都非常肤浅。在学院里,教授们用 Excel 教授 matstat)这一切都说明我们的科技学校非常糟糕--苏联时代的严肃解决方案更多是在国外购买现成的,而不是在国内开发。

 
Aleksey Nikolayev #:

正确的答案,你需要关于噪声的先验信息。此外,你还需要一个清晰的噪声矩阵模型--加法模型、乘法模型或其他模型。没有模型,就无法制作滤波器。而这个模型应该与真实数据相似。

也许你应该研究一下处理二维或三维数据的地理数据处理方法。或者是像 jpg 图像中的傅立叶变换,或者是新版 jpg 中的小波,或者是多维样条等。

我可以毫无问题地建立一个模型,进行任何分解,甚至是 PCA 并继续前进......但数据呢?

但数据呢? 它们并不存在,这是一个未知函数,甚至是多维....。

所有数据都是 AO 搜索结果的零散点(如果你保存了它们的话)。

这不是时间序列,没有结构或顺序。

[删除]  
Aleksey Nikolayev #:

RF 是一个糟糕的例子,因为它在 matstat 的意义上是极其愚蠢的。我们的论坛上有很多技术专家,但他们中的大多数人对 matstat 的认识都非常肤浅。在学院里,教授们用 Excel 来教授 matstat)这一切都说明我们的科技学校非常糟糕--苏联时代的严肃解决方案更多地是在国外购买现成的,而不是在国内开发。

Excel 对他们以后的生活会更有用:D

 
mytarmailS #:

我可以制作一个模型,任何分解都没问题,甚至 PCA 也可以。

但数据呢? 它们不存在,这是一个未知函数,而且是多维的......

数据就是 AO 搜索中的散点(如果你保存了它们)。

它不是时间序列,没有结构或顺序。

那么,我想到的第一件事就是用一个网格来划分空间,网格的单元格不能太大也不能太小(单元格的大小由噪声模型决定)。从某个(例如随机选择的)单元格开始--其中的几个点决定了平滑函数的梯度方向,然后移动到下一个单元格,依此类推,直到没有过渡或循环。极值的位置是根据单元格的大小精确设定的,因此不能太大,但同时也要保证平滑的可 能性,因此也不能太小。我们必须承认,极值的位置原则上是不准确的,因为它会随着平滑方法的不同而变化。