交易中的机器学习:理论、模型、实践和算法交易 - 页 2831

 
Aleksey Nikolayev #:

我没有详细研究过这个问题。这个想法看似简单,但实施起来却有很多技术上的微妙之处。

还有一个问题是,什么叫在噪声函数中寻找最大值....?

根据我对 "优化噪声函数 "定义的理解,这意味着函数很复杂,很难找到最大值,梯度算法不适用,等等......粗略地说,这没什么大不了的,应用全局优化算法,他去寻找全局最大....


但我的看法不同,我想找到一个噪声函数的最大值,但要去除噪声,不是噪声函数中的全局最大值,而是去噪声函数中的全局最大值....。

(这并非易事,因为函数未知,噪声参数未知....)

What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space
What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space
  • 2022.12.07
  • mr.T mr.T 113 6 6 bronze badges
  • stats.stackexchange.com
I tried several algorithms that seem to be able to handle this, but it didn't work for me. Here is my fitness function which just looks for the max by index
 
СанСаныч Фоменко #:

1.Dick 的问题完全正确。我不使用 NS,但我知道任何 R 软件包中的任何函数都必然包含算法作者的参考文献,对于严肃的算法,还必然包含描述在 R 中实现算法的文章/书籍的参考文献。既然您对 NS 非常熟悉,那么如果您使用 R,就可以在 R 中搜索相应类型的 NS,找到描述相应算法的相应参考文献,找到关于该算法的讨论,找出专业人士的所有细微差别......并以最高的专业水平回答迪克,而不是喃喃自语说些猥亵的话。


2. R 的名称:统计和图形语言。R 的本质揭示了其参考仪器的标准。

以下是 R 软件包涵盖的主题列表。其中一个主题是机器学习。

以下是 与机器学习相关的软件包列表。

几年前,我们还能在其他专业统计语言中找到 R 的竞争对手。例如,SPPS,但今天我已经找不到了。R 仍是唯一受支持和管理的统计语言,拥有大量镜像,包含在微软软件中。


将 R 与 Python 相提并论是完全没有道理的。

R 是一种专用语言。Python 是一种通用语言。Python 的用户数量远远超过 R,但 Python 的大众用户是网页设计。Python 拥有统计软件包这一事实并不能将其归类为统计语言。在此基础上,C++(R 和 Python 使用的软件包都是用 C++ 实现的)可以归类为统计语言。由于 R 有详细的标准和对拟议函数算法的参考,它可以用来研究统计学的理论和实践,而 Python 则不能。

在此,我将引用普拉多的话,但不是逐字逐句,因为我忘了 "与经典统计学相比,机器学习在交易中提供了更多可能性"。

而 MO bibles 在 Python 上开发得非常好,尽管其他语言也喜欢 statsmodels。因此,与这些事实争论和相互证明是毫无意义的。

在我看来,R 是为学生、教授和业余爱好者准备的。所以你们可以互相引用,吹嘘一番。对于教授来说,也许是一些教书的教授。Python 用于严肃的项目和生产。我还没听说过有哪个大型 MO 项目使用 R 进行生产。
 
Maxim Dmitrievsky #:

在此,我将引用普拉多的话,但不是逐字逐句,因为我忘了 "与经典统计学相比,机器学习为交易提供了更多可能性"。

而 MO bibles 在 Python 上的开发也非常完善,尽管其他语言也喜欢 statsmodels。因此,与这些事实争论和相互证明是毫无意义的。

在我看来,R 是为学生、教授和业余爱好者准备的。所以你们可以互相引用,吹嘘一番。对于教授来说,也许有些教授是教书的。Python 用于严肃的项目和生产。我还没听说过用 R 进行的任何重大 MO 项目。

你为什么要争论你自己都声称不知道的东西?

微软已经做出了一些努力,使 R 成为大量开发人员开发大型项目的工具。

以下是允许我们使用 R 的微软产品/服务列表:
  1. 微软 R 服务器/面向 Azure HDInsight 的 R 服务器
  2. 数据科学虚拟机
  3. Azure 机器学习
  4. SQL Server R 服务
  5. Power BI
  6. Visual Studio R 工具

什么样的业余爱好者、什么样的教授需要 Microsoft R Server 生态系统?



以及能让你统一一切的 VM 虚拟机?

Azura云服务及其机器学习软件包和协作开发工具?


现在,R 已成为微软集成到自身和非微软开发项目中的工业系统。


而你是 "业余爱好者"...

 
СанСаныч Фоменко #:

你为什么要猜测你自己也声称不知道的事情?

微软已经做出了一些努力,使 R 成为大量开发人员开发大型项目的工具。

以下是允许我们使用 R 的微软产品/服务列表:
  1. 微软 R 服务器/面向 Azure HDInsight 的 R 服务器
  2. 数据科学虚拟机
  3. Azure 机器学习
  4. SQL Server R 服务
  5. Power BI
  6. Visual Studio R 工具

什么样的业余爱好者、什么样的教授需要 Microsoft R Server 生态系统?



以及能让你统一一切的 VM 虚拟机?

Azura云服务及其机器学习软件包和协作开发工具?


现在,R 已成为微软集成到自身和非微软开发项目中的工业系统。


而你是 "业余爱好者"...

很明显,"那里有些东西"。

我说的是与实施者交流的经验,其中包括大型实施者,至少在俄罗斯是这样。

他们都是用 Python 开发的。

微软有 C# 和 Asure 语言的机器学习 sdk,但没人用。

你用 R 语言做了一个大项目,放在服务器上,谁来维护?没有人,因为没有这样的专家,也没有人愿意因为一个统计数据而学习 R。

至于 python,随便雇个学生,一根香肠就能搞定。

"没人 "是指没有人以任何借口用 R 语言写作。因为有 python。

而你却驱使那些 "学究 "们用 R 语言写作,这样他们会怎样?

 
mytarmailS #:

还有一个问题是,在噪声函数中找到最大值是什么意思...

按照我的理解,"噪声函数的优化 "是指函数很复杂,很难找到其中的最大值,梯度算法不适用,等等....。粗略地说,这没什么大不了的,你应用全局优化算法,它就会去寻找全局最大值....。


但我的看法不同,我想找到一个噪声函数的最大值,但要去掉噪声,不是噪声函数中的全局最大值,而是去噪声函数中的全局最大值....。

(这并非易事,因为函数未知,噪声参数未知....)

你需要关于噪声的先验信息。此外,你还需要一个清晰的噪声矩阵模型--加法、乘法或其他模型。没有模型,就无法制作滤波器。而这个模型应该与真实数据相似。

也许你应该研究一下处理二维或三维数据的地理数据处理方法。或者是像 jpg 图像中的傅立叶变换,或者是新版 jpg 中的小波,或者是多维样条等。

 
Maxim Dmitrievsky #:

我想引用一句口号 "战斗和搜索--发现和隐藏"。

将任何标准设置为自定义指标,尤其是这些标准指标。它仍会通过 logloss 进行优化,但会停止在这些自定义指标上,这或许有些意义

事实上也是如此,因为停在同一位置总是基于某些投射标准,如准确性。

到目前为止,我想只有这种情况。你也可以根据自定义标准进行树形修剪。

 
Maxim Dmitrievsky #:

可见 "有"

我是根据与实施者(包括大型实施者)交流的经验说这番话的,至少在俄罗斯联邦是这样

一切都是用 Python 语言完成的

微软有 C# 和 Asure 语言的机器学习 sdk,但没人使用它们

你用 R 语言做了一个大项目,把它放在服务器上,谁来维护它呢?没有人,因为在如此庞大的数字中没有专家,也没有人愿意因为一个统计数据而学习 R。

至于 Python,随便雇个学生,一根香肠就能搞定。

"没有人 "是指没有人以任何借口用 R 语言写作。因为有 python。

而你却驱使外行人用 R 语言写作,这样他们会怎样?

RF 就是一个糟糕的例子,因为从 matstat 的意义上讲,它是极度休眠的。我们的论坛上有很多技术人员,但他们中的大多数人对 matstat 的认识都非常肤浅。在学院里,教授们用 Excel 教授 matstat)这一切都说明我们的科技学校非常糟糕--苏联时代的严肃解决方案更多是在国外购买现成的,而不是在国内开发。

 
Aleksey Nikolayev #:

正确的答案,你需要关于噪声的先验信息。此外,你还需要一个清晰的噪声矩阵模型--加法模型、乘法模型或其他模型。没有模型,就无法制作滤波器。而这个模型应该与真实数据相似。

也许你应该研究一下处理二维或三维数据的地理数据处理方法。或者是像 jpg 图像中的傅立叶变换,或者是新版 jpg 中的小波,或者是多维样条等。

我可以毫无问题地建立一个模型,进行任何分解,甚至是 PCA 并继续前进......但数据呢?

但数据呢? 它们并不存在,这是一个未知函数,甚至是多维....。

所有数据都是 AO 搜索结果的零散点(如果你保存了它们的话)。

这不是时间序列,没有结构或顺序。

 
Aleksey Nikolayev #:

RF 是一个糟糕的例子,因为它在 matstat 的意义上是极其愚蠢的。我们的论坛上有很多技术专家,但他们中的大多数人对 matstat 的认识都非常肤浅。在学院里,教授们用 Excel 来教授 matstat)这一切都说明我们的科技学校非常糟糕--苏联时代的严肃解决方案更多地是在国外购买现成的,而不是在国内开发。

Excel 对他们以后的生活会更有用:D

 
mytarmailS #:

我可以制作一个模型,任何分解都没问题,甚至 PCA 也可以。

但数据呢? 它们不存在,这是一个未知函数,而且是多维的......

数据就是 AO 搜索中的散点(如果你保存了它们)。

它不是时间序列,没有结构或顺序。

那么,我想到的第一件事就是用一个网格来划分空间,网格的单元格不能太大也不能太小(单元格的大小由噪声模型决定)。从某个(例如随机选择的)单元格开始--其中的几个点决定了平滑函数的梯度方向,然后移动到下一个单元格,依此类推,直到没有过渡或循环。极值的位置是根据单元格的大小精确设定的,因此不能太大,但同时也要保证平滑的可 能性,因此也不能太小。我们必须承认,极值的位置原则上是不准确的,因为它会随着平滑方法的不同而变化。