交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2022.12.07 12:44 #28301

Aleksey Nikolayev #:

我没有详细研究过这个问题。这个想法看似简单，但实施起来却有很多技术上的微妙之处。

还有一个问题是，什么叫在噪声函数中寻找最大值....？

根据我对 "优化噪声函数 "定义的理解，这意味着函数很复杂，很难找到最大值，梯度算法不适用，等等......粗略地说，这没什么大不了的，应用全局优化算法，他去寻找全局最大....

但我的看法不同，我想找到一个噪声函数的最大值，但要去除噪声，不是噪声函数中的全局最大值，而是去噪声函数中的全局最大值....。

(这并非易事，因为函数未知，噪声参数未知....）

What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space

2022.12.07
mr.T mr.T 113 6 6 bronze badges
stats.stackexchange.com

I tried several algorithms that seem to be able to handle this, but it didn't work for me. Here is my fitness function which just looks for the max by index

[删除] 2022.12.07 12:46 #28302

СанСаныч Фоменко #:

1.Dick 的问题完全正确。我不使用 NS，但我知道任何 R 软件包中的任何函数都必然包含算法作者的参考文献，对于严肃的算法，还必然包含描述在 R 中实现算法的文章/书籍的参考文献。既然您对 NS 非常熟悉，那么如果您使用 R，就可以在 R 中搜索相应类型的 NS，找到描述相应算法的相应参考文献，找到关于该算法的讨论，找出专业人士的所有细微差别......并以最高的专业水平回答迪克，而不是喃喃自语说些猥亵的话。

2. R 的名称：统计和图形语言。R 的本质揭示了其参考仪器的标准。

以下是 R 软件包涵盖的主题列表。其中一个主题是机器学习。

以下是与机器学习相关的软件包列表。

几年前，我们还能在其他专业统计语言中找到 R 的竞争对手。例如，SPPS，但今天我已经找不到了。R 仍是唯一受支持和管理的统计语言，拥有大量镜像，包含在微软软件中。

将 R 与 Python 相提并论是完全没有道理的。

R 是一种专用语言。Python 是一种通用语言。Python 的用户数量远远超过 R，但 Python 的大众用户是网页设计。Python 拥有统计软件包这一事实并不能将其归类为统计语言。在此基础上，C++（R 和 Python 使用的软件包都是用 C++ 实现的）可以归类为统计语言。由于 R 有详细的标准和对拟议函数算法的参考，它可以用来研究统计学的理论和实践，而 Python 则不能。

在此，我将引用普拉多的话，但不是逐字逐句，因为我忘了 "与经典统计学相比，机器学习在交易中提供了更多可能性"。

而 MO bibles 在 Python 上开发得非常好，尽管其他语言也喜欢 statsmodels。因此，与这些事实争论和相互证明是毫无意义的。

在我看来，R 是为学生、教授和业余爱好者准备的。所以你们可以互相引用，吹嘘一番。对于教授来说，也许是一些教书的教授。Python 用于严肃的项目和生产。我还没听说过有哪个大型 MO 项目使用 R 进行生产。

СанСаныч Фоменко 2022.12.07 15:27 #28303

Maxim Dmitrievsky #:

在此，我将引用普拉多的话，但不是逐字逐句，因为我忘了 "与经典统计学相比，机器学习为交易提供了更多可能性"。

而 MO bibles 在 Python 上的开发也非常完善，尽管其他语言也喜欢 statsmodels。因此，与这些事实争论和相互证明是毫无意义的。

在我看来，R 是为学生、教授和业余爱好者准备的。所以你们可以互相引用，吹嘘一番。对于教授来说，也许有些教授是教书的。Python 用于严肃的项目和生产。我还没听说过用 R 进行的任何重大 MO 项目。

你为什么要争论你自己都声称不知道的东西？

微软已经做出了一些努力，使 R 成为大量开发人员开发大型项目的工具。

以下是允许我们使用 R 的微软产品/服务列表：
。

微软 R 服务器/面向 Azure HDInsight 的 R 服务器
数据科学虚拟机
Azure 机器学习
SQL Server R 服务
Power BI
Visual Studio R 工具

什么样的业余爱好者、什么样的教授需要 Microsoft R Server 生态系统？

以及能让你统一一切的 VM 虚拟机？

Azura云服务及其机器学习软件包和协作开发工具？

现在，R 已成为微软集成到自身和非微软开发项目中的工业系统。

而你是 "业余爱好者"...

Machine learning in trading:

[删除] 2022.12.07 15:40 #28304

СанСаныч Фоменко #:

你为什么要猜测你自己也声称不知道的事情？

微软已经做出了一些努力，使 R 成为大量开发人员开发大型项目的工具。

以下是允许我们使用 R 的微软产品/服务列表：
。

微软 R 服务器/面向 Azure HDInsight 的 R 服务器
数据科学虚拟机
Azure 机器学习
SQL Server R 服务
Power BI
Visual Studio R 工具

什么样的业余爱好者、什么样的教授需要 Microsoft R Server 生态系统？

以及能让你统一一切的 VM 虚拟机？

Azura云服务及其机器学习软件包和协作开发工具？

现在，R 已成为微软集成到自身和非微软开发项目中的工业系统。

而你是 "业余爱好者"...

很明显，"那里有些东西"。

我说的是与实施者交流的经验，其中包括大型实施者，至少在俄罗斯是这样。

他们都是用 Python 开发的。

微软有 C# 和 Asure 语言的机器学习 sdk，但没人用。

你用 R 语言做了一个大项目，放在服务器上，谁来维护？没有人，因为没有这样的专家，也没有人愿意因为一个统计数据而学习 R。

至于 python，随便雇个学生，一根香肠就能搞定。

"没人 "是指没有人以任何借口用 R 语言写作。因为有 python。

而你却驱使那些 "学究 "们用 R 语言写作，这样他们会怎样？

Aleksey Nikolayev 2022.12.07 15:45 #28305

mytarmailS #:

还有一个问题是，在噪声函数中找到最大值是什么意思...

按照我的理解，"噪声函数的优化 "是指函数很复杂，很难找到其中的最大值，梯度算法不适用，等等....。粗略地说，这没什么大不了的，你应用全局优化算法，它就会去寻找全局最大值....。

但我的看法不同，我想找到一个噪声函数的最大值，但要去掉噪声，不是噪声函数中的全局最大值，而是去噪声函数中的全局最大值....。

(这并非易事，因为函数未知，噪声参数未知....）

你需要关于噪声的先验信息。此外，你还需要一个清晰的噪声矩阵模型--加法、乘法或其他模型。没有模型，就无法制作滤波器。而这个模型应该与真实数据相似。

也许你应该研究一下处理二维或三维数据的地理数据处理方法。或者是像 jpg 图像中的傅立叶变换，或者是新版 jpg 中的小波，或者是多维样条等。

Aleksey Nikolayev 2022.12.07 15:56 #28306

Maxim Dmitrievsky #:

我想引用一句口号 "战斗和搜索--发现和隐藏"。

将任何标准设置为自定义指标，尤其是这些标准指标。它仍会通过 logloss 进行优化，但会停止在这些自定义指标上，这或许有些意义

事实上也是如此，因为停在同一位置总是基于某些投射标准，如准确性。

到目前为止，我想只有这种情况。你也可以根据自定义标准进行树形修剪。

Aleksey Nikolayev 2022.12.07 16:08 #28307

Maxim Dmitrievsky #:

可见 "有"

我是根据与实施者（包括大型实施者）交流的经验说这番话的，至少在俄罗斯联邦是这样

一切都是用 Python 语言完成的

微软有 C# 和 Asure 语言的机器学习 sdk，但没人使用它们

你用 R 语言做了一个大项目，把它放在服务器上，谁来维护它呢？没有人，因为在如此庞大的数字中没有专家，也没有人愿意因为一个统计数据而学习 R。

至于 Python，随便雇个学生，一根香肠就能搞定。

"没有人 "是指没有人以任何借口用 R 语言写作。因为有 python。

而你却驱使外行人用 R 语言写作，这样他们会怎样？

RF 就是一个糟糕的例子，因为从 matstat 的意义上讲，它是极度休眠的。我们的论坛上有很多技术人员，但他们中的大多数人对 matstat 的认识都非常肤浅。在学院里，教授们用 Excel 教授 matstat）这一切都说明我们的科技学校非常糟糕--苏联时代的严肃解决方案更多是在国外购买现成的，而不是在国内开发。

mytarmailS 2022.12.07 16:08 #28308

Aleksey Nikolayev #:

正确的答案是，你需要关于噪声的先验信息。此外，你还需要一个清晰的噪声矩阵模型--加法模型、乘法模型或其他模型。没有模型，就无法制作滤波器。而这个模型应该与真实数据相似。

也许你应该研究一下处理二维或三维数据的地理数据处理方法。或者是像 jpg 图像中的傅立叶变换，或者是新版 jpg 中的小波，或者是多维样条等。

我可以毫无问题地建立一个模型，进行任何分解，甚至是 PCA 并继续前进......但数据呢？

但数据呢？它们并不存在，这是一个未知函数，甚至是多维....。

所有数据都是 AO 搜索结果的零散点（如果你保存了它们的话）。

这不是时间序列，没有结构或顺序。

[删除] 2022.12.07 16:20 #28309

Aleksey Nikolayev #:

RF 是一个糟糕的例子，因为它在 matstat 的意义上是极其愚蠢的。我们的论坛上有很多技术专家，但他们中的大多数人对 matstat 的认识都非常肤浅。在学院里，教授们用 Excel 来教授 matstat）这一切都说明我们的科技学校非常糟糕--苏联时代的严肃解决方案更多地是在国外购买现成的，而不是在国内开发。

Excel 对他们以后的生活会更有用：D

Aleksey Nikolayev 2022.12.07 16:27 #28310

mytarmailS #:

我可以制作一个模型，任何分解都没问题，甚至 PCA 也可以。

但数据呢？它们不存在，这是一个未知函数，而且是多维的......

数据就是 AO 搜索中的散点（如果你保存了它们）。

它不是时间序列，没有结构或顺序。

那么，我想到的第一件事就是用一个网格来划分空间，网格的单元格不能太大也不能太小（单元格的大小由噪声模型决定）。从某个（例如随机选择的）单元格开始--其中的几个点决定了平滑函数的梯度方向，然后移动到下一个单元格，依此类推，直到没有过渡或循环。极值的位置是根据单元格的大小精确设定的，因此不能太大，但同时也要保证平滑的可能性，因此也不能太小。我们必须承认，极值的位置原则上是不准确的，因为它会随着平滑方法的不同而变化。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2831