量化交易 (Quantitative trading) - 页 37

 

多元随机变量(FRM Part 1 2023 – Book 2 – Chapter 4)


多元随机变量(FRM Part 1 2023 – Book 2 – Chapter 4)

在关于多元随机变量的这一章中,我们探讨了多个随机变量之间的相关性概念。在前一章关于随机变量的基础上,我们深入研究了债券价格与到期收益率之间的关系,强调了其他因素对债券价格的潜在影响。我们引入了多元随机变量的概念,扩展了我们对概率质量函数和概率密度函数的理解,以分析离散和连续随机变量。本章旨在通过将额外维度纳入我们的分析来扩展我们的知识,最终增强我们对投资组合分析的理解。本章涵盖的关键主题包括概率矩阵、函数期望、协方差、相关性、变换、投资组合分析、方差、条件期望以及同分布和独立分布的随机变量。

简介:本章首先强调多元随机变量的概念,它解释了两个或多个随机变量之间的相关性。以债券价格和到期收益率为例,我们认识到仅依靠单一变量来捕捉各种风险的复杂性的局限性。我们承认需要考虑贸易、关税、税收、政府法规和消费者口味等其他因素,以更全面地了解债券价格。通过将我们的分析扩展到多元随机变量,我们旨在解释各种因素之间的相互作用及其对我们研究的变量的影响。

学习目标:本章概述了与上一章一致的学习目标。这些目标包括理解概率矩阵、探索函数的期望、检查随机变量之间的关系、研究协方差和相关性、分析变换、结合投资组合分析、探索方差、调查条件期望,并以对相同和独立分布的随机变量的讨论结束.这些目标建立在我们现有知识的基础上,并将其扩展到多元分析领域。

多元随机变量:引入多元随机变量作为捕获多个随机变量之间依赖关系的变量。与单变量分析相比,多变量分析使我们能够研究这些变量如何共同影响感兴趣的变量。我们考虑多个随机变量同时影响我们旨在研究的变量的场景。本章提供示例说明多元分析如何增强我们对复杂关系的理解。

概率分布:本章回顾了上一章介绍的概率质量函数 (PMF) 和概率密度函数 (PDF)。虽然离散随机变量与 PMF 相关联,但连续随机变量需要 PDF 来准确表示它们的概率分布。还讨论了累积概率的概念,使我们能够确定一个组件小于或等于给定值的概率。通过使用这些工具,我们可以评估基于不同分布(例如正态分布、指数分布和均匀分布)的各种结果的可能性。

双变量离散随机变量分布:我们探索双变量离散随机变量分布,表示两个随机变量之间的联合概率。以表格形式可视化此分布可以更清楚地了解变量之间的关系。通过分析条件分布和边际分布,我们可以深入了解与特定结果相关的概率。这种分析有助于我们确定变量之间的依赖关系并评估它们的单独和组合影响。

条件分布和期望:引入条件分布是为了在一个变量的值已知时检查随机变量之间的关系。通过对特定变量值进行分析,我们可以评估其他变量的条件期望。这种方法使我们能够估计特定条件下的预期结果,阐明不同因素对感兴趣变量的影响。可以使用边际概率和相关的条件概率分布来计算条件期望。

Measuring Relationship between Random Variables:本章最后强调了衡量随机变量之间关系的重要性。我们探索了各种统计量度,例如协方差和相关性,这使我们能够量化随机变量之间的依赖程度。

引入协方差作为评估一个变量的变化如何对应于另一个变量的变化的度量。它捕获关系的方向(正向或负向)以及变量一起移动的程度。本章提供了计算离散和连续随机变量协方差的公式。

另一方面,相关性通过将协方差除以变量标准差的乘积来标准化协方差。这种归一化允许在 -1 到 1 的范围内比较变量之间关系的强度。正相关表示直接关系,负相关表示反相关,接近零的相关表示弱或没有线性关系。

随机变量的变换:本章探讨了变换随机变量的概念,以更好地分析它们的关系和分布。转换可能涉及简单的数学运算,例如加法、减法、乘法和除法,或更复杂的函数。通过应用适当的转换,我们通常可以简化分析并更深入地了解变量的行为。

投资组合分析:本章介绍了投资组合分析作为多元分析在金融领域的应用。我们探索如何使用多元技术分析不同资产类别之间的关系,以其回报为代表。强调多元化的概念,强调将具有低相关性或负相关性的资产组合起来如何降低投资组合风险。讨论了各种措施,如投资组合方差和协方差,以评估投资组合绩效和优化资产配置。

方差和协方差矩阵:本章深入探讨了方差的概念并将其扩展到多变量设置。方差-协方差矩阵,也称为协方差矩阵,提供了多个随机变量之间的方差和协方差的综合表示。它是投资组合分析和风险管理的关键工具,能够计算投资组合风险并确定最佳资产配置。

条件期望:条件期望被探索为一种在给定特定条件下估计随机变量期望值的方法。这个概念允许我们将额外的信息或约束纳入我们的分析并改进我们的预测。本章讨论了离散和连续随机变量的条件期望,强调了它们在决策和预测问题中的效用。

相同且独立分布的随机变量:本章最后讨论了相同且独立分布 (iid) 的随机变量。当一组随机变量服从相同的分布并且相互独立时,它们被称为 iid 这个概念在各种统计分析和模型中都很重要。本章探讨独立同分布随机变量的性质和含义,强调它们在概率论和统计推断中的相关性。

总结:关于随机变量的多元分析和相关性的章节通过考虑多个变量的联合行为扩展了我们对概率和统计的理解。通过在我们的分析中加入额外的维度,我们可以更好地捕捉变量之间的复杂关系和依赖关系。本章涵盖各种主题,包括概率矩阵、函数期望、协方差、相关性、变换、投资组合分析、方差-协方差矩阵、条件期望和 iid 随机变量。这些概念为我们提供了分析多变量数据、做出明智决策以及更深入地了解随机变量的潜在动态的工具。

Multivariate Random Variables (FRM Part 1 2023 – Book 2 – Chapter 4)
Multivariate Random Variables (FRM Part 1 2023 – Book 2 – Chapter 4)
  • 2020.01.30
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

示例时刻(FRM 第 1 部分 2023 – 第 2 册 – 第 5 章)


示例时刻(FRM 第 1 部分 2023 – 第 2 册 – 第 5 章)

《定量分析》第 2 册第 1 部分中标题为“样本矩”的一章深入探讨了样本及其矩的概念。经常观看我视频的观众都知道,我更喜欢展示有趣的例子,这些例子不仅相关而且符合我们的目的。有些人可能认为它们很愚蠢,但它们在我们讨论的背景下具有重要意义。在开始本章之前,我将分享一个围绕葡萄柚的介绍性示例,这恰好是我个人的最爱。

探索葡萄柚籽:我不仅喜欢吃葡萄柚,而且为我的孩子们切开它也很开心。他们喜欢它的味道,这无疑对他们的健康有益。然而,当我们切开葡萄柚并发现里面有许多种子时,困境就出现了。假设我们是研究人员,有兴趣了解葡萄柚中的种子数量。为了对此进行调查,我们踏上了从一家食品店采购数千个葡萄柚的旅程。回到家后,我们小心翼翼地切开每个葡萄柚,却发现了数量不等的种子。有些葡萄柚有 3 或 4 颗种子,而另一些则有 6 或 7 颗,少数甚至有 10 或 12 颗。

记录样本数据:我们拥有一千个葡萄柚,我们努力记录每个水果中的种子数量。但是,整个样本可能无法为我们提供广泛的信息。它提供了一个粗略的范围和切开葡萄柚时预期的一般概念。为了深入研究,我们必须将注意力转移到本章标题的第二部分:时刻。我们的目标是探索这个样本的时刻,这些时刻可以启发我们了解未来的葡萄柚消费量和预期的种子数量。我们遇到的第一个时刻是平均数或平均数。将一千个葡萄柚的种子总数除以一千,我们可以得出平均数,比方说,五个种子。

考虑多个时刻:但是,我们必须承认,每次切开一个新的葡萄柚时,我们可能不会恰好获得五颗种子。我们可能会取回三颗种子或七颗种子,或任何其他数量。因此,我们也需要考虑其他时刻。总而言之,从这个看似微不足道的初始示例中得出的关键结论是,时刻(本章将讨论其中的四个时刻)提供了对样本分布的洞察力。有了这些知识,我们就可以就未来的葡萄柚消费量和预期的种子数量做出明智的决定。

学习目标: 现在,让我们将注意力转移到本章概述的学习目标上。有趣的是,这些目标并没有明确提到葡萄柚,我相信我们都会为此感激不尽。那么,未来会发生什么?我们将进行大量估计,包括均值、总体矩、样本矩、估计量和估计值。我们将评估这些时刻是否表现出偏见。例如,如果我们在葡萄柚样本中发现每三个葡萄柚中有一个含有 50 粒种子,这似乎极不可能,而且与我们对葡萄柚种子的合理预期相去甚远。因此,我们需要警惕有偏见的时刻。此外,我们将探索中心极限定理并继续检查分布的三阶和四阶矩,即偏度和峰度。最后,我们将深入研究协变、相关、协偏度和协峰态,它们有望使本幻灯片成为令人愉悦且富有洞察力的体验。

结论:随机变量的研究超出了分析单个变量的范围。它涉及检查多个变量的关系、依赖性和分布。

通过理解这些概念,研究人员和分析师可以获得对复杂系统的行为和交互的宝贵见解。在本章接下来的部分中,我们将进一步探讨不同矩的意义及其在统计分析中的应用。

中位数和四分位数范围:手头的主题是中位数及其意义,尤其是在研究中。研究人员,包括金融领域的研究人员,对检查四分位数范围很感兴趣,这涉及将数据分为四个部分并关注中间部分。然而,作为金融风险管理者,我们也必须考虑分布的左尾。这就是风险价值 (VaR) 概念发挥作用的地方,但我们稍后会深入探讨。现在,让我们花点时间讨论中位数。

计算中位数:计算中位数很有趣,因为它因观察次数而异。例如,如果我们有三个具有不同种子数(3、5 和 7)的葡萄柚,则中位数将是中间值,即 5。在奇数大小的样本中,中位数只是中间观察值。然而,对于偶数个观察值,我们取两个中间值的平均值。在我们的示例中,两个葡萄柚的种子数分别为 5 和 7,中位数为 (5 + 7) / 2 = 6。

中位数的稳健性:重要的是要注意中位数可能与数据集中的实际观察不对应,尤其是在处理偶数大小的样本时。此外,中位数不受极值的影响,使其成为一种稳健的衡量标准。此外,它可以作为中点,特别是对于较大的数字。

超越个体变量:到目前为止,我们一直关注分布的时刻。但是,我们还需要了解均值的左侧和右侧。这将我们引向中心极限定理,它提供了对随机样本行为的洞察。当我们从总体中抽取大量样本时,例如 1,000 个观察值,样本均值的分布近似于正态分布。随着样本量的进一步增加,样本均值的分布变得更接近于正态分布。在我们的例子中,我们可以从不同的商店获取一千个观察值,使我们能够计算样本均值并近似抽样分布。

抽样分布和近似:总而言之,如果样本呈正态分布,则样本均值的抽样分布也将呈正态分布。然而,当样本总体近似对称时,抽样分布变得近似正态,特别是对于小样本量。但是,在向数据引入偏度时,通常需要 30 或更多的样本量才能使抽样分布变得近似正态。

实际应用:概率估计:为了说明这个概念,让我们考虑一个例子。假设我们有某个品牌的轮胎,平均寿命为 30,000 公里,标准偏差为 3,600 公里。我们想确定 81 个轮胎的平均寿命小于 29,200 公里的概率。通过使用提供的信息和 z 表计算 z 分数,我们发现概率大约为 0.02275,即 2.275%。这表明平均寿命小于 29,200 公里的概率较低。

变量之间的依赖性和关系:到目前为止,我们已经检查了单个随机变量。然而,我们通常对研究两个变量之间的关系感兴趣,例如利率和通货膨胀。这两个变量是随机的,可能表现出高度相关性。为了评估这种关系,我们使用协方差,它衡量两个随机变量随时间的联合变异性。通过将每个观察值与两个变量的相应平均值之间的差值相乘,我们可以计算出协方差。

协方差:两个变量 X 和 Y 之间的协方差可以使用以下公式计算:

cov(X, Y) = Σ((X - μX)(Y - μY)) / (n - 1)

其中 X 和 Y 是变量,μX 和 μY 是它们各自的均值,n 是观测值的数量。

协方差的符号表示变量之间关系的方向。如果协方差为正,则表明存在正相关关系,这意味着随着一个变量的增加,另一个变量也趋于增加。相反,负协方差表示负相关,其中一个变量增加,另一个变量趋于减少。

然而,协方差的大小本身并不能清楚地衡量变量之间关系的强度,因为它受到变量尺度的影响。为了克服这个限制并更好地了解关系的强度,我们可以使用相关系数。

相关系数:相关系数用 r 表示,衡量两个变量之间线性关系的强度和方向。它是一个介于 -1 和 1 之间的标准化度量。

相关系数的计算公式为:

r = cov(X, Y) / (σX * σY)

其中 cov(X, Y) 是 X 和 Y 之间的协方差,σX 和 σY 分别是 X 和 Y 的标准差。

相关系数为变量之间的关系提供了有价值的见解。如果相关系数接近于 1 或 -1,则表明线性关系很强。相关系数为 1 表示完全正线性关系,-1 表示完全负线性关系。接近 0 的相关系数表明变量之间的线性关系较弱或没有线性关系。

重要的是要注意相关性并不意味着因果关系。即使两个变量高度相关,也并不一定意味着一个变量会导致另一个变量发生变化。相关性只是量化两个变量一起移动的程度。

通过协方差和相关分析了解变量之间的关系,使研究人员和分析师能够深入了解不同因素之间的模式、依赖关系和潜在预测能力。这些措施广泛应用于各个领域,包括金融、经济学、社会科学和许多其他领域,以研究变量之间的关系并做出明智的决策。

Sample Moments (FRM Part 1 2023 – Book 2 – Chapter 5)
Sample Moments (FRM Part 1 2023 – Book 2 – Chapter 5)
  • 2020.01.30
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

假设检验(FRM 第 1 部分 2023 – 第 2 册 – 第 6 章)


假设检验(FRM 第 1 部分 2023 – 第 2 册 – 第 6 章)

在定量分析课程的第 1 部分第 2 册中,有一章是关于假设检验的。作者提到,本章可能包含学生可能从本科统计课上记住的信息。本章涵盖各种学习目标,包括理解样本均值和样本方差、构建和解释置信区间、使用原假设和备择假设、进行单尾或双尾检验以及解释结果。

本章首先讨论了样本均值,样本均值定义为样本中所有值的总和除以观察值的数量。虽然样本均值的计算不是主要焦点,但了解其在推断总体均值时的用途至关重要。作者强调,由于从整个总体中收集数据通常是不切实际的,因此根据中心极限定理选择样本并进行检验,该定理提供了均值的近似抽样分布。

接下来,作者强调了估计样本标准差的重要性,因为总体的标准差通常是未知的。它们提供了计算样本均值标准误差的公式。举例说明计算,均值为$15.50,标准差为3.3,样本量为30。

本章随后讨论了样本方差,它衡量观察值与均值的离差。作者解释说,方差越高表示数据的风险或可变性越大。它们提供了一个计算样本方差的公式,涉及个体观察值与样本均值之间的差异,并除以自由度。

接下来是置信区间,作者介绍了置信水平的概念,并解释了它们如何提供一个范围,在这个范围内,一定比例的结果预计会落在该范围内。通常使用 95% 的置信水平,这意味着此类区间的 95% 实现将包含参数值。作者提出了构建置信区间的通用公式,其中涉及点估计(例如,样本均值)加上或减去标准误差乘以可靠性因子。可靠性因素取决于所需的置信水平以及总体方差是已知还是未知。

作者提供了一个表格,可以根据所需的置信度和样本量选择合适的可靠性因子。他们还讨论了 z 分数和 t 分数的使用,具体取决于总体方差是已知还是未知。给出了一个示例来演示使用样本均值和标准差计算考试学习平均时间的 95% 置信区间。

最后,本章简要提到了假设检验,它涉及对人口特征做出假设或主张,并进行检验以评估其有效性。作者介绍了假设检验的步骤,包括陈述假设、选择检验统计量、指定显着性水平、定义决策规则、计算样本统计量和做出决策。

总的来说,本章全面概述了定量分析中的重要概念,特别关注样本均值、样本方差、置信区间和假设检验。这些主题是统计分析的基础,为从数据中进行推论和得出结论提供了基础。

Hypothesis Testing (FRM Part 1 2023 – Book 2 – Chapter 6)
Hypothesis Testing (FRM Part 1 2023 – Book 2 – Chapter 6)
  • 2020.02.05
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

回归诊断(FRM Part 1 2023 – Book 2 – Chapter 9)


回归诊断(FRM Part 1 2023 – Book 2 – Chapter 9)

在本章中,我们将讨论回归诊断及其在分析回归模型中的重要性。为了提供背景信息,让我们考虑一个假设场景,我们正在检查债券发行的信用评级变化。我们收集了各种债券发行的大量数据,包括现金流量、杠杆率、领导力因素、利率等变量。我们的目标是确定穆迪、标准普尔或惠誉是否会改变特定债券发行的信用评级。为了对此进行分析,我们采用多元回归模型,其中违约风险变化作为因变量和自变量,如前所述。

最初,我们检查由 Excel 等软件生成的回归输出,以使用 R 平方和 F 统计量等指标评估整体模型拟合。我们还评估了各个斜率系数的重要性。然而,重要的是要认识到这些结论在很大程度上依赖于普通最小二乘法 (OLS) 模型的假设。如果违反这些假设,则从回归输出中得出的结论可能无效。

本章可被视为理解和解决回归模型中可能出现的潜在问题的指南。它可以恰当地命名为“可能出了什么问题?”我们探讨了可能影响回归结果有效性的各种问题,包括异方差性、多重共线性、自变量太少或太多、异常值和最佳线性无偏估计量 (BLUE)。让我们更详细地研究这些主题中的每一个。

我们首先关注的异方差性是指违反了回归模型中的误差项具有恒定方差(同方差性)的假设。当存在异方差时,误差项的方差不是恒定的,而是随不同的观察而变化。在绘制自变量和因变量之间的关系时,我们可以将其可视化为圆锥形。这意味着随着自变量的增加,因变量的可变性也会增加。当模型不完整或数据集很小且包含异常值时,可能会出现异方差性。

异方差的后果是显着的。 OLS 估计量失去了效率,这意味着存在其他方差较小的估计量。这种低效率导致不正确的标准误差,进而影响置信区间和假设检验。因此,从这些测试中得出的结论可能具有误导性,甚至完全没有用。为了检测异方差性,研究人员最初可以使用散点图直观地评估变量之间的关系。然而,像 White 检验这样的统计检验解释了误差项的非线性,可以更精确地评估异方差性。可以通过加权最小二乘法、数据变换(例如,对数)、在估计中使用权重或其他适当的方法来解决异方差性问题。

继续多重共线性,我们会遇到两个或多个自变量高度相关的情况。理想情况下,自变量应该相互独立,但在现实中,往往存在某种程度的相关性。然而,完美的多重共线性,即变量完全线性相关,可能会造成严重的问题。在这种情况下,应该删除其中一个共线变量,因为它们本质上是相同的。当自变量适度或强烈相关但不完全相关时,就会出现不完全多重共线性。自变量之间的高度相关性表明存在多重共线性。然而,不存在高相关性并不能保证它不存在,因为变量可以在某种程度上随机相关。

多重共线性的后果是双重的。首先,虽然估计保持无偏,但方差和标准误差增加了。

在回归模型中包含无关变量被称为过度指定问题。当我们添加与因变量没有实际关系的自变量时,就会发生这种情况。包括这些变量可能导致有偏差的估计和资源的低效使用。

另一方面,我们还需要考虑规范不足的问题。当模型中省略了重要的自变量时,就会发生这种情况。正如我们之前所讨论的,省略相关变量会导致有偏差和不一致的估计。

为了解决过度设定和不足设定的问题,我们需要仔细选择要包含在我们的回归模型中的变量。这个选择过程应该基于理论、先验知识和经验证据。重要的是要考虑变量和因变量之间的潜在经济或理论关系。

回归分析中出现的另一个问题是异常值的存在。离群值是显着偏离数据一般模式的极值。这些异常值会对回归结果产生重大影响,影响估计系数和模型的整体拟合。

有几种处理异常值的方法。一种常见的方法是从数据集中识别和删除异常值。这可以通过目视检查散点图或使用马氏距离或学生化残差等统计技术来完成。

或者,如果异常值是携带重要信息的有影响的观察值,我们可以选择将它们保留在分析中,但应用受极值影响较小的稳健回归方法。

最后,让我们谈谈最佳线性无偏估计量 (BLUE) 的概念。 BLUE 是 OLS 估计器的一个理想属性,它确保它是无偏的,并且在所有线性无偏估计器中具有最小的方差。

OLS 估计量在经典线性回归模型的假设下实现了 BLUE 属性,包括线性、独立性、同方差性和不存在多重共线性的假设。正如我们之前讨论的那样,违反这些假设可能会导致有偏差和低效的估计。

关于回归诊断的章节侧重于识别和解决回归分析中可能出现的潜在问题。这些问题包括异方差性、多重共线性、遗漏变量偏差、过度指定、指定不足和异常值。通过了解这些问题并采用适当的技术,我们可以确保回归结果的可靠性和有效性。

Regression Diagnostics (FRM Part 1 2023 – Book 2 – Chapter 9)
Regression Diagnostics (FRM Part 1 2023 – Book 2 – Chapter 9)
  • 2020.02.05
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

机器学习方法 – A 部分(FRM 第 1 部分 2023 – 第 2 册 – 定量分析 – 第 14 章)


机器学习方法 – A 部分(FRM 第 1 部分 2023 – 第 2 册 – 定量分析 – 第 14 章)

大家好,我是吉姆,我想讨论本书的第 1 部分,内容是定量分析和机器学习方法。本节旨在探讨 A 部分涵盖的概念,并强调机器学习的相关性和重要性。

让我们从阅读的结构开始。它分为 A 和 B 两部分,B 部分将在不久的将来进行介绍。目标是通过在 A 部分获得的知识的基础上提供对机器学习的全面理解。希望完成 A 部分将激励您通过探索 B 部分继续学习。

虽然将这种阅读视为经典计量经济学理论的延伸可能很诱人,但机器学习远不止于此。机器学习代表了一个独特的领域,具有自己独特的特征和应用。请允许我分享一个简单的例子来说明这一点。

2023 年,NBA 球迷可能会注意到,勒布朗·詹姆斯很可能会超越卡里姆·阿卜杜勒·贾巴尔,成为历史上职业得分王。现在,让我们把自己想象成热心的 NBA 球迷,他们想要确定这些才华横溢的球员中,哪一个更有效地创造了他们的得分记录。为此,我们收集了他们比赛的大量数据,精心记录了每一个细节,包括勒布朗的动作和卡里姆标志性的天钩投篮。我们收集的变量数量可能达到数万亿。

如果我们要使用经典计量经济学理论分析这些数据,我们可能会采用回归分析并计算标准偏差和标准误差。然而,当处理一万亿个数据点时,这样的计算就变得不切实际了。除以万亿的平方根,即大约 316,000,得到的结果很小,假设检验无效。

这就是机器学习介入的地方。机器学习使我们能够处理大量数据,而不受经典计量经济学理论的限制。机器学习的应用非常广泛,从图像识别和医学研究到博弈论和金融资产配置。

机器学习可以分为三种类型:无监督学习、监督学习和强化学习。无监督学习涉及探索没有预定义标签的数据模式,而监督学习则利用标记数据来训练模型。强化学习使代理能够从动态环境中学习,这使其对于条件随时间变化的风险管理特别有价值。

尽管机器学习具有巨大的潜力,但它也带来了独特的挑战。在前四个学习目标中,我们将讨论机器学习技术与经典计量经济学之间的差异。我们将深入研究主成分、K 均值聚类以及无监督、监督和强化学习模型之间的区别等概念。

在经典计量经济学中建立坚实的理论基础对于有效实施模型至关重要。经典计量经济学在某些假设下运行,例如变量之间的线性关系和因果关系的存在。相比之下,机器学习提供了一个更灵活的框架,允许非线性关系和更大量的数据。

为了使数据适合机器学习算法,我们需要对其进行缩放和预处理。这涉及标准化或规范化,以确保数据具有可比性并准确代表基础信息。此外,了解机器学习算法及其输出对于评估结果和进行必要的调整至关重要。

机器学习在各种情况下都有用处,包括图像识别、安全选择、风险评估和玩游戏。通过利用机器学习技术,我们可以解决复杂的问题并从大量不同的数据集中提取有意义的见解。

现在,关于我的电子邮件提供商,它缺乏识别垃圾邮件的能力。它只会将极度垃圾邮件归类为垃圾邮件,这些邮件源自 XYZ 627 等来源,位于 337-1414 点某处。让我们将注意力转移到监督学习的类型上。第一种是分类,我之前在勒布朗和卡里姆的背景下提到过。它涉及将数据分类为不同的类别,例如默认或非默认。监督学习还包括回归分析。监督学习算法的一些示例包括 K 最近邻、决策树、神经网络和支持向量机。这些算法将在下一篇文章中进一步探讨。

现在,让我们深入研究第三种学习:强化学习。正如我之前提到的,强化学习类似于反复试验,国际象棋就是一个典型的例子。在这种类型的学习中,代表学习系统的代理与环境交互、做出决策并从结果中学习。智能体会因期望的行为而获得奖励,并因不良行为而受到惩罚。它的目标是最大化奖励和最小化惩罚,不断学习和提高绩效。智能体解释环境,形成感知,并根据它们采取行动。

强化学习以循环方式运行,不断迭代并适应不断变化的环境。奖励和惩罚必须反映不断变化的环境。例如,如果代理人试图通过伪装来欺骗面部识别系统,但由于面部隐藏不佳而被抓获,应该再给它一次机会,而不是受到过度惩罚。智能体从错误和成功中学习以优化其行为。

为了可视化这个过程,想象一个代表环境的蓝色盒子。代理人被拟人化为一个生活在算法中的人,在这个环境中导航,并通过反复试验的路径努力变得更聪明。智能体在不断变化的环境中的经验决定了它的学习过程。目的是最大化奖励和最小化惩罚,这提出了一个有趣的考试问题。

现在让我们探索主成分分析 (PCA)。该技术通过降低维度来简化复杂的数据集。 PCA 有助于识别数据集中最重要的变量,从而提高模型的可解释性。该过程涉及将训练数据集投影到低维空间,也称为超平面。它首先对数据进行标准化或归一化,然后计算协方差矩阵。接下来,根据所需的维度选择顶部主成分。然后将数据投影到这个缩小的空间上,捕获最大的差异。这种分析使研究人员能够确定哪些变量在解释数据时最重要。

另一个引人入胜的话题是聚类,它属于无监督学习。聚类的目标是根据数据点与质心的相似性对数据点进行分组。该算法首先随机分配 K 个质心,然后将每个数据点分配给最近的质心,从而创建 K 个簇。它继续迭代地重新分配数据点并调整质心以最小化距离平方和。聚类的质量可能会有所不同,有些聚类比其他聚类定义更明确。找到最佳聚类数 (K) 并改进聚类过程至关重要。

这些不同的学习技术为分析和解释数据、在不同研究领域实现模式识别、决策制定和优化提供了宝贵的工具。虽然经典计量经济学提供了坚实的基础,但采用机器学习使我们能够克服传统方法的局限性并探索广泛的应用。

Machine-learning Methods – Part A (FRM Part 1 2023 – Book 2 – Quantitative Analysis – Chapter 14)
Machine-learning Methods – Part A (FRM Part 1 2023 – Book 2 – Quantitative Analysis – Chapter 14)
  • 2023.02.03
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

机器学习方法 – B 部分(FRM 第 1 部分 2023 – 第 2 册 – 定量分析 – 第 14 章)


机器学习方法 – B 部分(FRM 第 1 部分 2023 – 第 2 册 – 定量分析 – 第 14 章)

嘿!我是吉姆,我来这里是为了讨论第二本书第一部分的内容,标题为“定量分析和机器学习方法”。具体来说,我们将重点关注 B 部分。在之前的视频中,我们介绍了前四个学习目标,今天我们将深入探讨接下来的四个目标。

在我们继续之前,我想发表几点评论。如果你注意到了,我的头发在这段视频中变短了。昨晚我老婆给了我免费理发,所以请原谅我的容貌变化。现在,让我们继续讨论机器学习。

众所周知,机器学习涉及处理大量数据。在 A 部分,我们讨论了处理数万亿个数据点的概念,尽管这个数字只是一个比喻。主要思想是我们可以访问大量数据,我们可以在机器学习算法中利用这些数据。例如,在我今天早上的衍生证券课上,我们探讨了期权定价以及利率等因素如何影响它。我们分析了过去 50 年的各种公开数据点,例如实际利率、无风险利率、流动性溢价、违约风险溢价和到期风险溢价。所有这些数据点都可以纳入机器学习算法中,以获得有价值的见解。

在 A 部分中,我们介绍了聚类、降维和主成分分析等主题。所有这些技术背后的最终目标是开发能够准确代表现实世界的模型。但是,我们需要应对一些挑战。

阅读的第二部分讨论了过拟合和欠拟合的概念。当我们试图将太多的复杂性融入模型时,就会发生过度拟合。为了说明这一点,让我分享一个我父亲在向我解释交通时使用的类比。他会说,“一磅的袋子装不下五磅的石头。”同样,当我们过度拟合一个模型时,我们试图包含太多细节和噪声,最终导致性能不佳和预测不可靠。尽管我们可能会在训练数据上实现较低的预测误差,但该模型在应用于新数据时可能会出现较高的预测误差。为了解决过度拟合问题,我们可以通过降低复杂性来简化模型,这涉及减少特征或参数的数量。此外,我们可以采用正则化和早停技术,我们将在下一篇文章中探讨这些技术。

另一方面,当模型过于简单而无法捕捉数据中的潜在模式时,就会发生欠拟合。这会导致训练数据集和新数据集的性能不佳和预测错误率高。为了克服欠拟合,我们需要通过添加更多的特征或参数来增加模型的复杂性。在经典计量经济学中,添加更多自变量可能会导致多重共线性问题。然而,在机器学习中,我们可以接受独立变量之间的相互作用来增加复杂性。

为了在偏差和方差之间取得平衡,我们必须考虑模型简单性和预测准确性之间的权衡。偏差是指通过用更简单的模型逼近复杂模型而引入的误差。在飞镖盘类比中,如果所有飞镖始终落在同一个位置,偏差就会很大。另一方面,方差衡量模型对小波动的敏感程度。在飞镖盘类比中,当飞镖散落在各处时,就会出现高方差。我们的目标是在捕获潜在模式的同时最小化方差,这需要找到模型的最佳复杂程度。

在本次会议中,我们将深入探讨机器学习和数据处理的重要方面。在机器学习的背景下,了解输入数据与所需输出之间的关系至关重要。为实现这一目标,我们使用了一个训练数据集。此外,我们使用验证集来评估我们模型的性能,并使用测试数据集来检查样本外数据的有效性。

然而,机器学习的一个主要挑战是由于需要大量的训练数据而导致测试数据稀缺。因此,明智地分配数据至关重要。研究人员可以确定如何将数据分为三个样本:训练、验证和测试。一个常见的经验法则是分配三分之二的数据用于训练,同时将剩余的三分之一平均分配给验证和测试。这种分配平衡了每组的边际成本和收益。

在横截面数据的情况下,数据是在特定时间点在不同实体上收集的,随机划分就足够了。但是,在处理随时间捕获数据点的时间序列数据时,需要考虑其他因素。时间序列数据需要按时间顺序排列,从训练集开始到后续集。

当整个数据集不足以分配单独的训练、验证和测试集时,交叉验证技术就会发挥作用。在这种情况下,研究人员可以将训练集和验证集结合起来。一种流行的方法是 k 折交叉验证,其中数据集被分成指定数量的折叠或子集。折叠数的常见选择包括 5 和 10,但可以根据特定要求探索其他值。

我们之前简要讨论过的强化学习涉及通过处理数据进行学习的代理。在这种情况下,代理处理历史数据(例如客户贷款申请)以做出明智的决策。代理旨在向可能还款的客户借钱,并拒绝可能违约的客户的申请。代理从过去的决策中学习,获得正确决策的奖励,并因错误而受到惩罚。通过一系列行动和奖励来更新代理人的决策过程,可以开发一种算法来优化决策,例如贷款批准和利率确定。

强化学习过程可以进一步分为两种方法:蒙特卡罗和时间差分。这些方法的不同之处在于它们更新决策过程的方式。蒙特卡洛方法评估决策的期望值,并根据奖励和学习常数 (alpha) 更新决策值。另一方面,时间差异法计算当前和未来预期值之间的差异,相应地更新决策值。

阅读中讨论的示例展示了机器学习的实际应用。这些应用范围从交易和欺诈检测到信用评分、风险管理和投资组合优化。通过利用强化学习和蒙特卡罗或时间差异方法,代理人可以实时做出明智的决策,从而增强财务决策的各个方面。

总之,了解机器学习和数据处理的复杂性对于在各个领域有效利用这些技术至关重要。适当的数据细分、周到的分配和强化学习方法的应用可以显着改善决策过程,在复杂场景中实现明智和优化的结果。

总而言之,我们在构建机器学习模型时努力在偏差和方差之间取得适当的平衡。我们的目标是创建既能准确反映现实又不会过于复杂或过于简单的模型。通过理解和解决过度拟合和欠拟合的挑战,我们可以提高模型的性能和预测准确性。
Machine-learning Methods – Part B (FRM Part 1 2023 – Book 2 – Quantitative Analysis – Chapter 14)
Machine-learning Methods – Part B (FRM Part 1 2023 – Book 2 – Quantitative Analysis – Chapter 14)
  • 2023.02.04
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

机器学习和预测 – A 部分(FRM 第 1 部分 2023 – 第 2 册 – 第 15 章)


机器学习和预测 – A 部分(FRM 第 1 部分 2023 – 第 2 册 – 第 15 章)

你好,我是吉姆,我将带你浏览本书的第 1 部分,标题为“定量分析以及机器学习和预测的作用”。在本节中,我们将重点关注 A 部分的前三个学习目标。在我们深入细节之前,让我快速回顾一下之前的阅读,其中包括 A 部分和 B 部分。在那次阅读中,我们探讨了经典回归分析,并在需要替代模型(例如机器学习)时进行讨论。机器学习使我们能够处理大型数据集,而无需经典计量经济学模型的限制性假设。

我们还花了大量时间讨论过拟合和欠拟合的概念,以及与简化和复杂化相关的挑战。在本文中,我们将以这些讨论为基础,探索之前未涵盖的其他技术。本阅读的前三个学习目标是线性回归、逻辑回归和 Ridge and Lasso。

线性回归是一个熟悉的概念,我们在其中建立变量之间的关系。但是,当我们需要预测 0 到 100 之间的概率时,线性回归可能不适合。在这种情况下,逻辑回归就可以发挥作用。逻辑回归允许我们用二元结果对变量建模,例如客户是否会偿还贷款或违约。与线性回归不同,逻辑回归提供 0 到 1 有效范围内的概率,从而实现二元分类。

接下来,我们将讨论正则化技术,特别是 Ridge 和 Lasso。正则化通过缩小或降低模型的复杂性来帮助解决模型的复杂性。我们将探讨如何使用这些技术来减轻线性回归的局限性。

为了更好地理解这些概念,让我们重新审视线性回归。普通最小二乘回归假设自变量和因变量之间存在线性关系,从而最小化数据点与假设线之间的距离。然而,在机器学习中,我们将这些变量称为特征而不是因变量和自变量,因为它们数量庞大。

多元线性回归将这一概念扩展为包含多个自变量,从而生成具有截距 (alpha)、斜率 (beta) 和相应自变量(x1、x2 等)的模型。目标是最小化残差平方和 (RSS),表示实际值和预测值之间的差异。虽然我们力求准确预测,但在现实场景中几乎不可能达到 100% 的准确度。

这就是逻辑回归的用武之地。逻辑回归不是强制线性关系,而是将输出转换为 S 形曲线,确保概率落在 0 到 1 的范围内。通过使用自然对数 (e) 的底,我们可以计算未来价值,例如复利。逻辑回归采用最大似然估计来模拟变量之间的关系。通过对等式两边取对数,我们简化了估计过程,得到逻辑回归模型。

逻辑回归的优点之一是易于解释。它处理二元结果并提供概率,使其可用于各种应用,例如预测贷款违约或股票市场趋势。然而,逻辑回归也有局限性,包括过度拟合的可能性和多重共线性问题。此外,输出仅限于 0 到 1 之间的概率,从而消除了出现不合逻辑值(如 114%)的可能性。

为了演示逻辑回归,让我们考虑一个将信用评分和债务收入比作为贷款违约预测指标的示例。通过分析 500 个客户的数据,我们可以使用逻辑回归模型生成违约概率。

分类变量,例如一个人是否退休,不能直接分配数字标签。因此,我们采用编码技术(例如映射、创建虚拟变量或序数分类)来表示模型中的这些变量。

编码分类变量的一种常用方法称为映射。在这种方法中,我们将数字标签分配给变量的不同类别。例如,如果我们有一个名为“employment_status”的分类变量,类别为“employed”、“self-employed”和“unemployed”,我们可以分别分配数字标签,例如 1、2 和 3 来表示这些类别在逻辑回归模型中。

另一种方法是创建虚拟变量。虚拟变量是表示分类变量的不同类别的二元变量。每个类别都分配了一个单独的虚拟变量,如果观察值属于该类别,则值为 1,否则为 0。例如,如果我们有一个名为“education_level”的分类变量,类别为“高中”、“大学”和“研究生院”,我们将创建两个虚拟变量:“大学”和“研究生院”。如果观察对应于相应的类别,则这些虚拟变量的值为 1,否则为 0。

序数分类是另一种用于编码分类变量的技术。它涉及根据类别的顺序或排名将数字标签分配给类别。当类别具有固有顺序或层次结构时,此方法适用。例如,如果我们有一个名为“satisfaction_level”的变量,其类别为“低”、“中”和“高”,我们可以分配数字标签 1、2 和 3 来表示不断增加的满意度水平。

一旦我们对分类变量进行了编码,我们就可以将它们与数值变量一起包含在逻辑回归模型中。然后逻辑回归算法将估计每个变量的系数,表明它们对二元结果概率的影响。

除了逻辑回归,我们还将探索称为 Ridge 和 Lasso 的正则化技术。正则化用于解决模型中的过度拟合问题。当模型捕获训练数据中的噪声或随机波动时,就会发生过度拟合,从而导致看不见的数据表现不佳。

Ridge 和 Lasso 是两种流行的正则化技术,它们将惩罚项添加到回归模型中。这个惩罚项通过缩小或减少变量的系数来帮助控制模型的复杂性。 Ridge 回归添加了一个与系数平方和成比例的惩罚项,而 Lasso 回归添加了一个与系数绝对值之和成比例的惩罚项。

通过引入这些惩罚项,Ridge 和 Lasso 回归鼓励模型在很好地拟合训练数据和控制模型的复杂性之间找到平衡。这有助于防止过度拟合并提高模型对未见数据的泛化性能。

在本书的第 1 部分中,我们将介绍线性回归、逻辑回归以及 Ridge 和 Lasso 等正则化技术。我们将探讨如何将这些方法应用于不同类型的数据,以及它们如何提高预测准确性。所讨论的示例和概念将为理解定量分析和机器学习在预测中的作用奠定坚实的基础。

Machine Learning and Prediction – Part A (FRM Part 1 2023 – Book 2 – Chapter 15)
Machine Learning and Prediction – Part A (FRM Part 1 2023 – Book 2 – Chapter 15)
  • 2023.02.07
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

机器学习和预测 – B 部分(FRM 第 1 部分 2023 – 第 2 册 – 第 15 章)


机器学习和预测 – B 部分(FRM 第 1 部分 2023 – 第 2 册 – 第 15 章)

大家好,我是吉姆,我想讨论本书的第一部分,该部分侧重于定量分析,特别是机器学习和预测。在 B 部分,我们将深入研究决策树、集成学习和神经网络等新概念。让我们从重新审视决策树开始。

在上一节中,我们探索了用于计算债券价格的决策树,特别是对于具有嵌入式期权的债券。债券定价的决策树具有树状结构,分支和节点代表不同的决策和结果。对于带有嵌入式期权的债券,在每个节点都根据债券是否会以特定利率被赎回来做出决定。

在机器学习中,决策树遵循类似的结构,但方向不同。机器学习中的决策树不是像债券定价那样水平分支,而是从上到下垂直发展。在每个节点,提出一个问题,导致后续节点并最终达成决定或结果。

让我们以可赎回债券的决策树为例,我们称之为利率树。在这种情况下,决策很简单,因为我们只需要确定是否会以特定利率赎回债券。然而,在机器学习决策树中,决策是由分析各种因素并做出更复杂决定的算法决定的。

虽然债券定价模型通常不涉及机器学习,但如果我们要分析债券违约的可能性,我们将需要考虑其他特征,例如公司的经营现金流、债务权益比率、管理质量和产品线.这种复杂性凸显了传统债券定价中的决策树与机器学习中的决策树之间的差异。

在机器学习决策树中,我们的目标是分类或预测输入的类别。例如,我们可能想要确定一家公司是否会根据盈利能力和自由现金流支付股息。这些特征导致决策树的复杂性,因为需要更多的分支和节点来考虑多个因素。

当模型中包含其他特征时,决策树的复杂性会增加。随着树的每一次分裂,机器学习模型都可能出错,这给我们带来了信息增益的概念。信息增益衡量特征在预测目标变量中的有用性。它量化了决策树中每个特征所提供的不确定性的减少。

信息增益可以使用基尼系数或熵来计算。这两种措施产生相似的结果,因此使用其中一种并没有明显的优势。我鼓励您探索这两种方法,因为阅读材料涵盖了基尼系数,而熵是在这种情况下讨论的。

让我们考虑一个简单的例子来说明熵的计算。我们有一个包含信用卡持有人数据的表格,包括违约、高收入和延迟付款。我们想根据这些特征来确定一笔贷款是否会违约。目标是分类和预测。

通过应用熵公式,我们计算给定数据的熵。我们将每个结果的概率相加,并取这些概率的以 2 为底的对数。在此示例中,熵为 0.954,我们已将其提供给您。

接下来,让我们检查一下作为第一个拆分的高收入特征。我们观察到八分之四的信用卡持有人收入较高,而其余四人收入较低。在高收入者中,有两人违约,两人没有。对于非高收入组,1 个违约,3 个没有违约。

计算每个特征的熵,我们发现高收入特征的熵为0.811。为了确定信息增益,我们从初始熵 0.954 中减去该值。由此产生的信息增益为 0.143。

这表明高收入特征减少了 0.143 的不确定性或熵。

为了继续构建决策树,我们需要评估其他特征并计算它们的信息增益。我们对每个特征重复这个过程,根据不同的属性拆分数据并计算熵和信息增益。

假设我们接下来考虑延迟付款功能。在4名逾期还款的信用卡持卡人中,3人拖欠,1人未拖欠。对于那些没有延迟付款的人来说,没有违约。计算延迟付款特征的熵,我们发现它是 0.811。

延迟支付特征的信息增益是通过从初始熵 0.954 中减去其熵获得的。因此,逾期付款特征的信息增益为 0.143,与高收入特征的信息增益相同。

至此,我们已经评估了两个特征并确定了它们的信息增益。现在,我们需要比较这些特征的信息增益,以决定在我们的决策树中使用哪个作为第一个分裂。由于这两个特征具有相同的信息增益,我们可以选择其中一个作为起点。

一旦选择了第一个特征,决策树将进一步分支,我们对剩余的数据子集重复该过程,直到我们做出最终决定或结果。目标是创建一个决策树,使每一步的信息增益最大化,并提供最准确的预测或分类。

重要的是要注意,如果决策树变得过于复杂或者如果它们是在有限的数据上训练的,则决策树可能会过度拟合。当决策树太了解训练数据的噪声或特性而不能很好地泛化到新的、看不见的数据时,就会发生过度拟合。

为了减轻过度拟合,可以采用剪枝、正则化和交叉验证等技术。这些方法有助于简化决策树并防止它变得过于复杂,确保它可以对新数据做出准确的预测。

决策树只是本书第 1 部分中涵盖的机器学习的一个方面。它们为理解集成学习和神经网络等更高级的概念奠定了基础,我们将在第 2 部分中探讨这些概念。

当我读研究生时,我们的教授总是强调从错误中学习的重要性,他称之为“干扰项”。他强调了不要仅仅因为它们的预期值为零而忽略这些错误的价值。最初,我认为忽略它们并走捷径会更容易,但随着时间的推移,我意识到理解这些错误并从中吸取教训的重要性。

我们的教授经常将从运动中的错误中学习和从建模中的错误中学习相提并论。他解释了像年轻时的我这样的运动员会如何犯错误并从中吸取教训以提高他们在赛场上的表现。这个类比让我意识到,我们可以通过从干扰项中学习并改进我们的预测,将相同的概念应用于构建更好的模型。

正如我们的教授所解释的那样,提升有两种形式:自适应提升和梯度提升。在自适应增强中,我们确定导致最多问题的干扰项,并专注于从中学习。这种方法帮助我们将弱模型转变为强大模型,减少偏差并提高准确性。

另一方面,梯度提升设置了一个预定的阈值,旨在通过调整算法来超越它。例如,如果我们有一个预测股息支付的模型并希望达到 75% 的准确度,我们就会训练算法做出能够达到该准确度水平的决策。与自适应提升的泛化相比,梯度提升采用更具体的方法。

继续使用 K 最近邻 (KNN) 方法,它涉及测量观察到的变量之间的距离以确定它们的相似性。与专注于寻找组的聚类不同,KNN 寻找邻居并分析它们的特征。通过测量新数据点与其邻居之间的距离,KNN 根据其邻居的多数投票或加权平均值预测该点的类别或值。

KNN 是一种简单但功能强大的算法,可应用于分类和回归任务。它不需要对底层数据分布的假设,使其成为一种非参数方法。但是,它确实有其局限性。邻居数量 (K) 的选择至关重要,因为选择较小的 K 可能会导致过度拟合,而选择较大的 K 可能会导致过度简化。此外,对于大型数据集,KNN 的计算成本可能很高,因为它需要计算每个数据点的距离。

神经网络的概念很吸引人,近年来受到了极大的关注。神经网络的灵感来自人脑的结构和功能,由相互连接的节点或称为感知器的人工神经元组成。这些感知器处理和传输信息,使神经网络能够学习复杂的模式并做出预测。

本书讨论了前馈神经网络架构,它由一个输入层、一个或多个隐藏层和一个输出层组成。每层由连接到相邻层的多个感知器组成。输入层接收初始数据,然后通过网络传递,在产生输出之前在每个隐藏层中进行转换和计算。

训练神经网络涉及调整感知器的权重和偏差以最小化误差或损失函数。这个过程通常使用反向传播来完成,它计算关于网络参数的误差梯度并相应地更新它们。

神经网络在图像和语音识别、自然语言处理和推荐系统等各种应用中取得了显着的成功。但是,它们可能是计算密集型的,需要大量数据进行训练。过度拟合也可能是神经网络的一个问题,正则化技术(例如 dropout 和权重衰减)用于解决此问题。

本书第 1 部分中涵盖的主题的概述到此结束。我们讨论了决策树、信息增益、过度拟合、提升、KNN 和神经网络。这些概念为理解机器学习和预测提供了坚实的基础。

让我们深入研究本书的下一部分,即第 2 部分,我们将在其中探索更高级的概念,例如集成学习和神经网络。

集成学习是一种强大的技术,它结合了多个单独的模型来进行预测或分类。集成学习背后的想法是,通过聚合多个模型的预测,我们可以获得比单个模型单独实现的更好的性能和更高的准确性。

一种流行的集成学习方法称为随机森林。它结合了多个决策树的预测来做出最终预测。每个决策树都在数据的随机子集上进行训练,在预测阶段,通过对所有个体树的预测进行平均或投票获得最终预测。

随机森林有几个优点。它们对过度拟合具有很强的鲁棒性,并且往往具有良好的泛化能力。它们可以有效地处理大型数据集和高维特征空间。此外,随机森林可以提供有关特征重要性的信息,使我们能够深入了解底层数据。

另一种集成学习方法是梯度提升,我们在前面简要提到过。梯度提升通过迭代地将弱模型添加到集成中来构建强大的模型,每个弱模型都会纠正先前模型所犯的错误。这个迭代过程减少了整体误差并提高了集成的预测能力。

梯度提升算法,如 XGBoost 和 LightGBM,因其在各种机器学习竞赛和实际应用中的有效性而受到欢迎。他们擅长处理结构化数据,并且能够捕捉复杂的模式和特征之间的交互。

转到神经网络,我们之前谈到了它们的架构和训练过程。神经网络在涉及模式识别的任务(例如图像和语音识别)中表现出卓越的性能。它们还可以应用于时间序列分析、自然语言处理和许多其他领域。

深度学习是神经网络的一个子集,侧重于训练具有多个隐藏层的神经网络。深度神经网络能够学习数据的分层表示,其中每一层都学习越来越抽象的特征。这种从原始数据中自动提取复杂特征的能力为深度学习在各个领域的成功做出了贡献。

卷积神经网络 (CNN) 在图像识别任务中特别有效,因为它们利用图像中像素之间的空间关系。循环神经网络 (RNN) 通常用于顺序数据分析,例如自然语言处理和语音识别,因为它们可以捕获时间依赖性。

值得注意的是,神经网络的成功在很大程度上依赖于用于训练的大型标记数据集的可用性。此外,深度神经网络通常需要大量的计算资源和更长的训练时间。然而,硬件的进步,例如图形处理单元 (GPU) 和专用硬件加速器,使训练深度神经网络变得更容易。

随着我们深入本书的第 2 部分,我们将更深入地研究这些高级主题,探索集成学习的复杂性、各种神经网络架构、优化技术,以及将这些技术应用于现实世界问题的实际考虑。
Machine Learning and Prediction – Part B (FRM Part 1 2023 – Book 2 – Chapter 15)
Machine Learning and Prediction – Part B (FRM Part 1 2023 – Book 2 – Chapter 15)
  • 2023.02.08
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

因子理论(FRM 第 2 部分 2023 – 第 5 册 – 第 1 章)



因子理论(FRM 第 2 部分 2023 – 第 5 册 – 第 1 章)

本文摘自《风险管理与投资管理》第五册第二部分,特别关注因子理论章节。

文本首先解释了因子理论旨在确定影响投资组合和个股表现的共同因素。这些因素可能包括利率、市场走势、通货膨胀、GDP 变化等。通过了解这些因素如何影响不同的股票,投资者可以就他们的投资组合做出明智的决定。

本章强调因子理论关注的是因子本身,而不是单个资产。与苹果或美国银行等特定公司相比,利率、通货膨胀和经济增长等因素对股价的影响更为显着。投资者需要超越单个资产,确定推动回报的潜在风险因素。

因素被视为回报的最终决定因素,而资产代表一揽子因素。本章强调了考虑相关性、联结函数和最佳风险敞口的重要性,因为不同的投资者可能有不同的偏好和风险状况。

然后文本继续讨论单因素模型,指的是资本资产定价模型 (CAPM)。 CAPM 描述了系统风险(由于经济因素导致的股票收益的可变性)和预期收益之间的均衡关系。该模型假设唯一相关的因素是市场组合,并且风险溢价由贝塔值决定,贝塔值是衡量股票对市场变动的敏感度的指标。

本章解释说,理性投资者会分散其投资组合以降低风险。然而,可分散的风险不应与溢价相关联,因为它们可以很容易地分散掉。重点应该放在系统性风险上,这是风险溢价所在。

文中介绍了 CAPM 的两个版本。第一个版本考虑了无风险利率和市场投资组合的预期回报,而第二个版本引入了 beta 作为衡量系统风险的指标。 Beta 是个股与市场组合之间的协方差除以市场组合的方差。它代表了股票对经济因素变化的敏感性。

文中强调 beta 捕捉系统性风险并决定个股的预期回报。较高的 beta 表示较高的系统风险和潜在的较高回报,而较低的 beta 表示较低的风险和较低的潜在回报。然而,贝塔和回报之间的关系不是线性的。

本章最后强调了 CAPM 的一些教训。市场组合是唯一存在的因子,每个投资者都持有其最优因子风险敞口。规避风险的投资者可能更喜欢政府证券,而风险承受能力强的投资者将更多的财富分配给风险资产。资本资产配置线允许投资者沿着有效边界移动,有效边界代表给定预期回报水平具有最小标准差的投资组合。

税收对回报几乎没有影响的观点是一个需要考虑的重要因素。虽然人们普遍认为市场是无摩擦的,但这种假设并不完全正确。金融学科起源于 1958 年,主要由 Madiganian Miller 等经济学家领导。然而,在 1950 年代和 60 年代,没有博士学位。专门针对金融的计划。因此,现代金融的先驱们依赖于市场是完美的并且投资者无法控制价格的假设。然而,正如经济学家米尔顿·弗里德曼 (Milton Friedman) 指出的那样,我们现在了解到,机构投资者有时会导致价格大幅波动,而且并非所有人都能免费获得信息。

尽管我更愿意将它们称为局限性,但资本资产定价模型 (CAPM) 存在失败。该模型面临着捕获影响市场组合和 beta 的所有风险因素的巨大压力。这就是多因素模型受到欢迎的原因,因为它们考虑了影响个股回报的多种风险因素。

在深入研究多因素模型的机制之前,让我们简要比较一下这两种方法。这两种模式都给我们上了重要的一课。教训一:多元化是有效的,尽管它在每个模型中的作用可能不同。经验二:每个投资者都在有效前沿或资本市场线上找到他们的首选位置,尽管是通过不同的方法。第三课:普通投资者持有市场投资组合,但 CAPM 允许使用国债或衍生品线性变动,而多因子模型允许基于因子敞口的线性和非线性变动。教训四:市场因素在 CAPM 下处于均衡定价,而多因素模型在无套利条件下通过风险溢价确定均衡。第五课:两种模型都涉及 CAPM 中的 beta 和多因素模型中的因素暴露。最后,CAPM 中的糟糕时期被明确定义为低市场回报,而多因素模型旨在识别这些时期的有吸引力的资产。

现在让我们探讨随机贴现因子及其与 CAPM 和多因子模型的关系。为了说明这个概念,让我们使用天气类比。想象一下,我和我的堂兄相隔 20 分钟,我们经常讨论天气。当阴天时,我们中的一个人可能会说:“下毛毛雨了”,而另一个人可能会惊呼:“下大雨了!”在这个类比中,阴天代表 CAPM 中的市场组合,而雨云象征着影响我们管理庭院能力的其他因素。同样,随机贴现因子代表对不同风险因素或经济状况的敞口,类似于影响不同地区的特定雨云。

资产的定价取决于随机贴现因子 (m) 乘以收益的预期。例如,如果我承诺在一年内付给你 100 美元,那么你今天支付的价格取决于我打算用这笔钱做什么。如果我投资无风险国债,假设没有交易成本,你今天可能会付给我 97 美元。但是,如果我投资于高风险股票证券,考虑到相关风险,你可能会付给我较低的金额,例如 60 美元或 40 美元。或者,如果我要在拉斯维加斯赌博,您支付的金额可能会有很大差异,具体取决于输赢的几率。因此,随机贴现因子取决于各种因素。

此外,以随机贴现因子为代表的定价核不是恒定的,而是动态的。它们会随着时间而变化,尤其是在处理或有债权和带有嵌入式期权的证券时。这种动态特性允许对有意外事件的证券进行准确定价。

总而言之,Eugene Fama 的有效市场假说指出,金融证券的价格,如 Apple 或 Johnson & Johnson,完全反映了市场上所有可用的信息。这意味着不可能通过积极交易或选择个别证券来持续跑赢市场。

然而,有效市场的概念随着时间的推移而演变,现在人们普遍认识到市场并不总是完全有效的。行为金融学研究表明,投资者并不总是理性的,并且可能会受到心理偏见的影响,从而导致市场效率低下,并为熟练的投资者创造超额回报的机会。

此外,多因素模型的发展提供了对资产定价更细致的理解。这些模型超越了单因素 CAPM,并考虑了可以解释资产回报变化的多种风险因素。公司规模、价值、势头和盈利能力等因素已被确定为回报的重要驱动因素。

通过将这些因素纳入定价模型,投资者可以更全面地了解资产估值并做出更明智的投资决策。例如,对价值因子敞口高的股票可能被认为被低估并提供有吸引力的投资机会。

值得注意的是,虽然多因素模型越来越受欢迎,但它们并非没有挑战。确定要包括哪些因素以及如何权衡这些因素需要仔细分析和考虑。此外,多因素模型的表现会随着时间的推移而变化,历史上成功的因素可能不会在未来继续提供超额回报。

总的来说,关于因素理论的这一章提供了关于识别和理解影响资产价格和投资组合绩效的共同因素的重要性的见解。它强调了系统风险和贝塔系数在确定预期收益方面的重要性,并为基于因子分析的有效投资管理奠定了基础。

总之,虽然有效市场假说为理解市场效率奠定了基础,但现实是市场并不总是完全有效的。多因素模型的出现和行为金融学的见解为资产定价提供了更细致的视角。投资者可以利用这些模型和因素来增强他们对市场动态的理解,并可能发现获得丰厚回报的机会。然而,重要的是要认识到与这些模型相关的局限性和挑战,并在应用时谨慎行事。

Factor Theory (FRM Part 2 2023 – Book 5 – Chapter 1)
Factor Theory (FRM Part 2 2023 – Book 5 – Chapter 1)
  • 2020.12.02
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...
 

因素(FRM Part 2 2023 – Book 5 – Chapter 2)



因素(FRM Part 2 2023 – Book 5 – Chapter 2)

在风险管理和投资管理的第 5 册第 2 部分中,有一章是关于因素的。这本书讨论了投资管理以及它如何与使用因素的投资组合选择相关联。为了说明这个概念,让我们考虑一个例子,在这个例子中,您正在构建您的另类投资组合,特别是专注于为您的酒窖投资葡萄酒。

为了确定最好的葡萄酒瓶以包含在您的投资组合中,您决定聘请三名品酒师,包括您自己。作为一个在晚餐时享用一杯的休闲葡萄酒消费者,您的葡萄酒推荐代表了一个观点。另一位品酒师,被称为你的大学朋友,以不加思索地快速饮酒而闻名。最后,第三位品酒师是一位葡萄酒鉴赏家,他会仔细分析香气、味道和其他因素。

在构建您的投资组合时,您可以选择包括三个人品尝过的所有葡萄酒,从而形成市场投资组合。但是,如果你能对葡萄酒鉴赏家的推荐给予更多的权重,那将是更有利的,因为他们具有品酒方面的专业因素。例如,您可以为您的推荐分配大约 5% 的权重,为葡萄酒鉴赏家的推荐分配 94.9% 的权重。相比之下,你大学朋友的建议可能没有那么重要,甚至完全被忽视。

通过确定相关因素,例如鉴赏家的专业知识,并相应地对贡献进行加权,您可以构建一个优于市场投资组合的投资组合。这个过程与投资管理的目标一致,其中涉及识别有助于卓越投资组合绩效的因素。

现在,让我们将此示例与书中概述的学习目标联系起来。学习目标包括了解价值投资的过程、宏观经济风险因素对资产绩效和投资组合的影响、降低波动风险以及探索 Fama-French 模型、价值和动量等模型。

价值投资涉及通过进行基本面分析并将其与市场价值进行比较来评估股票的内在价值。价格远低于其内在价值的股票被认为被低估了,而价格较高的股票则可能被高估了。内在价值代表股票的真实价值,它可能不同于受市场奇思妙想和愚蠢行为影响的市场价值。

要确定内在价值,您可以分析各种因素,例如资产负债表、现金流量表、执行技能、未来股息、自由现金流量或经营现金流量。通过比较内在价值与市场价值,您可以识别被低估的股票并做出明智的投资决策。然而,必须注意的是,假设投资者理性且市场有效,市场最终可能会调整价格以符合内在价值。实际上,人类情绪和市场效率低下会影响股票价格。

在宏观经济风险因素的背景下,经济增长起着至关重要的作用。在经济低增长或负增长期间,股票等风险资产通常表现不佳,而政府债券等较安全的资产往往表现出色。不能在经济低迷时期承受重大损失的规避风险投资者可能更喜欢投资债券。通常鼓励具有较长时间跨度的年轻投资者投资股票,因为他们可以承受短期损失并从长期收益中受益。

经验证据表明,随着时间的推移,价值股的表现往往优于成长股。研究人员认为存在价值溢价,表明对寻找被低估股票的投资者的奖励。通货膨胀、利率、GDP 变化和波动性等经济因素与风险溢价相关。通过考虑这些因素,投资者可以相应地调整他们的投资组合。

教科书还提供了展示美国经济衰退期间各种资产类别表现的表格。它强调某些类别,如黄金和大宗商品,在这些时期往往具有正平均回报率。

企业和个人受到影响其生产力、财务业绩和投资决策的各种因素的影响。一个产生重大影响的重大事件是 2020 年初 COVID-19 的爆发。随着经济停摆以控制病毒的传播,企业在创收方面面临挑战,个人面临财务不确定性。

大流行的影响在股票价格上很明显,股票价格在 2020 年 2 月和 2020 年 3 月经历了大幅下跌。股票价格的大幅下跌是经济停摆和病毒不确定性的直接后果。股价下跌凸显了企业和个人对外部冲击的脆弱性。

然而,在充满挑战的时期,也有提高生产力的时期。 2020 年夏末秋初,美国和世界其他地区的生产力显着提高。这些改进是适应疫情带来的新形势,创新经营方式的结果。尽管最初对生产力的影响是负面的,但企业和个人的弹性和适应性导致了随后的改善。

大流行的另一个意外结果是美国 2020 年的预期出生率下降。与最初认为人们呆在家里会导致分娩增加的假设相反,出生率实际上下降了。随着很大一部分人口接近退休年龄,这种人口结构变化带来了宏观经济风险。退休工人不仅会降低整体生产力,还会需要不同类型的投资和投资组合,从而影响金融格局。

政治风险是另一个随时间变化的因素。自 1990 年以来,法规和政府对商业和社会各个方面的干预有所增加。随着企业和个人应对不断变化的监管环境,政治风险的上升导致了更高的风险溢价。政治决策和政策对金融市场和投资决策的影响不容忽视。

解决波动性风险是投资者和企业关注的主要问题。一种方法是避免投资风险证券,例如股票、衍生品或固定收益证券,如果波动性无法容忍的话。或者,投资者可以增加对债券的投资比例,因为债券的波动性往往较小。然而,在经济紧缩期间,仅仅依靠债券可能不是最佳解决方案。

为了在保持对风险资产投资的同时减轻波动风险,投资者可以考虑购买保护性期权,例如看跌期权,作为潜在损失的保险。然而,此类策略的有效性和成本效益需要仔细分析。在边际成本和边际收益之间找到适当的平衡对于优化风险管理方法至关重要。

在投资组合管理的背景下,规模和价值等因素起着重要作用。 Eugene Fama 和 Kenneth French 开发了 Fama-French 模型,该模型通过纳入其他因素扩展了资本资产定价模型 (CAPM)。该模型包括市场因素、规模因素(SMB)和价值因素(HML),以更好地捕捉股票的风险和回报特征。已发现这些因素可以解释很大一部分股票回报,强调了在投资组合构建中考虑多种因素的重要性。

价值投资涉及在价格相对于账面价值较低的股票上做多,在价格较高的股票上做空。该策略基于这样一个基本原理,即经历过表现不佳时期的价值股可能会提供更高的回报作为补偿。有理性和行为理论来解释价值溢价。理性理论关注影响价值股的风险因素,而行为理论则将过度推断和损失厌恶等投资者偏见视为价值溢价的驱动因素。

另一方面,动量投资依赖于近期价格上涨的股票将继续表现良好的信念。投资者可能对赢家过于自信而对输家失去信心,从而产生动量效应。动量投资策略涉及买入表现出积极价格动能的股票,卖出表现出消极动能的股票。

实施动量策略有不同的方法。一种常见的方法是计算特定时期内个股的回报率,例如过去六到十二个月,并根据它们的相对表现对它们进行排名。然后选择具有最高正动量的排名靠前的股票进行投资,而回避或卖空具有负动量的排名靠后的股票。

动量投资可以用理性和行为因素来解释。在理性方面,动量效应可能归因于市场效率低下或对新信息反应不足。投资者可能需要时间将新信息完全纳入股价,随着更多投资者了解新闻,导致价格持续上涨。

行为解释表明,投资者的偏见,如羊群行为和处置效应,会导致动量效应。当投资者随波逐流并购买表现良好的股票时,就会出现羊群行为,从而导致价格进一步上涨。处置效应是指投资者倾向于持有亏损股票并过快卖出盈利股票,这可以创造价格动能。

价值和动量投资策略都显示出可以带来长期超额回报。然而,这些策略也有表现不佳的时期,它们的成功可能因市场状况和特定时间推动股票回报的具体因素而异。

在构建投资组合时,重要的是要考虑采用包含多种因素的多元化方法,包括规模、价值和动量。通过分散不同的因素,投资者可以潜在地减少单个因素波动的影响,并改善其投资组合的风险回报状况。

此外,定期审查和重新平衡投资组合以确保其符合投资者的目标、风险承受能力和不断变化的市场条件至关重要。再平衡涉及通过买入或卖出资产来调整投资组合的资产配置,使其回到所需的目标权重。这有助于维持预期的风险敞口,并防止投资组合过度集中于某些股票或行业。

总之,管理波动风险并考虑规模、价值和动量等因素是投资组合管理的重要方面。投资者在实施这些策略时应评估其风险承受能力、投资目标和时间范围。此外,随时了解市场趋势、经济指标和地缘政治发展有助于做出明智的投资决策并驾驭不断变化的金融格局。

Factors (FRM Part 2 2023 – Book 5 – Chapter 2)
Factors (FRM Part 2 2023 – Book 5 – Chapter 2)
  • 2020.12.04
  • www.youtube.com
For FRM (Part I & Part II) video lessons, study notes, question banks, mock exams, and formula sheets covering all chapters of the FRM syllabus, click on the...