ION:必考知识点,CFA一级数量分析-常见概率分布-下

“人的一切痛苦,本质上都是对自己无能的愤怒。”

文:蓝兔子读难NOTES

图:配图来源于网络

编码:0008

因为篇幅的限制,我们上一篇文章只说了一半,在这一篇文章中,我们会继续进行常见的概率分布内容的分享。可以说,在常见概率分布这一大章内容里面,最重要的内容就在接下来要说的里面,一个是正态分布(normaldistribution),另一个是t分布(student‘st-distribution),其也是掌握后面章节内容的关键知识点。

连续概率分布与正态分布

具体连续概率分布的定义我们在上一篇文章中已经进行过解释,这里就不再赘述。我们直接来看一个连续均匀分布(continuousuniformdistribution)的PDF图形:

腾讯幻核app内上线“敦煌文创-千年盛彩数字壁画”预约页面:1月7日,腾讯幻核app内上线“敦煌文创-千年盛彩数字壁画”预约页面,据了解,本期数字藏品是腾讯幻核与腾讯区块链合作的首个数字藏品项目。幻核方面表示:幻核将自身数字藏品开发与数字藏品展馆能力充分开放,与越来越多的合作伙伴携手共同探索数字经济生态。支持多链引擎架构,实现通过组装线满足不同IP场景的链上交易需求。据了解,腾讯区块链品牌隶属于腾讯金融科技(FiT)旗下,自2015年起,腾讯区块链团队从零开始构建国产自研、自主可控的区块链服务基础设施。腾讯区块链在技术探索和应用落地层面都取得了诸多成果,技术专利数量在国内处于领先地位,在智慧税务、供应链金融、游戏、医疗、公益、碳中和等多个场景实现应用落地。[2022/1/7 8:32:10]

因为每一个可能的结果发生的概率是相等的,所以其PDF曲线为一条水平线。这里需要强调说明一下,由于连续随机变量可以有无数多个可能,因此针对某一确定的结果,我们近似的认为其发生的概率为0,因此在分析连续随机变量相关问题时,我们应该取区间分析,而不能对点进行分析。

又因为任何一个随机事件,其所有可能的结果的概率和为1,所以上图中,该条直线的y轴坐标为1/(b-a)。当我们对区间(a,b)中任何一段子区间进行分析时,可以利用简单的几何原理算出相应的面积(概率)。

接下来,就是重中之重的正态分布,正态分布几乎存在于我们生活的方方面面,无论是班上同学的考试成绩,还是班上同学的身高体重,基本上都逃离不了正态分布的“上帝诅咒”,而且同一个目标对象的数量(样本量)越是多,越是重复的厉害,那么就越正态。看看下面这两幅图,看看你是否能找到小正态的影子。

数据:11月调整后的稳定币链上交易量增加58.3%:12月1日消息,据The Block数据员Lars,11月调整后的链上比特币和以太坊总交易量增加了9.9%至2600亿美元;调整后的稳定币链上交易量增加了58.3%,达到9186亿美元的历史新高;比特币矿工收入下降19.9%至4.826亿美元,以太坊质押者收入下降2.6%至8880万美元;以太坊NFT市场交易量进一步下降0.9%至3.814亿美元。[2022/12/2 21:16:48]

请别告诉我这是人为的,即便是人为的,为何偏偏就是这个样子。那到底是哪个样子呢,请看下图:

正态分布虽然如上帝的“祝福”般占据了我们生活的方方面面,但是我们只需要把它当作一个工具即可,一把扳手,我们不需要知道它是怎么生产出来的,我们只需要了解他的一些性质即可:

数据:34,000枚ETH从未知钱包转移到FTX:金色财经报道,Whale Alert数据显示,34,000枚ETH(约54,117,103美元)从未知钱包转移到FTX。[2022/9/15 6:58:41]

其PDF完全由均值和方差刻画,通常记为N(均值,方差);其图形对称,偏度为0,越中间概率越大,越两端概率越小;如之前内容所讲,正态分布的峰度为3,超额峰度为0;服从正态分布的随机变量线性组合后还符合正态分布;标准正态分布概率区间几个特殊值经常用要记住,如下图(90%对应1.65个标准差,虽然图中没标,但也很重要)。

接下来的内容是标准化的正态分布。如前文所言,正态分布表示为N(均值,方差),尽管正态分布存在于我们生活的方方面面,但是这方方面面的正态分布却也各不相同,且由于正态分布的PDF比较复杂,我们很难通过表达式去计算出其某区间的概率,更不可能给每一个参数不同的正态分布都列一个表格去查。

好在前辈们也纠结过这个问题,并且找到了解决方案:他们把标准正态分布的结果列成一张表,并提供一种把非标准正态分布转换为标准正态分布的办法,再拿这个分布去查表。

标准正态分布表示为N(0,1),其中0为均值,1为方差,任何非标准正态分布都可以进行转换,转换后即可查标准正态分布的表得到相应的值。为了便于理解,举个例子:

杭州银行:将与腾讯等互联网企业将在区块链等多个层面展开合作:杭州银行(600926)今日在投资者互动平台表示,公司与腾讯等互联网企业将在直销银行、移动银行、区块链、智能客服、人工智能等多个层面展开合作,共同研究构建智慧银行大脑,并在机器人智能客服等领域开展应用研究等。[2018/3/20]

已知某公司股票的某参数符合正态分布,其均值为10,方差为9,即服从N(10,9),问随机抽取该股票参数中的某个值,该值小于5的概率,即F(5)。

虽然其服从正态分布,但不是标准正态分布,所以没法直接查表,需要先进行转换,转换的方法就是:

(X-μ)/σ====即=====>>(5-10)/3

即查标准正态分布的F((5-10)/3)即可。

查表要注意,1、查表会不会,不会的同学看看书,这里就不解释了;2、查得的是累积概率,可能需要再次进行换算。

标准正态分布也被称为z分布或者u分布。

亏空风险(shortfallrisk):指资产的收益低于最低可接受水平的概率,亏空风险是一个概率。这个最低可接受水平(shortfalllevel)用Rl表示。

罗伊的第一安全比例(Roy'ssafety-firstratio|SFration):

SFRatio=/标准差

从其公式上来看,第一安全比例代表的是每份超额风险所获得的收益,这里的超额指的是投资收益相对于最低要求收益的超额。注意与夏普比率区分,夏普比率的超额是指投资收益相对于无风险收益超额。

同夏普比率一样,每单位风险获得的收益肯定是越多越好,所以怎么根据SFratio选择组合你懂的。

对数正态分布与t分布

接下来是另一个非常重要的分布,学生t分布(studentt-distribution),不要觉得名字奇怪,之所以叫这个名字,只是因为发表的人给自己取了个这么样的笔名而已。就像正态分布也叫高斯分布一样,只是名字而已。

不过说到正态分布和t分布,他们不仅仅是名字都是发表者用的名字而已,他们还有很多的相似之处。怎么个相似法呢,先看图:

我们之前说过,正态分布的样本数量越多,就越正态分布。以考试成绩为例,一个班50个同学的数据肯定没有全校同学的数据那么“正态”。但是如果反过来,班上只有40个同学,或者只有10个同学,他们的成绩还符合正态分布吗?不难想象,当我们数据量越小时,越容易受到极端值的影响,当数据量太少时,就会和正态分布出现偏差。

我们有一位伟大的同学,叫做“Student”,同我们一样,他也发现了这个现象,但是和我们不一样的是,人家找到了小样本的解决方案,后来被命名成t分布。t分布具有如下性质:

图形如上图所示,当自由度增大时,图形逐步接近于正态分布;图形完全由自由度(degreesoffreedom|df)刻画;相比于正态分布,t分布图形有低峰肥尾巴特质,因此峰度>3;这里说明一下,峰态虽然叫做“峰”态,但他看的不是峰有多高,而是尾巴有多肥。

下面是对数正态分布(lognormaldistribution),虽然正态分布占据了我们生活的方方面面,但是他却有一个问题:他的取值范围在正负无穷的范围内,而我们的资产,或者说股票的价格,不可能为负,所以导致其不能用于衡量资产的价格。因此,我们引入了对数正态分布(具体的过程比较有意思,但是这里不说),如下图:

其有如下特点:

非负性,符合资产股票的价格定义域,偏度为正,所以一般用正态分布来衡量资产的风险,而用对数正态分布来衡量资产的价格。

最后还有一个知识点,叫做多元分布(multivariatedistribution),这里大家不用详细了解,只知道多元分布就像多元方程一样,里面有多个元素。考试一般问你需要几个参数才能刻画出这个多元分布,只要记住以下内容就OK:

每一个元需要两个参数来刻画:一个均值,一个方差;每两个元之间需要一个相关系数来刻画,nC2;所以,假设有n元,需要的参数就是2*n+nC2,掏出你的计算器吧!

模拟

模拟就是通过事前对事情进行彩排,来预测和发现事情的发展方向,比如去面试前,你会进行一个模拟面试,考虑会有哪些问题,如何应对。

模拟有两种,以面试为例,很多人都有面试过,自己可能也面试过多次,面试的常见套路,问题基本上就那些,你模拟的时候,你就能知道大概会问哪些问题,虽然每次面试不一样,但是大差不差,你可以假设一种情景来分析,如果问这个问题怎么样,如果问那个问题怎么样。这就是蒙特卡罗模拟(MonteCarlosimulation),我们也称之为情景模拟,对解决如果咋的咋的(whatif)问题很有效。实际上,你就需要先假设这么一个如果(通常假设其符合某一分布),但是其缺陷是,你一旦假设都错了,那你就全盘皆输。而且这种计算费电脑。

还有一个叫做历史模拟(historicalsimulation),就是根据历史数据来模拟,比如搜集某个地方某一天过去100年的天气情况来预测以后的天气情况,由于其依赖历史数据,所以不能进行情景分析,如果(whatif)气象局搞了场人工降雨呢?而且时代在进步,万事万物都是在变,没有什么是一成不变的,所以历史模拟也存在问题。还有就是,你选的这段历史数据万一碰巧选到特殊的一段了,比如模拟经济发展,你刚好选到二战那一段呢?所以,我们通常进行样本外测试(outofsampletest),把数据拿到样本外的历史数据去试试,排除数据选择问题(是那一段时间独有的)。

兔纸的相关文章

CFA一级数量分析-货币的时间价值

CFA一级数量分析-数理统计基础与收益

CFA一级数量分析-概率论基础

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

[0:0ms0-3:348ms