指数分布的方差是什么(指数分布的协方差)
离均差、方差、均方差、协方差这几个数学名词都听上去都差不多,可是在日常工作生活中能用得上这些概念的人应该不多,今天就来说说其中的差别。
要想搞清楚什么是离均差、方差、均方差和协方差,得先从均值这个概念开始。哪怕是数学再不好的人,也应该知道算术平均数是怎么回事吧。
以标准普尔500指数为例,在2018年9月10日至9月21日期间共有10个交易日,自然也就有10个标准普尔500指数的收盘价。将这10个交易日的标准普尔500指数收盘价相加后除以交易天数10,就会得出这10个交易日标准普尔500指数收盘价的均值2,902.46。
日期
标准普尔500指数X
均值
2018-9-10
2,877.13
2,902.46
2018-9-11
2,887.89
2018-9-12
2,888.92
2018-9-13
2,904.18
2018-9-14
2,904.98
2018-9-17
2,888.80
2018-9-18
2,904.31
2018-9-19
2,907.95
2018-9-20
2,930.75
2018-9-21
2,929.67
合计
29,024.58
有了均值,下面就可以计算离均差,离均差就是一组数据中各个数值与该组数据均值的差异。用上述10个交易日的收盘价分别减去均值2,902.46,可以得出每一个收盘价的离均差。
日期
标准普尔500指数X
均值M
离均差=X-M
2018-9-10
2,877.13
2,902.46
(25.33)
2018-9-11
2,887.89
(14.57)
2018-9-12
2,888.92
(13.54)
2018-9-13
2,904.18
1.72
2018-9-14
2,904.98
2.52
2018-9-17
2,888.80
(13.66)
2018-9-18
2,904.31
1.85
2018-9-19
2,907.95
5.49
2018-9-20
2,930.75
28.29
2018-9-21
2,929.67
27.21
离均差是计算方差的基础,将离均差乘方,相加求和后再除以10求平均值,得出来的结果就是这组数据的方差,方差衡量的也是一组数据中各个数值与该组数据均值的离散程度。在下表中,方差等于280.7405。方差的计算公式为
,其中x为样本平均值,n为样本的大小。
日期
标准普尔500指数X
均值M
离均差
(离均差)^2=σ2
2018-9-10
2,877.13
2,902.46
(25.33)
641.51
2018-9-11
2,887.89
(14.57)
212.23
2018-9-12
2,888.92
(13.54)
183.28
2018-9-13
2,904.18
1.72
2.97
2018-9-14
2,904.98
2.52
6.36
2018-9-17
2,888.80
(13.66)
186.54
2018-9-18
2,904.31
1.85
3.43
2018-9-19
2,907.95
5.49
30.16
2018-9-20
2,930.75
28.29
800.44
2018-9-21
2,929.67
27.21
740.49
合计
29,024.58
2,807.4055
280.7405
有了方差,标准差就迎刃而解了,因为标准差=方差的平方根,用σ表示。因此,前面这组数据的标准差=(280.7405)^(1/2)=16.7553。
且慢…以上的计算过程是基于该组数据是样本数据的总体这一前提假设,也就是说在标准普尔500指数的历史上只有2018年9月10日至9月21日这10个交易日的收盘价。当然这是不可能,因为这些数据只是抽样数据,是为了举例说明而给定的样本数据而不是数据的全部,因此需要对以上计算过程略作调整。上表中的和2,807.4055应除以(10-1)而不是10,方差的结果变成311.9339,同样标准差也就变成=(311.9339)^(1/2)=17.6617:
标准差又名均方差,是离均差平方的算术平均数的平方根,可用来衡量一组数据中各个数值与该组数据均值的离散程度。标准差的计算公式为
,其中x为样本平均值,n为样本的大小。标准差越大,说明该组数据中大部分数据与均值的差异较大。均值相等的两组数据,标准差却未必相同。比如,有A、B两组数据,如下表所示,这两组数据的均值都等于5。
A
B
3
4.8
5
5.2
4
4.3
6
5.7
7
5
但各数据偏离均值的程度是有差异的…,可以看到均值相等的两组数据中,A组中各个数据之间的差异程度要高于B组。
小结一下:方差是标准差的平方,是离均差平方的和的均值。
通过以上的演示计算,可以看到离均差、方差、标准差衡量的都是某一组数据内部各数值偏离均值的程度,通俗地讲是自己跟自己比。但下面介绍的协方差比较的是两组数据之间的差异程度。协方差的计算公式为
其中
是两个数据系列的样本平均值,x、y为数据系列中的单个数据,n为样本的大小。
如果用于比较的两组数据完全相同,那么其方差和协方差的计算结果是一致的,因此方差只是协方差的一个特例。
有了方差和协方差,下一步就可以计算相关系数了,公式为
其中是两个数据系列的样本平均值,x、y为数据系列中的单个数据,n为样本的大小。
需要注意,如果用协方差计算相关系数,协方差中的x、y假设为全体数据,因此协方差公式中的标准差计算时,需要除以n而不是n-1。
以西德克萨斯轻质原油和标准普尔500指数为例,计算其收益率之间的相关系数,收盘价取值日期为2018年9月10日至9月21日。
分布推导的结果与EXCEL自带函数计算结果相符。
长春怎么样(怎么形容长春城市)第一眼误以为来到国外,然而这里在东北!列车在赶来,我们相遇在站台不知道有没有和小编一样的,对有轨电车有种莫名的情愫,一看到他们就觉得很文艺很美好。于是当小编刷到这样的画面时,就瞬间
长春市是哪个省(长春市历史简介)长春是吉林省省会副省级城市型大城市东北亚经济圈中心城市,是国务院定位的中国东北地区中心城市之一我国重要的工业基地国家历史文化名城和全国综合交通枢纽。长春有着深厚的近代城市底蕴,是新
月亮在哪里(关于月亮的资料简单介绍)月球(Moon)是围绕地球旋转的球形天体,同时也是地球的天然卫星。在汉语中被俗称为月或月亮,古时又称为太阴玄兔婵娟玉盘。月球是太阳系中体积第五大的卫星,其平均半径约为1737。10
恒大怎么了(许家印范冰冰怀孕天涯)最近恒大爆发了严重的财政危机,引起了全民。这固然有吃瓜群众看热闹不嫌事大的心理,更因为这个庞然大物牵扯到的方方面面实在太多,想不关心都很难。尤其是某些所谓专家学者的奇葩言论给本就引
江南指哪里(江南四大名城是哪四个)古代的江南文化圈主要是指以南京为中心的皖南苏南和扬州三地围成的区域。古代江南四大名城是南京苏州徽州扬州。根据历朝历代朝廷官方的权威划分,南京是古代江南文化的发源地和中心区域,全国各
叶问为什么恨李小龙(十大禁拳八极崩)叶问为什么恨李小龙,预言李小龙是短命种成现实俗话说,一日为师,终生为父。,14岁的李小龙就拜入叶问的咏春门下,李小龙在做徒弟时深受师傅叶问的器重,叶问时常给李小龙开小灶,学会了其他
海南的高速为什么不收费(三亚高速不收费)广大老司机们知道,中国高速公路截止到2018年总里程已经到了13。65万公里。对于拥有广袤国土的中国来说,高速公路里程数已经到了世界第一。在作为基建狂魔的中国来说,建设高速公路根本
如何查询身份证在哪里开过房(怎么查开的房记录)如何查询身份证在哪里开过房(怎么查开的房记录)通过身份证号码可以查询宾馆入住记录吗?不能,除了公安机关能查外,其它人员是没法查到的。这是个人隐私,而且办案人员没有正当的手续流程,个
如何查询身份证在哪里开过房(怎么查开的房记录)如何查询身份证在哪里开过房(怎么查开的房记录)平常我们外出订酒店住房,都是需要登记身份证的。如果想查询,可以如何查开房记录呢?接下来,且听PChouse细细说来。开房记录不是轻易能
怎么查酒店开的房记录查询(个人怎么查开宾馆记录)怎么查酒店开的房记录查询(个人怎么查开宾馆记录)平常我们外出订酒店住房,都是需要登记身份证的。如果想查询,可以如何查开房记录呢?接下来,且听PChouse细细说来。开房记录不是轻易
宾馆会员可以查记录吗(宾馆能查到以前的信息吗)宾馆会员可以查记录吗(宾馆能查到以前的信息吗)实践日子中酒店的入住记载怎样查?假定说你有入住宾馆记载,那么就能够直接进入处理网络去查询自己的一个个人信息,所以在日常日子傍边,人们仍