《概率第二十二讲(主成分分析).ppt》由会员分享,可在线阅读,更多相关《概率第二十二讲(主成分分析).ppt(34页珍藏版)》请在三一办公上搜索。
1、概率论与数理统计,经管02级2003.12.18.,典型相关分析,随机变量X,Y的协方差、相关系数:,相关系数可以用来衡量线性的相关关系,但限于两个随机变量之间,一对多的情况要引入多重相关系数来衡量。多对多之间的相关分析如何做?,主成分分析与典型相关分析,主成分分析思路;总体的主成分分析;样本的主成分分析;典型相关分析;总体典型相关分析;样本典型相关分析.,主成分分析,什么叫主成分分析?股市找成分股。选衬衫(领围)鞋(长);牵牛要牵牛鼻子;如何发现主要矛盾?,主成分分析,某大学某班学生一年级13门课的成绩,排序会按总分(或平均分),高考按若干门课的总分划分数线。合理吗?1901年Karl.Pe
2、arson提出了主成分分析。分总体的和样本的.,总体主成分分析,p个随机变量组成一个p维随机向量X=(X1,X2,.,Xp),记其第i,j个分量Xi,Xj间的协方差为ij=Cov(Xi,Xj),它们组成协方差矩阵=(ij)pp,它的特征值为12.p0,相应的标准正交的特征向量是e1,e2,.,ep,则X的第i个主成分是:Yi=eiX(i=1,2,.,p),称 为第i个主成分Yi的方差贡献率。,称 为前i个主成分的累计方差贡献率。,总体主成分分析,Excel可以求方矩阵的行列式值,求它的特征值和特征向量并不方便。用Mathematica较方便;可以用SPSS一类专门的统计软件来做Principl
3、e Component Analysis).即AnalyzeData Reduction Factor还有SAS等,计算器的使用,分带与不带统计功能,带统计功能的计算器中又分一元与可做二元统计分析的两类。普通带统计功能的计算器可以算一批数据的均值、方差、标准差有二元统计功能的计算器可以做一元线性或非线性回归。其特征:有 XY 键.,计算器,有的计算器带强弱不同的统计功能。一般有“STAT”字样的就有统计功能,可求一批数据的样本均值、样本标准差(无偏和有偏的都有,从而可求出方差)、数据和及平方和等。有“xy”字样的计算器有二元统计功能。,计算器,右图是一台有“xy”字样的计算器,它有二元统计功能
4、。可以作二元线性和非线性回归。具体用法应该可以从说明书中查到:统计前的准备工作;数据输入及修改;统计结果的显示;预测的使用法。,提纲,复习与回顾知识点分布概率论的基础随机变量的基础数字特征计算技巧,回顾与建议,学了概率论与数理统计两大块;查一查微积分、集合、计算方面的基础是否扎实;分析和解决随机现象中问题的能力;考试是能力的综合测试;注重理论联系实际的能力。,概率论要掌握的预备知识,集合论排列组合基本微积分计算技术,概率论部分,基础知识:事件,运算,概率的定义及计算,事件的关系,古典概型,贝努里概型;随机变量:定义,分布,类型,分布列、概率密度函数、分布函数,联合分布与边际分布;数字特征:定义
5、,计算,性质。,概率的基本概念,事件随机事件不可能事件必然事件包含相等,交与并不相容(互斥)对立(互补)独立0概率事件1概率事件,概率的基本公式,随机变量,随机现象量化为一个变量,叫随机变量;类型:离散型与连续型;分布函数及其性质:离散型的分布列及性质;连续型的概率密度函数及性质;重要的几类随机变量。,离散型随机变量,离散型的分布列为则要求:1.pk0 2.pk=1而EX=xk pk(要求绝对收敛.)EX2=xk2 pk DX=EX2(EX)2,连续型随机变量,连续型的概率密度函数为p(x),则要求:1.p(x)0 2.p(x)dx=1而EX=xp(x)dx(要求绝对收敛)EX2=x2p(x)
6、dx DX=EX2(EX)2,随机向量,随机现象作为整体量化为几个变量,叫随机向量;类型:离散型与连续型;联合分布函数与边际分布函数;离散型的联合分布列与边际分布列;连续型的联合概率密度函数与边际概率密度函数。,数字特征的性质,数字特征的性质:1.E(aX+b)=_2.E(XY)=_3.E(X*Y)=_4.D(aX+b)=_5.D(XY)=_6.D(X*Y)=_,aE(X)+b E(X)E(Y)E(X)*E(Y)?a2D(X)D(X)+D(Y)?D(X)*D(Y)?,练习题选讲,如事件AB,则:AB=A,AB=B,A-B=,P(B-A)=P(B)-P(A),B-A=B-AB,A与B独立吗?不会
7、不相容吗?事件A与B既相互独立又不相容,可能吗?掷两枚骰子,所得的点数和为几的概率最大?所得的点数和为几的概率最小?“28选5”与“35选7”哪个中大奖的概率大?,练习,1)如AB,则AB=AB=P(AB)=P(AB)=P(B-A)=P(A-B)=,B,A,P(B),P(A),P(B)-P(A),0,2)如P(A)=0,B为任意事件,则P(AB)=P(AB)=A与B独立吗?,P(B),0,试题选讲,单项选择题,*设P(A)=0,B为任一事件,则_;A=ABA与B相互独立 A与B互不相容*A、B为任意两个事件,若A、B之积为不可能事件,则称_;A与B相互独立 A与B互不相容 A与B互为对立事件
8、A与B为样本空间的一个剖分,*设A、B两事件互不相容,0P(A)=p1,0P(B)=q1,则推不出结论_;P(A|B)=0*设随机变量X的分布列为X-202,则 E(3X 2+5)=_;p0.40.30.3 13 13.2 13.4 13.6,单项选择题,单选题,*设A,B为两事件,AB,则不能推出结论_P(AB)=P(A)P(AB)=P(B)P(AB)=P(A)-P(B)P(AB)=P(B)-P(A)*设离散型随机变量的分布列为其分布函数为F(x),则F(3/2)=_ 0.1 0.3 0.6 1.0*随机变量X的概率密度函数为p(x)=(-x+),则常数C=_ 1/2/2,练习题选讲,从1-
9、10编好号的十个球中任取两个,它们的编号之和记为X,P(X18)=_;A)18/25 B)16/25 C)44/45 D)43/45若随机变量X和Y的相关系数XY=0,则有_;A)D(X-Y)=D(X)-D(Y)B)D(X+Y)=D(X)+D(Y)C)D(X*Y)=D(X)*D(Y)D)他们独立,练习题选讲,7抽1的抽签,每人依次抽,则_;A)第一人抽到的概率最大B)第四人抽到的概率最大C)最后的人抽到的概率最小D)每人抽到的概率相同.联合密度为时,X与Y独立吗?,练习题选讲,以下三个中_可以是分布列;A)B)C)设X的分布函数是求的值;-2x1,-1,1-e-1,单选题,*随机变量X的概率密度函数为 p(x)=则X的数学期望E X=_ 1/2 1 2 4*设XP()(0),则D(X)/E(X)=_ 1 1/2*随机变量XP(2),则EX2=_ 2 4 6 8,单选题,*随机变量X和Y的概率密度函数分别为 pX(x)=pY(y)=若X和Y相互独立,则数学期望E(XY)=_ 1 1/2 1/3 1/4*设随机变量X的E(X)=,D(X)=2,用切比雪夫不等式估计P(|X-|3)_ 1/9 8/9 80/81 8/9,切贝雪夫不等式,随机变量的X方差存在,0:,