《连续机率分配课件.ppt》由会员分享,可在线阅读,更多相关《连续机率分配课件.ppt(57页珍藏版)》请在三一办公上搜索。
1、第七章 連續機率分配,學 習 目標,瞭解連續機率分配的觀念。計算連續隨機變數的期望值、變異數及標準差。熟悉常態分配之意義、特性及其應用。瞭解二項分配與常態分配之關係。利用Excel求算常態分配值並繪製圖形。,本 章 架 構,7.1 連續機率分配之意義7.2 常態分配7.3 標準常態分配7.4 常態分配機率之計算7.5 二項分配與常態分配之關係,7.1 連續機率分配之意義,機率密度函數(probability density function;p.d.f.)令X為一連續隨機變數,則其機率密度函數f(x)必須滿足下列條件對所有的x而言,f(x)0。註:(i)間斷變數之p.m.f.f(x)1 不可能
2、 以點機率表示 P(X=a)=f(a)0(ii)連續變數之p.d.f.f(x)1 有可能 以區間面積表示機率值,故以積分求其機率值,但其點機率值P(X=a)=0,故P(X=a)f(a),7.1 連續機率分配之意義(續),圖7.1 連續隨機變數之機率分配,7.1 連續機率分配之意義(續1),令w表示組距,則圖7.1之每一矩形面積為wf(x),因為連續隨機變數於特定區間發生的機率值即為f(x)下該特定區間之面積,且根據機率之性質,機率值必須介於0和1之間,及機率總和必須等於1,因此,例7.1,假設X為一連續隨機變數,試問 是否為一機率密度函數?解:因為1.2.因此,f(x)是一機率密度函數。,7.
3、1 連續機率分配之意義(續2),累積機率函數 令X為一連續隨機變數,則其累積機率函數F(x)定義為 又點機率:P(X=c)=P(c X c)=F(c)F(c)=0 P(X c)=P(X c)+P(X=c)=F(c)故P(a X b)=P(a X b)=P(X b)P(X a)=F(b)F(a)註:(i)F(x)之圖形為上升且連續函數(ii)d(F(x)/dx=f(x)F(x)為f(x)反導數,連續機率分配,例:令X為一連續變數,其機率密度函數(p.d.f.)f(x)為 f(x)=k x(1-x),0 x 1,(1)求k值使f(x)滿足機率密度函數性質(2)求P(1/4 x 1/2)解:(1)(
4、i)P(0 x 1)=1 01 f(x)dx=1 k=6(ii)f(x)=6 x(1-x)0,0 x 1 k=6使f(x)滿足機率密度函數性質(2)求X之c.d.f.F(x),F(x)=P(X x)=0 x f(t)dt=3x 2x2 P(1/4 X 1/2)=F(1/2)F(1/4)=3/8註:此連續變數X為Beta分配,7.1 連續機率分配之意義(續3),連續隨機變數之期望值與變異數:令X為一連續隨機變數,則其期望值與變異數分別定義為=2=註:Var(X)=E(X2)-2 E(g(X)=-g(x)f(x)dx,例7.2 續例7.1,求連續隨機變數X之期望值與變異數。解:根據(7.1)式和(
5、7.2)式,X之期望值與變異數分別為,例7.2 續例7.1(續),連續變數之常用分配,1.常態分配(Normal distribution)X N(,2)2.連續均勻分配(Uniform distribution)X U(a,b)3.指數分配(Exponential distribution)X Exp(),7.2 常態分配,常態(Normal)機率密度函數,此處為平均數,為標準差,3.1416,e=2.7183。和 為常態分配之參數,一般以XN(,2)表示之。註:(i)f(x)之分布呈單峰對稱(即鐘形分布)(ii)平均數(mean)=中位數(Me)=眾數(Mo)=(iii)若=0,2=1,則
6、稱標準常態分配,以 Z N(0,1)表示,推論統計的基礎,常態分配及常態曲線(The Normal Curve)的觀念,在統計中十分重要,它們是推論統計的基礎。常態分配及曲線是一種理論模式,但透過這理論模式,我們可以對實證研究所得之資料分配,做相當精確之描述及推論。能做到這一點是因常態分配本身有些重要且已知的特性,而實際之資料分配也往往接近常態分配。,常態分配的重要性,常態分佈之所以重要,原因很多,三個主要的原因為:首先是常態分佈在分析上較易處理。其次是常態分佈之機率分配圖形為鐘形曲線(bell-shaped curve),再加上對稱性,使得很適合當做不少母體之機率模式。當然我們知道鐘形且具對
7、稱的分佈也有不少,但通常不像常態分佈,在分析上如此容易駕馭。第三個原因是由於在中央極限定理(Central Limit Theorem),使得在不太強的條件下,常態分佈可當做不少大樣本的近似分佈。,7.2 常態分配(續),常態分配之性質 不同的平均數和標準差形成不同的常態分配(見 圖7.2與圖7.3)。常態分配係以平均數為中心的對稱分配,即平均數、中位數及眾數都相等。常態機率函數下之面積總和等於1。常態分配曲線的尾部兩端無限延伸。較常用的常態分配機率範圍見圖7.4。,7.2 常態分配(續1),圖7.2 N(2,0.25)和N(5,0.25)之比較,x,7.2 常態分配(續2),圖7.3 N(0
8、,1)和N(0,0.16)之比較,7.2 常態分配(續3),圖7.4 常態分配曲線下之面積,常態分配的應用實例(一),股市技術面衡量指標:超買超賣()一.定義:利用一段時間內股市漲跌家數的累計差關係,以研判大盤買賣氣勢之強弱及未來走向。公式如下:10日值10日內股票上漲累計家數 10日內股票下跌累計家數 二.研判技巧:10 日值通常在-600至+700之間呈現常態分配。10 日值超過700時,股市呈現超買現象,是賣出時機,反之 10 日OBOS值低於-600時,股市呈現超賣現象,是買進時機。當10 日走勢與大盤指數走勢呈現背離時,大盤可能隨時會做反轉,尤其在高檔形成頭為賣出時機,低檔形成底為買
9、進時機。,常態分配的應用實例(二),教育部於民國八十六年七月六日在屏東召開教育廳局行政協調會報,重申貫徹常態編班的政策,並獲得地方行政單位的支持。常態編班學生異質性高,目前台灣省各國中,若利用校務行政網路系統進行常態編班,其方式約有三種:(1)S型編班:作業前先將每位學生順序編排號碼,可以是亂數編碼(但為了日後各班級程度一致,最好避免以此方式編碼)或經由智力測驗、學科測驗的名次來編碼。編班時,按其編碼順序地進行S型由前至後,再由後至前的將學生編於各班。(2)分組亂數編班:如上述先給予每位學生一個編碼,若預編為班則將學生-,-16,17-24依此類推,每八位學生為一組,再將每組學生以亂數方式編排
10、至個班級中。(3)純亂數編班:如(1)所述給予每位學生一個編碼後,不考慮順序,完全以電腦亂數處裡,將學生編入班級中。,7.3 標準常態分配,標準常態分配(standard normal distribution):當常態隨機變數之期望值為0且變異數為1時,一般以 Z N(0,1)表示之,其機率函數如圖7.7所示,註:(z)=f(z)標準常態分配Z之累積分配函數 c.d.f.F(z)為 F(z)=P(z z)=-z f(t)dt=(z)註:(i)因為積分複雜故需藉由查表才能求得機率值(ii)P(a c)=1 P(Z c)=(c),7.3 標準常態分配查表,I.給定分位數z求機率值1.P(Z 1.
11、96)=0.0252.P(Z-1.96)=0.9753.P(0.15 Z 1.96)=0.41544.P(|Z|1)=P(-1 Z 1)=0.6826 P(|Z|2)=P(-2 Z 2)=0.9544 P(|Z|3)=P(-3 Z 3)=0.99745.(i)分位數z四捨五入:P(Z 1.458)=P(Z 1.46)=0.9279(ii)內差法:P(Z 1.458)=0.2 P(Z 1.45)+0.8 P(Z 1.46)=0.20.92265+0.8 0.9279=0.92762,7.3 標準常態分配查表,II.給定機率值求分位數z1.P(Z d)=0.10 d=1.28(ii)利用內差法:P
12、(Z d)=0.10 d=0.81.28+0.21.29=1.282 註:以下為比較常用分位數z(1)P(Z z)=0.10 z=1.282(2)P(Z z)=0.05 z=1.645(3)P(Z z)=0.025 z=1.96(1)P(Z z)=0.01 z=2.326,7.3 標準常態分配(續),圖7.7 標準常態分配,7.3 標準常態分配(續1),標準常態分配之性質 標準常態分配係以0為中心之對稱分配,即 P(Z 0)=P(Z 0)=0.5。2.標準常態機率函數下之面積總和等於1。常態分配曲線的尾部兩端無限延伸。X N(,2),X 轉換標準常態分配Z之公式:Z=(X-)/N(0,1)求p
13、(a X b)時需將X轉換為Z=(X-)/即 p(a X b)=p(a*Z b*)=p(查表)如 P(X)=P(Z 0)=0.5 P(X-)=P(Z 1)=0.8413,7.3 標準常態分配(續2),表7.1 標準常態機率表,7.3 標準常態分配(續3),驗證經驗法則:,7.3 標準常態分配(續4),圖7.8 標準常態分配曲線下之面積,例7.3,求P(Z 0.72)之機率值。解:,例7.3,求P(-0.12 Z 0.72)之機率值。解:,例7.3,求P(0.12 Z 0.72)之機率值。解:,7.2 常態分配(續3),因為X之分布呈鐘形分布,對照經驗法則(i)P(|Z|1)=0.68,(ii)
14、P(|Z|2)=0.95,(iii)P(|Z|3)=0.68 圖7.4 常態分配曲線下之面積,7.4 常態分配機率之計算,XN(,2),X介於a和b之機率值,其程序必須先將常態隨機變數X透過標準化轉換為標準常態隨機變數Z,即。,例7.6 大學聯考成績,某次大學聯考,考生之分數呈現常態分配,其中=500、=100,現隨機抽取一人,其成績介於325和675分之間的機率為何?隨機抽出5個人時,試問只有2個人成績介於325和675分之間的機率為何?解:令隨機變數X定義為考生之大學聯考成績,則X之機率分配為平均數=500、標準差=100之常態分配,故考生成績介於325和675分之間的機率為,例7.6 大
15、學聯考成績(續),大學聯考成績(續),(2)p=P(325 X 675)=0.9198 令Y表此5人成績介於325和675分之間的人數,所以Y為近似二項式分配,Y B(n,p),其中 n=5,p=0.9198 P(Y=2)=C25(0.9198)2(0.0802)3=0.0044註:此Y HG(N,K,5),因為n/N 0.05 所以Y B(n,p),其中n=5,p=0.9198,例7.7 續例7.6,若某生想考上國立大學,則成績須名列前15%才有希望,試問他必須考多少分才有希望考上國立大學?(求分位數)解:假設某生必須考a分才有希望考上國立大學,則,例7.7 續例7.6(續),因此,查表可知
16、所以某生必須考604分才有希望考上國立大學。,7.5二項分配與常態分配之關係,二項分配 vs.常態分配二項分配,若試驗次數n固定,則當p0.5時,其分配呈現左偏;當p=0.5時,其分配呈現對稱。二項分配,若試驗次數n愈大時,則無論成功機率p值為何,其分配會愈來愈呈現對稱的情形。在實務應用中,只要當np 5且n(1p)5時,則可使用常態分配作為二項分配之近似分配。X B(n,p)X N(np,npq)np 5且n(1p)5 2,7.5二項分配與常態分配之關係(續),連續校正因子(correction for continuity)二項分配係屬於間斷機率分配,其隨機變數之任一可能值發生的機率是存在
17、的,而常態分配係屬於連續機率分配,其隨機變數之任意可能數值發生的禨率皆為0。連續校正因子係指加減0.5個單位。透過連續校正因子,可利用常態分配來求得二項分配的機率。,7.5二項分配與常態分配之關係(續1),圖7.18 B(10,0.5)和N(5,2.5)之比較,7.5二項分配與常態分配之關係(續2),圖7.19 二項分配和常態分配之比較,7.5二項分配與常態分配之關係(續3),連續校正因子的使用方式 設X為二項分配(X B(n,p),Y為常態分配(Y N(np,npq)P(a a之機率時,因不包含a點,故以Y a 0.5之機率為近似值。當計算X b之機率時,因包含b點,故以Y b 0.5之機率
18、為近似值。當計算X b之機率時,因不包含b點,故以Y b0.5之機率為近似值。,例7.8 丟擲一均勻銅板50次,丟擲一均勻銅板50次,試問:其出現20次正面之機率為何?其出現正面的次數超過20次,但少於30次之機率為何?解:1.令隨機變數X為50次中出現正面的次數,則X B(50,0.5)P(X=20)=C2050(0.5)20(0.5)30=C2050(0.5)50=0.04186 因為np=25 5且nq=25 5 所以X Y N(25,12.5)P(X=20)P(20 Y 20)=P(19.5 Y 20.5)=P(-1.56 Z-1.27)=0.0426,例7.8丟擲一均勻銅板50次(續
19、),例7.8 丟擲一均勻銅板50次(續1),現令隨機變數,因 且,故利用常態分配求得之機率值與二分配之機率值非常相近。,例7.8丟擲一均勻銅板50次(續2),2.同理可得 P(20 X 30)=2129 Cx50(0.5)x(0.5)50-x 例:續前例,若此銅幣為不公平,即正面出現率為反面3倍,試回答上述4題結果,兩獨立常態分配變數,定理:若X N(1,12),Y N(2,22)且X,Y獨立則(1)當W=X+Y,則W N(1+2,12+22)(2)當W=X-Y,則W N(1-2,12+22)(3)當W=kX,則W N(k1,k2 12)(4)當W=kX+cY,則W N(k1+c2,k2 12
20、+c2 22),補充:均勻分配(Uniform distribution),定義:均勻分配 若連續變數X為均勻分配,以X U(a,b)則X之機率密度函數p.d.f.f(x)為 f(x)=1/(b-a),a x b註:(i)f(x)圖形為水平線(ii)X之c.d.f F(x)=(x-a)/(a-b),a x b F(x)圖形為斜率為1/(b-a)之直線(iii)X U(0,1)為標準均勻分配,Y=F(X)U(0,1)其中X為任何分配之變數定理:若X U(a,b),則=(a+b)/2,2=(b-a)2/12註:若X為間斷均勻分配(f(x)=1/n,x=1,2,.,n)則=(1+n)/2,2=(n2
21、 1)/12,均勻分配,例:假設某班次火車開車時間依過去記錄在上午8:10 8:20,假設開車時間(X:分)呈均勻分配,試回答下列問題(1)某人在上午8:13 到車站,則此人可搭上此班火車機率(2)試問此班火車平均開車時間解:X U(10,20)c.d.f.F(x)=(x-10)/(20-10)(1)P(X 13)=1 P(X 13)=1 3/10=0.7(2)E(X)=(10+20)/2=15 所以此班火車平均開車時間為上午8:15 註:某人在上午8:00 到車站,則此人可搭上此班火車機率為1 P(X 0)=P(X 10)=1 P(X 10)=1-0=1,補充:指數分配(Exponentia
22、l distribution),定義:指數分配 若連續變數X為指數分配,以X Exp()則X之機率密度函 數p.d.f.f(x)為 f(x)=(1/)e-x/,x 0註:(i)f(x)圖形為嚴格下降曲線(ii)X表兩事件發生之間隔時間(iii)為間隔時間期望值(即(X)=),(ii)和(iii)時間單位需一致(iv)指數分配的參數單位為 平均時間/次 波松分配的參數單位為 平均次數/單位時間,指數分配,定義:指數分配 若連續變數X為指數分配,以X Exp()則X之機率密度函 數p.d.f.f(x)為 F(x)=P(X x)=1-e-x/,x 0註:(i)P(X a)=1-e-a/(ii)P(X
23、 a)=e-a/(iii)P(a X b)=P(X a)P(X b)=e-a/-e-b/定理:若X Exp()則=E(X)=,2=2,指數分配,例:假設某超市客人進入流程是穩定流程,依過去記錄平均每4分鐘進來一個客人,令X(分)表兩客人進入此超市之間隔時間,試回答下列問題:(1)X之分配為何(2)若某客人於上午9:00進入後,求下一位在上午9:04 9:08進 入之機率(3)若某客人於上午9:00進入後,經8分鐘仍無人進入之機率(4)若某客人於上午9:00進入後,後面有5個客人依序進來中,試問只有兩人之間隔時間超過4分鐘之機率(5)若某客人於上午9:00進入後,後面有個客人依序進來中,試問等到
24、第3個時,兩人之間隔時間才超過4分鐘之機率,指數分配,解:(1)X為指數分配,X Exp(4)(2)P(4 X 8)=e-4/4-e-8/4=e-1-e-2(3)方法1.(利用指數分配)X Exp(),=4 P(X 8)=e-8/4=e-2 方法2.(利用波松分配)X Poisson(),=2 P(X=0)=20 e-2/0!=e-2(4)X Exp(4)P(X 4)=e-4/4=e-1 令Y表5人中兩人之間隔時間超過4分鐘之個數 所以Y表二項式分配,Y B(5,p),p=e-1 P(Y=2)=C25(e-1)2(1-e-1)3(5)令W表直到兩人之間隔時間超過4分鐘之個數 所以W表幾何分配,G G(p),p=e-1 P(W=3)=(e-1)(1-e-1)2,指數分配,例:若X Exp(),試回答下列問題:(1)求P(X)(2)利用P(X x)=e-x/,証明 P(X a+b|X a)=P(X b)其中a 0,b 0 解:(1)因為X Exp()所以P(X)=e-/=e 1(2)利用P(X x)=e-x/P(X a+b|X a)=P(X a+b)(X a)/P(X a)=P(X a+b)/P(X a)=e(a+b)/e-a/=e-b/=P(X b)註:幾何分配(間斷變數)與指數分配(連續變數)均有健忘性質,