《Part-4-高等统计与理论课件.ppt》由会员分享,可在线阅读,更多相关《Part-4-高等统计与理论课件.ppt(101页珍藏版)》请在三一办公上搜索。
1、Part 4 高等統計與理論,1,Part 4 高等統計與理論1,閱讀範圍,邱皓政著 量化研究與統計分析Chapter 13 線性關係的分析迴歸Chapter 14 項目分析與信度估計 Chapter 15 因素分析陳景堂著 統計分析SPSS for Windows入門與應用 簡單線性迴歸分析模型(Chapter 18)迴歸分析應用(Chapter 19)問卷實例解說與信度分析(Chapter 11)因素分析 (Chapter 24),2,閱讀範圍邱皓政著 量化研究與統計分析2,1. 線性關係的分析:,迴歸 Regression,3,1. 線性關係的分析:迴歸 Regression3,線性關係
2、的分析原理,基本條件: 連續變項之間的關係線性關係 linear relationship ,指兩個變項的關係可以被一條最具代表性的直線來表達之時,所存在的關連情形。 該直線之方程式為Y=bx+a,b為斜率(即y/x,每單位的X變動時,在Y軸上所變動的量) 線性關係可以散佈圖的方式來表現,4,線性關係的分析原理基本條件: 連續變項之間的關係4,線性關係與相關,線性關係的描述與運用相關分析的目的在描述兩個連續變數的線性關係的強度與方向(僅能說明兩變項之間具有一定程度之關聯,但無法知道兩變項之間的因果與先後關係)迴歸基於兩變項之間的線性關係,進一步分析兩變項之間的預測關係的探討與運用(即取用某獨立
3、變數去預測另一個依變數)。 迴歸與相關均以線性關係為基礎,即以兩個連續變項的共變數為基礎,其數學原理相似。相關係數計算之時,同時考慮兩個變項的變異情形,屬於對稱性設計,以X Y表示。但迴歸則由於目的在取用某一變項去預測另一變項的變化情形,X、Y兩個變項各有其角色,在迴歸係數的計算中,X、Y變項為不對稱設計,以X Y或Y X表示。,5,線性關係與相關線性關係的描述與運用5,相關與迴歸分析的圖示,6,相關與迴歸分析的圖示6,簡單線性迴歸模型,簡單線性迴歸模型是假設依變數 Y 之期望值為自變數 X 之線性函數,即所有 Yi 之期望值均落在一直線上,此稱之為迴歸線性假設(The linearity o
4、f regresssion)或迴歸共線假設。,簡單線性迴歸模型,7,簡單線性迴歸模型簡單線性迴歸模型是假設依變數 Y 之期望,迴歸係數,8,迴歸係數將所收集到的資料代入(1)式中,求出截距 a 和斜率,迴歸係數,迴歸方程式Y=b X+a,代入一個X值以預測Y值。b係數:為一未標準化的迴歸係數,其意義為每單位X值的變動時,Y所變動的原始量b係數大小隨著X與Y兩變項的單位使用,而沒有一定的範圍b係數適用於實務工作的預測數值的計算係數:如果將b值乘以X變項的標準差再除以Y變項的標準差,即可去除單位的影響,並控制兩個變項的分散情形,得到新的數值(Beta),為不具備特定單位的標準化迴歸係數,9,迴歸係
5、數迴歸方程式Y=b X+a,代入一個X值以預測Y值。9,迴歸係數,係數:係數也是將X與Y變項所有數值轉換成Z分數(標準常態分配)後,所計算得到的迴歸方程式的斜率,該方程式通過ZX,ZY的零點,因此截距為0,係數具有與相關係數相似的性質,也就是介於-1至+1之間,其絕對值越大者,表示預測能力越強,正負向則代表X與Y變項的關係方向。係數適用於變項解釋力的比較,偏向學術用途,10,迴歸係數係數:係數具有與相關係數相似的性質,也就是介於-,迴歸係數之檢定 (理論的截距和斜率),11,迴歸係數之檢定 (理論的截距和斜率)斜率的檢定1截距的推論檢,變異數拆解與F考驗,令最佳迴歸預測線為,在給定一個 值可以
6、獲得一個預測值,12,變異數拆解與F考驗 令最佳迴歸預測線為在給定一個 值,變異數拆解與F考驗,利用迴歸方程式,依變項Y變異量當中可以被解釋的部分稱為迴歸變異量(SSreg)無法被解釋的部分稱為誤差變異量(SSe),變項Y總變異量(SSt)=迴歸預測值變異量(SSreg)+誤差變異量(SSe),迴歸值離均差(迴歸方程式可以解釋的部份),原始離均差=迴歸值離均差+誤差,誤差(迴歸方程式無法解釋的部份),13,變異數拆解與F考驗 利用迴歸方程式,依變項Y變異量當中可以被,迴歸可解釋變異量比,迴歸可解釋變異量比,又稱為R2(R square),表示使用X去預測Y時的預測解釋力,即Y變項被自變項所解釋
7、的比率。反應了由自變項與依變項所形成的線性迴歸模式的契合度(goodness of fit) 又稱為迴歸模型的決定係數(coefficient of determination),R2開方後可得multiple R,為自變項與依變項的多元相關。R2為0時,表示自變數與依變數之間無線性關係,14,迴歸可解釋變異量比 迴歸可解釋變異量比,又稱為R2(R sq,adjusted R square,以樣本統計量推導出來的R2來評估整體模式的解釋力,並進而推論到母群體時,會有高估的傾向 樣本數越小,越容易高估,解釋力膨脹效果越明顯,樣本數越大,膨脹情形越輕微 校正後R2(adjusted R2),可以減
8、輕因為樣本估計帶來的R2膨脹效果。當樣本數越小,應採用校正後R2。,15,adjusted R square以樣本統計量推導出來的R2,判定簡單線性迴歸模型的適合性,模型適合性的檢定虛無假設:迴歸模型不適合(解釋能力極低或斜率為零 or R2 =0)對立假設:迴歸模型適合(解釋能力高或斜率不為零),1,16,判定簡單線性迴歸模型的適合性判定係數2模型適合性的檢定116,迴歸分析之變異數分析摘要表,17,變異來源平方和自由度均方F-值迴歸效果SSregkMSreg,迴歸分析的基本假設,(一)固定自變項假設(fixed variable)特定自變數的特定數值應可以被重複獲得,然後得以此一特定的Xi
9、代入方程式而得到預測值。(二)線性關係假設(linear relationship)當X與Y的關係被納入研究之後,迴歸分析必須建立在變項之間具有線性關係的假設成立上。(三)常態性假設(normality)迴歸分析中的所有觀察值Y是一個常態分配,即Y來自於一個呈常態分配的母群體。因此經由迴歸方程式所分離的誤差項e,即由特定Xi所預測得到的與實際Yi之間的差距,也應呈常態分配。誤差項e的平均數為0。,18,迴歸分析的基本假設(一)固定自變項假設(fixed vari,迴歸分析的基本假設,(四)誤差獨立性假設(independence)誤差項除了應呈隨機化的常態分配,不同的X所產生的誤差之間應相互獨
10、立,無相關存在,也就是無自我相關(non-autocorrelation)。(五)誤差等分散性假設(homoscedasticity)特定X水準的誤差項,除了應呈隨機化的常態分配,且誤差項之變異量應相等,稱為誤差等分散性 (六)多元共線性假設 自變項間相關程度過高,不但變項之間的概念區隔模糊,難以解釋之外,在數學上會因為自變項間共變過高,造成自變項與依變項共變分析上的扭曲現象,稱為多元共線性(multicollinearnality),19,迴歸分析的基本假設(四)誤差獨立性假設(independen,等分散性假設圖示,誤差等分散性,誤差變異歧異性,變異不變,20,等分散性假設圖示誤差等分散性
11、誤差變異歧異性變異不變變異隨X的,簡單迴歸分析操作程序,輸入資料選取分析迴歸方法線性選擇欲分析的兩個變項(為自變數X,另一個為依變數Y),移至清單中。選擇強迫進入變數法作為變項分析方法進入統計量勾選各種統計量再按繼續進入統計圖勾選各種統計圖再按繼續進入選項勾選各種選項再按繼續按確定執行,21,簡單迴歸分析操作程序輸入資料21,簡單迴歸分析範例,某研究所10名學生修習某門課程之期中考與期末考分數如下表,試問該教授是否可以以期中考成績來預測期末考成績?,簡單迴歸分析範例,22,簡單迴歸分析範例某研究所10名學生修習某門課程之期中考與期末,簡單迴歸分析範例輸出結果(1),敘述統計各變項的敘述統計量各
12、變項之平均數標準差與個數,相關矩陣各變項之間的相關矩陣,期中考與期末考的Pearson相關係數達0.822,達顯著水準又p-value=0.0020.05,Reject H0:B1=0,代表期中考與期末考成績存在線性關係,23,簡單迴歸分析範例輸出結果(1)敘述統計相關矩陣23,簡單迴歸分析範例輸出結果(2),模式摘要自變數(期中考成績)對依變數(期末考成績)的整體解釋力由R平方解釋期中考成績可以解釋依變項(期末考成績) 67.6%的變異。調整後的R平方為63.5%,24,簡單迴歸分析範例輸出結果(2)模式摘要24,簡單迴歸分析範例輸出結果(3),B1, B0與Beta值均達顯著水準,故期中考
13、成績與期末考成績的線性關係存在,25,簡單迴歸分析範例輸出結果(3)B1, B0與Beta值均達顯,簡單迴歸分析範例輸出結果,【結果說明】以(期中考成績)預測(期末考成績),為一簡單迴歸分析。基於相同數學原理,簡單迴歸與相關分析之結果相同。Pearson相關係數,Multiple R與Beta皆為0.822 ,這些係數之檢定值均相同,達顯著水準。R2的數據則提供迴歸變異數的比重,顯示以期中考成績預測期末考成績具有63.5%的解釋力,F-value = 16.66 ,p=0.004,顯示該解釋力具有統計的意義。結果指出:期中考成績能夠有效預測期末考成績,Beta係數達0.822,(t=4.082
14、,p=0.004),表示期中考成績越高,則期末考成績越好。,26,簡單迴歸分析範例輸出結果【結果說明】26,多元迴歸分析操作程序,輸入資料選取分析迴歸方法線性選擇欲分析的兩個變項(為自變數X,另一個為依變數Y),移至清單中。選擇強迫進入變數法或可選用其他選入模式,如逐步迴歸法作為變項分析方法進入統計量勾選各種統計量再按繼續進入統計圖勾選各種統計圖再按繼續進入選項勾選條件與遺漏值處理模式按繼續按確定執行,27,多元迴歸分析操作程序輸入資料27,多元迴歸分析範例,同前一個期中考預測期末考之應用。今老師若以缺席、期中考與期末考分數、作業成績,進行學生學期總分評分工作,試說明這些變項對於學期總分的影響
15、?,多元迴歸分析範例,28,多元迴歸分析範例同前一個期中考預測期末考之應用。今老師若以缺,多元迴歸分析範例輸出結果(1) (強迫進入法),敘述統計各變項的敘述統計量各變項之平均數標準差與個數,選入/刪除的變數顯示回歸分析的自變項清單計有五個自變項被納入分析,29,多元迴歸分析範例輸出結果(1) (強迫進入法)敘述統計選入/,多元迴歸分析範例輸出結果(1) (強迫進入法),模式摘要顯示自變數對依變數之整體解釋力。所有自變數可以解釋依變數(學期總分)95.4%的變異。調整後的R平方為89.6%。因為小樣本,宜採用調整後的R平方。,30,多元迴歸分析範例輸出結果(1) (強迫進入法)模式摘要30,多
16、元迴歸分析範例輸出結果(1) (強迫進入法),模式顯著性整體檢定用以檢定整體迴歸模式的顯著性。F檢定值為16.522,p-value = .009,顯示上述89.6%的迴歸解釋力。具有統計上的意義。,31,多元迴歸分析範例輸出結果(1) (強迫進入法)模式顯著性整體,多元迴歸分析範例輸出結果(1) (強迫進入法),係數估計各變項B,Beta值及顯著性檢定。僅缺席次數之B值=-0.610,達顯著(t=-3.649,p=0.022) 。說明缺席次數為影響學期總分的顯著變數,且次數越多,學期總分越低,32,多元迴歸分析範例輸出結果(1) (強迫進入法)係數估計32,多元迴歸分析範例輸出結果(1) (
17、強迫進入法),共線性檢驗特徵值越小,條件指標越大,顯示模式共線性明顯。偏高的變異比例指出,Homework (0.76), Midexam (0.80)與 Finexam (0.85)之間具有明顯共線性。,33,多元迴歸分析範例輸出結果(1) (強迫進入法) 共線性檢驗3,34,34,多元迴歸分析範例輸出結果(1) (強迫進入法),殘差分析用以檢定極端值的存在,以及是否違反常態性假設。殘差的值為觀察值與預測值的差,殘差越大,表誤差越大。標準化後之殘差絕對值若大於1.96,代表偏離值。結果顯示無偏離值,但因樣本太少,殘差非呈現常態分配。,35,多元迴歸分析範例輸出結果(1) (強迫進入法)殘差分
18、析35,多元迴歸分析範例輸出結果(2)(逐步迴歸法),選入/刪除的變數顯示(逐步迴歸法)的自變項清單,其選擇之準則為: (F-選入的機率 = .100)。總計有二個變項,分兩個步驟(模式)被選入迴歸方程式中。,模式1:僅期末考成績被選入模式中,模式2:再加入缺席次數變項故有缺席次數與期末考成績兩變項被選入模式中,36,多元迴歸分析範例輸出結果(2)(逐步迴歸法)選入/刪除的變數,多元迴歸分析範例輸出結果(2)(逐步迴歸法),模式摘要模式整體解釋力各為0.680與.868。其中.868(=.680+.218)為累積解釋量。,兩步驟下,個別自變項可以解釋之變異量為.680與.218。均達顯著水準,
19、因此被選入。,37,多元迴歸分析範例輸出結果(2)(逐步迴歸法)模式摘要兩步驟下,多元迴歸分析範例輸出結果(2)(逐步迴歸法),對於模式一之R平方(.680),F檢定值為16.997,p-value= .003對於模式二之R平方(.868),F檢定值為30.707,p-value= .000,均達顯著,顯示上述迴歸效果,具有統計上的意義。,38,多元迴歸分析範例輸出結果(2)(逐步迴歸法)對於模式一之R平,逐步迴歸法過程說明,39,加入ABSENT後,模式仍達顯著性逐步迴歸法過程說明39,多元迴歸分析範例輸出結果(2)(逐步迴歸法),逐步係數估計模式一顯示首先進入的自變數為(期末考成績),Be
20、ta值=.825,t 檢定達顯著。,逐步係數估計模式二再加入一個新的預測變數(缺席次數),其Beta值=-.510,而(期末考成績)之Beta值則降為.618,表示經過排除共變程度後之淨預測力,t 檢定亦達到顯著水準。,40,多元迴歸分析範例輸出結果(2)(逐步迴歸法) 逐步係數估計逐,路徑分析(PATH ANALYSIS),路徑分析由一系列的迴歸分析所組成,除了借用迴歸方程式的原理,並透過假設性的架構,將不同的方程式加以組合,形成結構化的模式。 路徑分析的基本程序是建立一套假設性的相關/因果關係模式,模型中存在因果關係,利用觀察到的資料與理論數值的比對,分析者可以評估假設出來的路徑模式是否能
21、夠有效解釋觀察到的資料,如果差異過大,假設模型也就被推翻如果模型沒有被推翻,路徑模式所假設的各種關係也就自動成立。其虛無假設與對立假設如下:,H0: 觀察數據=理論模式H1: 觀察數據理論模式,41,路徑分析(PATH ANALYSIS)路徑分析由一系列的迴歸,路徑分析的各種變項關係,42,路徑分析的各種變項關係 42,範例說明,假設三:自我效能感與社會期待具有相關,假設二:自我效能感、社會期待與成就動機影響學業表現此假設為多元回歸假設,其方程式如下:,假設一:自我效能感與社會期待影響個人成就動機此假設為多元回歸假設,其方程式如下:,這兩個方程式構成套結構化方程式,即路徑模式,43,範例說明假
22、設三:自我效能感與社會期待具有相關假設二:自我效能,路徑分析(Path Analysis)之路徑模式圖,44,路徑分析(Path Analysis)之路徑模式圖44,路徑分析的基本概念,由變項間之關係,可以由結構之方式呈現每個獨立之迴歸方程式(迴歸模式)。而每個迴歸模式,其自變數對於依變數之解釋能力,可以由R2與F檢定值來表示。每個箭頭可以獲自於迴歸係數,迴歸係數會出現在箭頭兩側,加星號代表不同顯著水準下係數達到顯著。參數估計直接效果(direct effect) :箭頭的迴歸係數若達到顯著,代表因果變項間具有直接效果。間接效果(indirect effect) :兩變項間,具有一個或多個中介
23、變項(mediated variable),而變項與變項之間之直接效果 均顯著,代表因果變項間具有間接效果。整體效果(total effect) :直接效果與間接效果知總合結果,45,路徑分析的基本概念由變項間之關係,可以由結構之方式呈現每個獨,路徑分析各項效果分解說明,46,路徑分析各項效果分解說明 46,自我效能感對於成就動機與學業表現均有直接效果,路徑係數分別為0.63(p0.001)與0.29(p0.01),成就動機對於學業表現亦有直接效果,路徑係數分別為0.21(p0.01),因此,自我效能感對於學業表現,除了具有直接效果外,尚具有一由成就動機所中介的間接效果,間接效果的強度=兩個直
24、接效果的乘積(0.63*0.21=0.13),47,自我效能感對於成就動機與學業表現均有直接效果,路徑係數分別為,自我效能感、社會期待與成就動機影響學業表現此假設為多元回歸假設,其方程式如下:,48,自我效能感、社會期待與成就動機影響學業表現48,上機練習,1 .簡單迴歸分析模型 (陳景堂著 課本第十八、第十九章) 【問題1】第十九章課本作業第二題 (see p.19-50p.19-51),49,上機練習1 .簡單迴歸分析模型 49,2.項目分析與信度估計,Item Analysis and Reliability Estimation,50,2.項目分析與信度估計Item Analysis
25、and R,心理測驗的量化分析,預試分析(pre-test)目的在確認量表題目的堪用程度(適切性評估)最重要的工作為項目分析,並進行試探性的信度分析,以作為題目改善的依據信效度檢驗提供各項客觀指標,作為測驗與量表良窳程度的具體證據。,51,心理測驗的量化分析預試分析(pre-test)51,項目分析的策略,遺漏值的數量評估法檢驗受測者是否抗拒或難以回答某一個題目,導致遺漏情形的發生。過多的遺漏情形表示該題目不宜採用。描述統計評估法利用各題目的描述統計量來診斷題目的優劣。如題目平均數評估法:各題目之平均數應趨於中間值,過於極端值平均數代表偏態或不良試題,無法反應題目之集中趨勢。題目變異數評估法:
26、 一題目之變異量若太小,代表者達題情形趨於一致,題目之鑑別度低,屬於不良的題目。偏態與峰度評估法。,52,項目分析的策略遺漏值的數量評估法52,項目分析的策略,題目總分相關法(相關分析技術)計算每一個項目與總分的簡單積差相關係數,一般要求在0.3以上,且達統計之顯著水準。SPSS軟體為項目分析提供了一項校正項目總分相關係數(corrected item-total correlation)的相關係數,使研究者清楚辨別某題目與其他題目之相對關聯性。內部一致性效標法(小樣本分析)又稱為極端組檢驗法,係將預測樣本在該量表總分之高低,取極端的27%分為高低兩組,並計算兩極端組的得分平均數。具有鑑別度的
27、題目在兩極端組的得分,應具有顯著的差異。因素分析法以因素負荷量來判斷個別項目與相對因素的關係,53,項目分析的策略題目總分相關法(相關分析技術)53,項目分析範例,採用組織創新氣氛知覺量表(邱浩政,1999),量表用以測量組織環境對於創意行為有利的程度。資料蒐集方式:訪談,自由反應問卷預測樣本:217位來自製造業、軍公教人員、與服務業之受訪者經進行項目分析與因素分析後,由50題題目保留其中 31題,完成正式題本建立。,項目分析實際範例,54,項目分析範例採用組織創新氣氛知覺量表(邱浩政,1999),項目分析操作程序,選取分析報表觀察值摘要選取所欲分析的題目移至變數清單中進入統計量對話框,選取平
28、均數、標準差、偏態、峰態等各種描述統計選項,移至清單中按確定執行,55,項目分析操作程序選取分析報表觀察值摘要55,項目分析輸出結果,高遺漏題目其中有五題遺漏值超過5%分別為Q19,Q20,Q41,Q42,Q43,這些高遺漏值傾向於優先刪除,但仍須與其他指標合併考量,56,項目分析輸出結果高遺漏題目這些高遺漏值傾向於優先刪除,但仍須,描述統計評估法,平均數評估法:過高或過低之平均數代表偏離。通常以項目平均數超過全量平均數之正負1.5個標準差為檢驗標準,平均數偏離Q6與Q13之項目平均數明顯偏低(落於1.5個標準差之外),全量平均數之正負1.5個標準差範圍=2.71221.5(0.4718)=2
29、.00,3.42,57,描述統計評估法平均數評估法:過高或過低之平均數代表偏離。平均,描述統計評估法,題目變異數評估法: 變異量若太小,代表低變異量通常以標準差0.75為檢驗標準。,偏態與峰度評估法:偏態明顯。通常以偏態係數接近正負 1為基準,偏態明顯Q24 、Q25 、Q26 、 Q27偏態係數高於0.7,低變異量Q50標準差偏小,58,描述統計評估法題目變異數評估法: 變異量若太小,代表低變異量,同質性檢驗(信度功能),步驟一 選取量尺法中的信度分析,步驟二 選取所預分析的變項移至清單中。點選統計量。,59,同質性檢驗(信度功能)步驟一 選取量尺法中的信度分析 步驟,同質性檢驗(信度功能)
30、,步驟三選取刪除項目後之量尺摘要。,60,同質性檢驗(信度功能)步驟三60,1. 項目與總分相關:* Method 1 (space saver) will be used for this analysis * R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)Item-total Statistics Scale Scale Corrected Mean Variance Item- Alpha if Item if Item Total if Item Deleted Deleted Correlation Dele
31、tedQ1 132.9119 483.3593 .6351 .9425Q2 132.8176 484.3906 .6275 .9425Q18 132.7987 486.0225 .5953 .9427Q20 132.9874 503.3290 .1262 .9456.(略)Q45 132.6855 485.9511 .6308 .9426Q47 133.1195 493.8147 .3840 .9440Q48 133.1006 487.8632 .4837 .9434Q49 132.5723 487.7020 .5801 .9429Q50 132.5660 492.9687 .5208 .94
32、33N of Cases = 159.0 N of Items = 50全量表之信度係數Alpha = .9444,Alpha = .9444,61,1. 項目與總分相關:Alpha = .94446,測驗發展資料分析: 項目分析,62,測驗發展資料分析: 項目分析62,信度分析的步驟,步驟一: 選取統計分析中的量尺法中的信度分析 步驟二: 選取所預分析的變項移至清單中。選擇所需的信度估計模式步驟三: 進入統計量對話框,選擇適當的統計量。,63,信度分析的步驟步驟一: 選取統計分析中的量尺法中的信度分析,信度分析之量表統計摘要,1. 題目平均數統計量(題目平均數的平均數、最大與最小值、變異數)
33、,1.題目變異數統計量(題目變異數的平均數、最大與最小值、變異數),1.題目間共變數統計量(題目變異數的平均數、最大與最小值、變異數),1.題目間間相關係數統計量(題目變異數的平均數、最大與最小值、變異數),64,信度分析之量表統計摘要1. 題目平均數統計量(題目平均數的平,信度分析:共變與相關矩陣,共變矩陣(Covariance Matrix): 列出題目兩兩共變數。對角線所列出為各題的變異數。 相關矩陣(Correlation Matrix): 列出題目兩兩相關係數,65,信度分析:共變與相關矩陣共變矩陣(Covariance Ma,信度分析結果(項目與總分相關),相關較低的題目可以考慮列
34、入刪除之可能名單,項目與總量表的統計數,包括: 1.項目刪除後量表總分 2.項目刪除後變異數大小 3.項目與總分相關 4.相關係數的平方 5.當該題刪除後所能提高的信度係數。,66,信度分析結果(項目與總分相關)相關較低的題目可以考慮列入刪,信度分析結果(CronBachs Alpha),信度係數Alpha即為Cronbachs .9444屬於高信度係數,標準化信度係數標準化的表示考慮各題目變異量不相等所造成的影響,經校正後的係數。,變異數分析檢定摘要表:用以檢驗信度係數Alpha或整個模式的顯著性。,67,信度分析結果(CronBachs Alpha)信度係數標準,信度分析重點,判斷問卷量表
35、之符合性由相關係數矩陣判斷:若相關係數高,則表示試題同質性相近,可以考慮合併刪除試題後,此試題與整體問卷結果之相關性判斷,若信度係數太低,表示此試題與整體問卷較不一致,可以考慮刪除此試題。刪除此一試題後之Cronbachs 係數可與整體問卷之Cronbachs 係數比較,以判斷是否刪除該試題。,問卷整體信度係數,以Cronbachs 係數最具代表,此係數值介於 0與1之間,其意義如下。,68,信度分析重點判斷問卷量表之符合性係數意義0.000.30,項目分析結果,69,項目分析結果69,上機練習,1 .問卷實例說明 (陳景堂著 課本第十一章) 【問題1】第十一章課本信度分析範例 (see p.
36、11-33p.11-54),70,上機練習1 .問卷實例說明 70,3.因素分析,Factor analysis,71,3.因素分析Factor analysis71,因素分析基本概念,為了要證實研究者所設計的測驗的確在測某一潛在特質,並釐清潛在特質的內在結構,能夠將一群具有共同特性的測量分數,抽離出背後潛在構念的統計分析技術, 即為因素分析(factor analysis)。,72,因素分析基本概念 為了要證實研究者所設計的測驗的確在測某一潛,因素分析主要的功能,能協助進行效度的驗證。利用一組題目與心理構念間關係的討論,研究者得以提出計量的證據,探討潛在特質的因素結構與存在的形式,建立量表的
37、因素效度(factorial validity)。能協助簡化測量的內容。因素分析法之主要概念即是將複雜的共變結構予以簡化。研究者可以根據每一個因素的主要概念,選用最具有代表性的題目來測量特質,以最少的題項,進行最直接適切的測量,減少受測者作答時間,減少疲勞效果與填答抗拒。用來協助測驗編製,進行項目分析,檢驗試題的優劣好壞。同時可以針對每一個題目的獨特性進行精密的測量,比較相對的重要性。,73,因素分析主要的功能能協助進行效度的驗證。73,因素與共變結構,因素分析之基本假設,是構念或因素(factor)隱含在許多現實可觀察的事物背後,雖然難以直接測量,但是可以從複雜的外在現象中計算、估計、或抽取
38、得到。其數學原理是共變(covariance)的抽取。也就是說,受到同一個構念影響的測量分數,共同相關的部份,就是構念所在的部份。構念則是由被稱為因素的共同相關的部份的得分來表示。,74,因素與共變結構因素分析之基本假設,是構念或因素(fact,因素分析運算的過程,與同樣採用共變為計算基礎的迴歸分析類似。如果自尊以Y來表示,其他十個題目分數以X1到X10表示,自尊的得分,可以從下列數學模性預測得到: Y =b1X1 + b2X2 + b3X 3 + + b10X10 + U此一方程式與迴歸方程式的不同: 1.X1到X10十個變項並非相互獨立的自變項,而是具有高度相似性、高度相關、具有共同特質的
39、十個自變項。 2.他們背後的共同特質Y,是理論上存在,由十個自變項當中抽離出來。相對的,迴歸分析中的Y,指的是另一個具體的、與自變項無本質上相似之處的依變項。,75,因素分析運算的過程與同樣採用共變為計算基礎的迴歸分析類似。如,探索性因素分析,探索性因素分析(Exploratory Factor analysis;EFA): 對於觀察變項因素結構(如因素之抽取、因素之數目、因素之內容以及變項之分類等)的找尋,並未有任何事前的預設假定,而逕由因素分析的程序去決定。,76,探索性因素分析 探索性因素分析(Exploratory,探索性因素分析,步驟:1.研究者經由共變關係的分解,找出最低限度的主要
40、成份(principal component)或共同因素(common factor)。2.探討這些主成份或共同因素與個別的變項的關係,找出觀察變項與其相對應因素之間的強度,即因素負荷值(factor loading),以說明因素與所屬的觀察變項的關係與強度。3.決定因素的內容,為因素取一個合適的名字。,為因素fi 解釋變數Xi變異的比例,77,探索性因素分析 步驟: 為因素fi 解釋變數Xi變異,因素分析的條件,因素分析的變項都必須是連續變項,符合線性關係的假設。順序與類別變項不得使用因素分析簡化結構。抽樣的過程必須具有隨機性,並具有一定的規模。如果研究的母群據有相當的同質性(如學生樣本),
41、變項數目不多,樣本數可以介於100到200之間。Gorsuch(1983)建議樣本數最少為變項數的五倍,且大於100。變數之間需具有一定程度的相關,一群相關太高或太低的變項,皆會造成執行因素分析的困難。相關太低的變項,難以抽取一組穩定的因素,不適於進行因素分析。(通常相關係數絕對值小於0.3不適於進行因素分析)相關太高的變項,多重共線性(multi-collinearity)明顯,有區辨效度不足的疑慮,所獲得的因素結構價值不高。可透過球形檢定與KMO檢定來檢驗上述問題。,78,因素分析的條件 因素分析的變項都必須是連續變項,符合線性關係,因素分析的數學原理(相關矩陣),因素分析的基礎是變項之間
42、的相關。因此應先計算數個題目(如X1X10)的兩兩相關,詳細檢視該相關矩陣所代表的意義。,79,因素分析的數學原理(相關矩陣)因素分析的基礎是變項之間的相關,檢驗相關係數是否適當的方法,1.Bartletts test of sphericity(球形檢定):一般相關矩陣中的相關係數必須顯著的高於0。某一群題目兩兩之間有高相關,顯示可能存有一個因素,多個群落代表多個因素。如果相關係數都偏低且接近,則因素的抽取越不容易。Bartletts test of sphericity(球形考驗)即可用來檢驗是否這些相關係數不同且大於0。,Barlett球形檢定呈現顯著表示相關係數足以作為因素分析抽取因素
43、之用,80,檢驗相關係數是否適當的方法Barlett球形檢定呈現顯著80,2.淨相關矩陣:變項之間是否具有高度關聯,可以從偏低的淨相關(partial correlation)來判斷。因素分析計算過程中,可以得到一個反映像矩陣,呈現出淨相關的大小,該矩陣中,若有多數係數偏高,則應放棄使用因素分析。除了此反映像矩陣之對角線係數以外,該係數稱為取樣適切性係數(KMO;Kaiser-Meyer-Olkin measure of sampling adequacy),代表與該變項的有關的所有相關係數與淨相關係數之比較值,該係數值越大,代表相關情形良好。其判斷原理如下:,檢驗相關係數是否適當的方法,81
44、,2.淨相關矩陣:KMO統計量因素分析適合性0.90以上極佳0,因素的抽取(factor extraction),主成份分析法(principle component analysis):以線性方程式將所有變項加以合併(linear combination),計算所有變項共同解釋的變異量,該線性組合稱為主要成份。第一次線性組合建立後,計算出的第一個主成份估計,可以解釋全體變異量的最大一部份。其所解釋的變異量即屬第一個主成份所有。分離後所剩餘的變異量,經第二個的方程式的線性合併,再抽離出第二個主成份,依此類推,所剩餘的共同變異越來越小,每一成份的解釋量依次遞減,直到無法抽取共同變異量為止。通常只
45、保留解釋量較大的幾個成份來代表所有的變項。主成份分析法適用狀況於單純為簡化大量變項為較少數的成份時,以及作為因素分析的預備工作。,因素抽取之目的在於決定測量變項中,存在著多少個潛在的成分或因素,82,因素的抽取(factor extraction) 主成份分析,主軸因素法(principal axis factors)與主成份分析法的不同,在於主軸因素法是分析變項間的共同變異量而非全體變異量。其計算方式是將相關矩陣中的對角線,由原來的1.00改用共同性(communalities)來取代。目的在抽出一系列互相獨立的因素。第一個因素解釋最多的原來變項間共同變異量;第二個因素解釋除去第一個因素解釋
46、後,剩餘共同變異量的最大變異;其餘因素依序解釋剩餘的變異量中最大部分。直到所有的共同變異被分割完畢為止。,因素的抽取(factor extraction),83,主軸因素法(principal axis factors)因,最小平方法(least squares method) 利用最小差距原理,針對特定個數的因素,計算出一個因素型態矩陣(factor pattern matrix)後,使原始相關矩陣與新的因素負荷量矩陣係數相減平方後數值最小,稱為未加權最小平方法(unweighted least squares method),表示所抽離的因素與原始相關模式最接近。 最大概率法(maximu
47、m-likelihood method) 相關係數經變項的殘差(uniqueness)加權後,利用參數估計(parameter estimation)原理,估計出最可能出現的相關矩陣的方法。,因素的抽取(factor extraction),84,最小平方法(least squares method)因素的,因素個數的決定,主要依據的原則是特徵值(eigenvalue)的大小。特徵值代某一因素可解釋的總變異量,特徵值越大,代表該因素的解釋力越強。一般而言,特徵值需大於1,才可被視為一個因素。低於1的特徵值,代表該因素的變異數少於單一一個變項的變異數1,無法以因素的形式存在。另一種方法則是以陡坡
48、檢定(scree test),其方法是將每一個因素依其特徵值遞減排列特徵值逐漸當因素的特徵值逐漸接近,沒有變化之時,代表特殊的因素已無法被抽離出來,當特徵值急遽增加之時,即代表有重要因素出現,也就是特徵值曲線變陡之時,即是決定因素個數之時。,85,因素個數的決定主要依據的原則是特徵值(eigenvalue),因素轉軸(factor rotation),轉軸的目的:將所抽取的因素,經過數學轉換,使因素或成份具有清楚的區隔,能夠反映出特定的意義,稱為轉軸。目的是在釐清因素與因素之間的關係,以確立因素間最簡單的結構。轉軸的進行:係使用三角函數的概念,將因素之間的相對關係,以轉軸矩陣(transfor
49、mation matrix)所計算出的因素負荷矩陣的參數,將原來的共變結構所抽離出來的項目係數進行數學轉換,形成新的轉軸後因素負荷矩陣(經正交轉軸)或結構矩陣(經斜交轉軸),使結果更易解釋。進一步的協助研究者進行因素的命名。,86,因素轉軸(factor rotation) 轉軸的目的:將所,1.直交轉軸(orthogonal rotation):指轉軸過程當中,因素之間的軸線夾角為90度,即因素之間的相關設定為0。如最大變異法(varimax)、四方最大法 (quartimax)、均等變異法(equimax rotation)。 2.斜交轉軸(oblique rotation):容許因素與因
50、素之間,具有一定的共變,在轉軸的過程當中,同時對於因素的關連情形進行估計。例如最小斜交法(oblimin roation)、最大斜交法(oblimax rotation)、四方最小法(quartimin)等。,轉軸的方式,87,1.直交轉軸(orthogonal rotation):轉,直交與斜交轉軸的優點,直交轉軸的優點:以直交轉軸轉換得到的新參數,是基於因素間是相互獨立的前提,在數學原理上,是將所有的變項在同一個因素或成份的負荷量平方的變異量達到最大,如此最能夠達到簡單因素結構的目的,且對於因素結構的解釋較為容易,概念較為清晰。斜交轉軸的優點:直交轉軸將因素之間進行最大的區隔,往往會扭曲了