《交叉分析表课件.ppt》由会员分享,可在线阅读,更多相关《交叉分析表课件.ppt(60页珍藏版)》请在三一办公上搜索。
1、交叉分析表,市場調查或民意調查,常利用交叉分析表來探討兩個類別變數間之關聯性(如:地區別與某政策之贊成與否、性別與偏好政黨、教育程度與使用品牌、品牌與購買原因、所得與是否有數位相機、)。,交叉分析表市場調查或民意調查,常利用交叉分析表來探討兩個類別,建立交叉分析表,茲以政黨傾向.sav為例,進行說明建立交叉分析表之過程,該表有1000筆受訪者之資料,政黨傾向變數欄內之代碼意義為:(執行公用程式(U)/變數(R)即可查得),建立交叉分析表茲以政黨傾向.sav為例,進行說明建立交叉,居住地區變數欄內之代碼意義為:,居住地區變數欄內之代碼意義為:,擬建立政黨傾向對居住地區之交叉分析表,其處理步驟為:
2、執行分析(A)/描述性統計(E)/交叉表(C),擬建立政黨傾向對居住地區之交叉分析表,其處理步驟為:,選政黨傾向,按 鈕,將其送到右側之列(O)方塊選居住地區,按 鈕,將其送到右側之直行(C)方塊,選政黨傾向,按 鈕,將其送到右側之列(O,按 鈕,設定要顯示觀察值(O)及直行(C)之百分比(縱向總計為分母之百分比),按 鈕,設定要顯示觀察值(O)及,按繼續鈕,回上一層對話方塊按確定鈕,獲致,按繼續鈕,回上一層對話方塊,由表上之資料可看出:整體言,受訪者中,以無政黨傾向者居最(28.1%)。有明顯政黨傾向之受訪者中,以民進黨的支持率最高(22.8%),其次依序為國民黨(20.4%)、親民黨(19
3、.6%)、台聯(5.5%)、新黨(3.6%)。經由與地區別交叉分析後,可發現:北區主要是支持國民黨與親民黨(22.4%與20.2%),中區是親民黨(22.5%)與民進黨(21.5%)略勝於國民黨(18.5%),南區是民進黨獨大(31.7%),東區則還是國民黨(30.0%)與親民黨的天下(20.0%)。不過,由於未進行獨立性檢定,我們還不能斷下結論。(有關獨立性檢定之作法,詳本章下文卡方檢定之說明。),由表上之資料可看出:整體言,受訪者中,以無政黨傾向者居最(2,馬上練習,針對政黨傾向.sav,求政黨傾向對性別之交叉分析表,同時顯示人數及縱向之直行百分比,並解釋其結果。,馬上練習針對政黨傾向.s
4、av,求政黨傾向對性別之,可約略看出,無論男女,均以無政黨傾向居最多數(28.7%與27.5%),支持度第二之政黨,在男性為民進黨(27.5%);在女性則為國民黨(24.4%)。此外,就相對程度來看,支持民進黨者中,男性比例明顯超過女性(27.5%對18.4%);支持國民黨者中,女性之比例明顯超過男性(24.4%對16.1%)。不過,由於未進行獨立性檢定,我們還不能斷下結論。,可約略看出,無論男女,均以無政黨傾向居最多數(28.7%,馬上練習,針對品牌偏好原因.sav,求品牌對偏好原因之交叉分析表,於表中同時顯示人數及縱向之直行百分比,並解釋其結果。,馬上練習針對品牌偏好原因.sav,求品牌對
5、偏好原因,由表上之資料可看出:整體上消費者偏好其使用品牌的主要原因,依序為價格便宜(36.0%)、外型美觀(34.0%)與品質優良(30.0%)。另由交叉分析,可看出:A牌之使用者,主要是因價格便宜(64.7%)而使用A牌產品。B牌之使用者,主要是因品質優良(72.7%)而使用B牌產品。C牌之使用者,主要是因外型美觀(50.0%)而使用C牌產品。,由表上之資料可看出:整體上消費者偏好其使用品牌的主要原因,依,將分析結果轉入Word,假定,要將先前馬上練習中偏好原因*品牌交叉表,轉到Word文件。其處理步驟為:以滑鼠右鍵點選輸出結果之交叉表,將出現一選單,選取複製(C),記下交叉表內容,將分析結
6、果轉入Word假定,要將先前馬上練習中偏好原因,轉到Excel之空白工作表,按 貼上鈕,將選取內容複製過來,轉到Excel之空白工作表,按 貼上鈕,將選取,雙按B欄之標題按鈕右側,將其調整為最適欄寬,以便顯示完整文字於G3輸入合計字串將C5、C7、C9與C11之品牌內的 %改為%將C10之個數改為樣本數將所有百分比均改為只留一位小數,並加上%,雙按B欄之標題按鈕右側,將其調整為最適欄寬,以便顯示完整文字,選取B3:G11之內容按 複製鈕,記下所選取之內容,選取B3:G11之內容,再轉到Word文件,停於要插入交叉表之位置。按 貼上鈕,將選取內容複製過來,再轉到Word文件,停於要插入交叉表之位
7、置。按,將表格安排成置中格式,將其外框安排為雙線、內框為單線之表格,修飾一下表格之對齊方式,將表格安排成置中格式,將其外框安排為雙線、內框為單線之表格,,往後,即可於表格之下,輸入分析結果的文字內容:,往後,即可於表格之下,輸入分析結果的文字內容:,百分比,交叉表的百分比有三種:,百分比交叉表的百分比有三種:,橫列(R)求以橫向總計為分母之百分比,橫列(R)求以橫向總計為分母之百分比,直行(C)求以縱向總計為分母之百分比,直行(C)求以縱向總計為分母之百分比,總和(T)求以總樣本數為分母之百分比,總和(T)求以總樣本數為分母之百分比,此三種選擇,甚至可同時並存:,此三種選擇,甚至可同時並存:,
8、不過,為方便撰寫報告,通常僅選取所要之一種即可。有時,由於解釋時,通常以百分比進行說明,故也經常省略其觀察值(O),只顯示某一百分比而已。如:,不過,為方便撰寫報告,通常僅選取所要之一種即可。有時,由於解,以前文所述之操作步驟,將其轉到Word,於撰寫報告時,再配合上最底下所加入之該欄總樣本數,也可約略判讀出各儲存格內之樣本數:,以前文所述之操作步驟,將其轉到Word,於撰寫報告時,再配合,卡方檢定-傳統作法,對於單選題之交叉表,通常得進行卡方獨立性檢定。以前文政黨傾向交叉地區別資料為例,其虛無假設(H0)與對立假設(H1)為:H0:政黨傾向與地區別無關H1:兩者有關=0.05傳統之作法為,先
9、計算卡方值,其運算公式為:,卡方檢定-傳統作法對於單選題之交叉表,通常得進行卡方獨立性,即讓每一格觀察值減去其期望值,求平方,再除以其期望值,將這些值逐一加總,即為卡方值:其內之每一格期望值的算法為:欄% 列% 總樣本數以第一列第一欄為例,其期望值為:45% 22.8% 1000102.6,即讓每一格觀察值減去其期望值,求平方,再除以其期望值,將這些,計算出卡方值為32.743後,再計算自由度:(r-1)*(c-1)r為列數、c為欄數。本例之自由度為3515。最後,依自由度查附錄一 卡方分配的臨界值,比較所計算之卡方值,是否超過所指定顯著水準(=0.05)的臨界值?若超過,則應棄卻欄變數與列變
10、數並無關聯之虛無假設。反之,則否。查附錄一 卡方分配的臨界值,於自由度15、=0.05,其臨界值為25.00。而我們所求算出之卡方值32.74325.00,故應棄卻政黨傾向與地區別無關之虛無假設。也就是說,政黨支持率會隨地區別不同而有顯著差異。,計算出卡方值為32.743後,再計算自由度:,卡方檢定-利用SPSS,利用SPSS則不必那麼辛苦,不僅會算出卡方值,還顯示出此卡方值之顯著性,不用經過查表即可判斷出檢定結果。只須於建立過程之交叉表對話方塊:,卡方檢定-利用SPSS利用SPSS則不必那麼辛苦,不僅會算,按 鈕,選擇要求得卡方統計量(H),按 鈕,選擇要求得卡方統計,按繼續鈕,回上一層對話
11、方塊。再按確定鈕,則除了顯示原交叉表外還可獲致卡方檢定之結果:其卡方值為32.743,顯著性(雙尾)為0.005。,按繼續鈕,回上一層對話方塊。再按確定鈕,則除了顯示原,判斷檢定結果時很簡單,只須看此顯著性是否小於所指定顯著水準之值。若是,即表示交叉表兩個變項間存有顯著關聯,可省去查表之麻煩。本例,由於其顯著性0.005=0.05,所以應棄卻政黨傾向與地區別無關之虛無假設。故而,我們判定政黨支持率與居住地區存有顯著關聯。,判斷檢定結果時很簡單,只須看此顯著性是否小於所指定顯著水準之,判讀並解釋,判讀表內那一個百分比較值得注意並解釋,於求縱向百分比之表內,應以橫向進行觀察。可拿一把尺來一橫,找出
12、該列幾個較高之百分比即可。若該列之總百分比太低,也可以不予分析:,判讀並解釋判讀表內那一個百分比較值得注意並解釋,於求縱向百分,分析時,先就最右側之總百分比,做一概述:整體言,受訪者中,以無政黨傾向者居最高(28.1%)。有明顯政黨傾向之受訪者中,以民進黨的支持率最高(22.8%),其次依序為國民黨(20.4%)、親民黨(19.6%)、台聯(5.5%)、新黨(3.6%)。然後,對各欄之數字高低,依序說明一下:經由卡方檢定,其顯著性0.005=0.05,應棄卻政黨傾向與地區別無關之虛無假設。亦即,政黨支持率與居住地區存有顯著關聯。以地區別來看,北區主要是支持國民黨與親民黨(22.4%與20.2%
13、),中區是親民黨(22.5%)與民進黨(21.5%)略勝於國民黨(18.5%),南區是民進黨獨大(31.7%),東區則還是國民黨(30.0%)與親民黨的天下(20.0%)。,分析時,先就最右側之總百分比,做一概述:,最後,才對以橫向進行觀察,所標出之各該列的幾個較高之百分比進行說明:以所支持之政黨別來看,民進黨之支持者主要集中於南區;國民黨與親民黨等泛藍政黨之支持者主要集中於北區與東區。而值得注意的是:居最多數之無政黨傾向者,也是以北部多於中區與南區,這些人才是將來各黨要爭取之主要對象。,最後,才對以橫向進行觀察,所標出之各該列的幾個較高之百分比進,應注意下列事項,卡方檢定僅適用於類別資料(名
14、目變數,如:性別、地區、政黨傾向、宗教信仰、是否有手機、)。各儲存格之期望次數不應少於5。通常要有80%以上的儲存格期望次數5,否則會影響其卡方檢定的效果。若有期望次數小於5時,可將其合併。,應注意下列事項卡方檢定僅適用於類別資料(名目變數,如:性別、,由於,各儲存格之期望次數不應少於5。通常要有80以上的儲存格期望次數5,否則會影響其卡方檢定的效果。故而,SPSS之卡方檢定結果,會於最底下計算期望值5之儲存格比例:,由於,各儲存格之期望次數不應少於5。通常要有80以上的儲存,本例,期望值(個數)5之儲存格比例,僅8.3%而已,故並無需進行任何調整。萬一,本例發生有期望值5之儲存格比例達20%
15、以上之情形,要進行合併時,也應將政黨性質相近者進行合併。如,將台聯併入民進黨組成一新的集合:泛綠;而將國民黨、親民黨與新黨組成一新的集合:泛藍。另外一種,避免期望值5之儲存格比例達20%以上的處理方法為:將樣本數比較少之台聯與新黨排除於分析之外。但這樣的作法較受爭議,因為無法表示出這兩黨之支持者的現象!,本例,期望值(個數)5之儲存格比例,僅8.3%而已,故並無,縮減組數-組距分組,無論是文字或數字,於交叉表中,均是將不重複出現之內容視為一個類別,去求算交叉表之相關統計數字。當碰上重複性較低之數字,很可能每一個數值均是唯一,而產生幾乎無法縮減其類別之情況。如,運動時間.sav資料:,縮減組數-
16、組距分組無論是文字或數字,於交叉表中,均是將不重,以分析(A)/描述性統計(E)/交叉表(C)求性別對運動時間之交叉表:,以分析(A)/描述性統計(E)/交叉表(C)求性別對運,其結果,有很多種運動時間係獨立存在,產生一列內容。由於組數太多,於資料分析時並無多大作用:,其結果,有很多種運動時間係獨立存在,產生一列內容。由於組數太,較理想之方式為:將毎次運動時間分組,以縮減其組數。若以轉換(T)/重新編碼(R)/成不同變數(D),將毎次運動時間分為030、3160、6190、91120與121五組:,較理想之方式為:將毎次運動時間分組,以縮減其組數。若以轉換,將重新編碼結果安排到時間分組:,將重
17、新編碼結果安排到時間分組:,續以時間分組與性別重建一次交叉表:,續以時間分組與性別重建一次交叉表:,即可得到經縮減組數後之交叉表:,即可得到經縮減組數後之交叉表:,期望值個數5之儲存格比例為10%,並未超過20%。表格無須再行合併以縮減組別。卡方值為11.312,自由度為4,其顯著水準0.023=0.05。所以,應棄卻運動時間長短與性別無關之虛無假設。,期望值個數5之儲存格比例為10%,並未超過20%。表格無須,由表可知,全體受訪者運動時間主要以91120分鐘居多30.4%。交叉分析後,可發現男性之運動時間主要以91120分鐘居多(33.9%);而女性之運動時間主要以030分鐘居多(33.9%
18、)。就相對比例言,在較長之運動時間部份(3160、91120分鐘與120分鐘)的比例,男性明顯高過女性;而女性則在較短之運動時間部份(031與6190分鐘)的比例,明顯高過男性。可見男性之運動時間普遍較女性來得長一點!,由表可知,全體受訪者運動時間主要以91120分鐘居多30.,馬上練習,針對手機月費.sav。注意,有手機欄若為2,即表示未使用手機,其月費當然為0,並不必將其納入交叉表。以轉換(T)/重新編碼(R)/成不同變數(D),將月費分為0200、201400、401600、601四組。求手機月費對性別交叉表,並以卡方檢定兩者是否存有顯著關聯?,馬上練習針對手機月費.sav。注意,有手機
19、欄若為2,,縮減類別,進行交叉分析表時,通常要有80以上的儲存格期望次數5,否則會影響卡方檢定的效果。若有期望次數小於5時,可將其合併。如,手機.sav之資料:,縮減類別進行交叉分析表時,通常要有80以上的儲存格期望次數,以手機廠牌交叉性別後,其結果為將無手機者(其手機廠牌=0)均納入分析,故資料並不正確;且一些廠牌的出現次數並不高。,以手機廠牌交叉性別後,其結果為將無手機者(其手機廠,此外,其卡方檢定之結果顯示期望次數5者有50%,超過20%,故得將組數進行縮減。,此外,其卡方檢定之結果顯示期望次數5者有50%,超過20%,首先,執行轉換(T)/重新編碼(R)/成不同變數(D),先將答案為5
20、9者合併為9.其他(因其等之次數最高僅為5而已),存入另一新變數廠牌分組:,首先,執行轉換(T)/重新編碼(R)/成不同變數(D),以縮減其組數,並將廠牌分組答案為0設定為遺漏值,將其排除掉:,以縮減其組數,並將廠牌分組答案為0設定為遺漏值,將其排除,續以廠牌分組與性別重建一次交叉表:,續以廠牌分組與性別重建一次交叉表:,即可得到經縮減組數後之交叉表:,即可得到經縮減組數後之交叉表:,期望值個數5之儲存格比例為0%,表格無須再行合併以縮減組別。本例之卡方值為6.033,自由度為4,其顯著水準0.197=0.05。所以,無法棄卻使用之手機廠牌與性別無關之虛無假設。,期望值個數5之儲存格比例為0%
21、,表格無須再行合併以縮減組別,撰寫報告時,對於卡方檢定結果顯示兩變數間無關之交叉分析表,僅須就其最右側之欄百分比進行解釋即可:整體言,受訪(者所使用之手機廠牌,主要以Nokia為最高(42.9%),其次為Motorola(20.2%);再其次為SAGEN(12.6%)與ERICSSON(11.8%)。由於兩者無關,就不必再對交叉結果進行說明了!(通常,於報告中也會將此交叉表省略,以縮減篇幅。僅敘述一下其檢定結果並不顯著即可),撰寫報告時,對於卡方檢定結果顯示兩變數間無關之交叉分析表,僅,長條圖,於執行交叉表分析之同時,亦可繪製長條圖。只須於建立過程之交叉表對話方塊,選擇顯示集群長條圖(B):,長條圖於執行交叉表分析之同時,亦可繪製長條圖。只須於建立過程,則可另顯示一長條圖,以方便判讀分析結果:,則可另顯示一長條圖,以方便判讀分析結果:,