SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 卡方檢驗(yàn)是數(shù)據(jù)分析的重要手段之一,它可以用來(lái)檢驗(yàn)數(shù)據(jù)的適合度和相關(guān)性,IBM SPSS Statistics中也為用戶提供了各類卡方檢驗(yàn)的項(xiàng)目。
接下來(lái)將為大家介紹的就是使用IBM SPSS Statistics對(duì)數(shù)據(jù)樣本進(jìn)行適合度檢驗(yàn)時(shí)產(chǎn)生的結(jié)果的分析方法。
一、概述
1.卡方檢驗(yàn)

圖1:卡方檢驗(yàn)功能位置
當(dāng)需要研究某一類別變量的實(shí)際觀察次數(shù)和理論次數(shù)是否一致時(shí),就可以利用卡方檢驗(yàn)來(lái)實(shí)現(xiàn),這是一種單因子檢驗(yàn)。
2.數(shù)據(jù)樣本
圖2:數(shù)據(jù)樣本
比如我們這里用到的數(shù)據(jù)樣本是:一個(gè)事件存在三種發(fā)展方向,三個(gè)方向發(fā)生的機(jī)會(huì)均等且概率和為1,那么它們的理論發(fā)生次數(shù)就是相等的,概率各為三分之一,上圖是實(shí)際觀測(cè)到的次數(shù)。
如果要檢驗(yàn)實(shí)際觀測(cè)次數(shù)和理論次數(shù)的適合度如何,就可以使用SPSS的卡方檢驗(yàn)來(lái)實(shí)現(xiàn)。
二、結(jié)果分析
1.檢驗(yàn)
圖3:設(shè)計(jì)卡方檢驗(yàn)
按上圖所示方法設(shè)計(jì)卡方檢驗(yàn)的項(xiàng)目,這樣的設(shè)計(jì)方法是針對(duì)我們這里使用的各水平機(jī)會(huì)均等的數(shù)據(jù)樣本的,如果是其他類型的樣本,項(xiàng)目設(shè)計(jì)會(huì)有所不同。
2.結(jié)果分析
圖4:頻率結(jié)果
在輸出日志窗口,我們可以看到有兩個(gè)結(jié)果表格。第一個(gè)表格是頻率統(tǒng)計(jì),第一列是實(shí)際觀測(cè)到的數(shù)據(jù),第二列是計(jì)算出的期望數(shù)值(機(jī)會(huì)均等,所以就是總個(gè)數(shù)的平均值),第三列是實(shí)測(cè)數(shù)據(jù)和期望數(shù)值的差值,也就是殘差,殘差的絕對(duì)值越大,前兩列的數(shù)據(jù)偏離度越大。
表中數(shù)據(jù)顯示,方向2的殘差較小,數(shù)據(jù)的偏離度較小,關(guān)聯(lián)度較大;方向1和3則偏離度較大,存在顯著差異。
圖5:檢驗(yàn)統(tǒng)計(jì)
第二個(gè)表格是系統(tǒng)計(jì)算出的卡方、自由度和顯著性,這里顯示卡方值為10.417,自由度為2,顯著性系數(shù),也就是我們常說(shuō)的p值是0.005,下面標(biāo)注了期望小于5的單元格為0,最小期望是46.7,對(duì)于本樣本來(lái)說(shuō),這里的p值意義更大一點(diǎn)。
p值大于0.05時(shí),則表示數(shù)據(jù)之間沒(méi)有顯著差異,由于本例中p值(0.005)遠(yuǎn)小于0.05,所以卡方檢驗(yàn)的結(jié)果就是觀測(cè)值與理論值之間存在顯著差異,主要表現(xiàn)在方向1和方向3的數(shù)據(jù)上。
三、小結(jié)
這篇文章中我們主要介紹了SPSS卡方檢驗(yàn)用來(lái)檢驗(yàn)適合度時(shí),對(duì)各水平機(jī)會(huì)均等的數(shù)據(jù)樣本該如何設(shè)計(jì)并進(jìn)行結(jié)果分析,這是卡方檢驗(yàn)中較為基礎(chǔ)的一種,充分了解可以為更深入的卡方檢驗(yàn)打下基礎(chǔ),希望可以對(duì)大家有所幫助!
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |