win7系統(tǒng)下載
當(dāng)前位置: 首頁 > 硬件軟件教程 > 詳細(xì)頁面

如何應(yīng)用SPSS探索性區(qū)分(SPSS迅速檢查數(shù)據(jù)異常值)

發(fā)布時間:2025-05-04 文章來源:xp下載站 瀏覽:

SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險等多個研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。

探索性分析中比較常用的功能是,通過數(shù)據(jù)過濾的功能,如分析數(shù)據(jù)中的極值、平均值、方差等,識別數(shù)據(jù)中的異常值;或使用檢驗的方法,判斷后續(xù)使用的統(tǒng)計分析方法是否合適等,比如數(shù)據(jù)的正態(tài)分布假設(shè)是否成立。

一、示例數(shù)據(jù)

本文中,我們將會分析一組包含性別、客單價的數(shù)據(jù)。

通過探索性分析,查看數(shù)據(jù)中是否存在一些異常值,以及檢驗不同性別的客單價數(shù)據(jù)是否符合正態(tài)分布。

為什么要檢驗數(shù)據(jù)是否正態(tài)分布?這是因為在一些相關(guān)性分析(或其他分析)中,是以數(shù)據(jù)正態(tài)分布為前提進(jìn)行統(tǒng)計分析的,如果數(shù)據(jù)不滿足正態(tài)分布的假設(shè),分析得出的結(jié)果就會不準(zhǔn)確。

示例數(shù)據(jù)

圖1:示例數(shù)據(jù)

二、應(yīng)用探索性分析

如圖2所示,我們先打開IBM SPSS Statistics的探索分析選項(分析-描述統(tǒng)計-探索),然后再逐步演示操作。

探索性分析

圖2:探索性分析

1、選擇變量

如圖3所示,探索分析設(shè)置面板中的選項含義如下:

1. 因變量列表,即隨自變量變化的數(shù)值,本例中選取客單價作為因變量

2. 因子列表,用于定義個案組,可選擇一個或多個因子變量,本例中選取性別

3. 個案標(biāo)注依據(jù),用于標(biāo)記個案,本例中選取賬號

通過以上的設(shè)置,我們將會獲取到不同性別客單價的探索性分析結(jié)果。

頻率分析中的圖表功能

圖3:頻率分析中的圖表功能

2、應(yīng)用統(tǒng)計分析

完成變量的選擇后,單擊右側(cè)的統(tǒng)計,開啟如圖4所示的統(tǒng)計面板,其中的數(shù)值應(yīng)用如下:

1. 描述,提供了平均值、中位數(shù)、方差、最大值、偏度等統(tǒng)計數(shù)值,可設(shè)置平均值的置信區(qū)間

2. M-估計量,為每個個案的數(shù)值應(yīng)用權(quán)重,有助于減少極端值、異常值對平均值和中位數(shù)的影響

3. 離群值,即極值的分析,包含最大值、最小值

4. 百分位數(shù),可將排序后的數(shù)據(jù)進(jìn)行指定百分位值分組

本例中,我們選取了描述、M-估計值與離群值的數(shù)值。

探索性統(tǒng)計分析選項

圖4:探索性統(tǒng)計分析選項

3、解讀統(tǒng)計分析結(jié)果

從分析結(jié)果來看,如圖5所示,當(dāng)前數(shù)據(jù)包含了50個男性客單價個案,以及49個女性客單價個案。

頻數(shù)統(tǒng)計

圖5:頻數(shù)統(tǒng)計

如圖6所示,從描述數(shù)據(jù)可以看到,男性的客單價平均值為100.8,而女性客單價平均值僅為47.6

而男性客單價平均值的95%置信區(qū)間上限中,平均值達(dá)到188,說明存在一些極端值,進(jìn)一步查看最大值數(shù)據(jù),發(fā)現(xiàn)最大值達(dá)到2000。

描述性數(shù)值

圖6:描述性數(shù)值

這個最大值2000是單個個案,還是多個個案呢?另外,除了最大值外,是否存在其他極端值。為了解答以上問題,我們可以進(jìn)一步查看極值分析。

如圖7所示,可以看到,男性客單價中,賬號77與賬號85的客單價都屬于極端值。

極值分析

圖7:極值分析

為了避免這些極值的影響,我們可以查看M估計量。如圖8所示,經(jīng)過M估計量的加權(quán)后,男性客單價平均值就變得比較正常了。

M估計值

圖8:M估計值

綜上所示,通過IBM SPSS Statistics探索性分析的描述性統(tǒng)計數(shù)值,可獲取到數(shù)據(jù)的平均值、極值等統(tǒng)計數(shù)值,有助于檢查數(shù)據(jù)中的異常值情況。


世界上許多有影響的報刊雜志就SPSS給予了高度的評價。
當(dāng)前原文鏈接:http://m.91mp3.cn/soft2/soft-73297.html
主站蜘蛛池模板: 亚洲性感综合欧美| 日韩无码系列综合区| 97SE亚洲国产综合自在线观看| 久久亚洲高清综合| 色综合久久久久久久久五月| 久久综合久久综合久久| 亚洲AV成人潮喷综合网| 狼狼综合久久久久综合网| 欧美αv日韩αv另类综合 | 久久青青色综合| 日韩欧美色综合网站| 狠狠色综合久色aⅴ网站| 久久影院综合精品| 一本色道久久88精品综合| 狠狠色丁香婷婷综合久久来来去| 亚洲伊人久久成综合人影院| 国产成人亚洲综合无码精品| 色综合网站国产麻豆| 狠狠综合久久综合88亚洲| 激情综合色五月丁香六月亚洲| 一本色道久久88综合日韩精品| 天天做天天爱天天爽综合网| 久久综合色区| 亚洲综合色成在线播放| 久久综合狠狠综合久久综合88| 91欧美一区二区三区综合在线| 亚洲精品二区国产综合野狼| 久久综合噜噜激激的五月天| 狠狠色狠狠色综合| 在线综合亚洲欧美网站| 久久91精品久久91综合| 色综合久久中文字幕综合网| 亚洲欧美日韩综合一区| 欧美日韩亚洲综合一区二区三区| 亚洲 欧美 综合 高清 在线| 色综合综合色综合色综合| 一本色综合久久| 一本大道久久a久久精品综合 | 色综合中文字幕| 成人综合伊人五月婷久久| 色综合色综合色综合色欲|