在數據分析的時候,一般首先要對數據進行描述性統計分析(Descriptive Analysis),以發現其內在的規律,再選擇進一步分析的方法。描述性統計分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布、以及一些基本的統計圖形。
(1)數據的頻數分析:在數據的預處理部分,我們曾經提到利用頻數分析和交叉頻數分析來檢驗異常值。此外,頻數分析也可以發現一些統計規律。比如說,收入低的被調查者用戶滿意度比收入高的被調查者高,或者女性的用戶滿意度比男性低等。不過這些規律只是表面的特征,在后面的分析中還要經過檢驗。
(2)數據的集中趨勢分析:數據的集中趨勢分析是用來反映數據的一般水平,常用的指標有平均值、中位數和眾數等。各指標的具體意義如下:
平均值:是衡量數據的中心位置的重要指標,反映了一些數據必然性的特點,包括算術平均值、加權算術平均值、調和平均值和幾何平均值。
中位數:是另外一種反映數據的中心位置的指標,其確定方法是將所有數據以由小到大的順序排列,位于中央的數據值就是中位數。
眾數:是指在數據中發生頻率最高的數據值。
如果各個數據之間的差異程度較小,用平均值就有較好的代表性;而如果數據之間的差異程度較大,特別是有個別的極端值的情況,用中位數或眾數有較好的代表性。
(3)數據的離散程度分析:數據的離散程度分析主要是用來反映數據之間的差異程度,常用的指標有方差和標準差。方差是標準差的平方,根據不同的數據類型有不同的計算方法。
(4)數據的分布:在統計分析中,通常要假設樣本的分布屬于正態分布,因此需要用偏度和峰度兩個指標來檢查樣本是否符合正態分布。偏度衡量的是樣本分布的偏斜方向和程度;而峰度衡量的是樣本分布曲線的尖峰程度。一般情況下,如果樣本的偏度接近于0,而峰度接近于3,就可以判斷總體的分布接近于正態分布。
(5)繪制統計圖:用圖形的形式來表達數據,比用文字表達更清晰、更簡明。在SPSS軟件里,可以很容易的繪制各個變量的統計圖形,包括條形圖、餅圖和折線圖等。
示例 SIM手機描述性統計分析
為簡化起見,我們只分析SIM手機用戶滿意調查中的兩個變量:“總體感知質量”和“總體滿意度”變量。
(1)數據的頻數分析
用SPSS軟件的頻數分析可以很容易地畫出兩個變量的頻數圖:
javascript:if(this.width>740)this.width=740" border=undefined>
兩個變量的頻數圖表明:大部分被調查者對SIM手機的質量評價較高,總體感覺比較滿意,打分在8-10分之間。
(2)數據的集中趨勢分析
利用SPSS的描述性統計分析,計算SIM手機“總體感知質量”和“總體滿意度”的平均值、中位數和眾數:
|
總體感知質量 |
總體滿意度
|
N |
200
|
200
|
Mean |
7.11
|
7.43
|
Median |
8
|
8
|
Mode |
8
|
8
|
共有200個(N)被調查者參與了SIM手機調查;總體感知質量均值(Mean)7.11分、中位數(Median)8分、眾數(Mode)8分;總體滿意度均值7.43分、中位數8分、眾數8分,與前面的頻數分析結果一致。
(3)數據的離散程度和分布分析:
同樣利用SPSS軟件的描述性統計分析,可以得出SIM手機的離散程度和分布指標:
|
總體感知質量 |
總體滿意度 |
N |
200
|
200
|
Std. Deviation |
2.36
|
2.29
|
Variance |
5.56
|
5.25
|
Skewness |
-0.961
|
-0.988
|
Kurtosis |
0.358
|
0.437
|
“總體感知質量”變量的標準差(Std. Deviation) 2.36、方差(Variance) 5.56;“總體滿意度”標準差2.29、方差5.25,說明不同樣本對兩個變量打分的差異程度不大,或者說不同樣本對SIM手機評價的差異不大?!翱傮w感知質量”變量的偏度(Skewness)-0.961、峰度(Kurtosis)0.358;“總體滿意度”變量偏度-0.988、峰度0.437,說明數據不符合正態分布
原文轉自:http://www.anti-gravitydesign.com