当前位置：文档之家› spss描述性统计

spss描述性统计

中位数
• 中位数（median；或以Mdn表示）
– 又称为中数、百分等级为50的百分位数（P50）或第二四分位数（Q2; second quartile）。 – 将某一个变项的数据依大至小或由小至大排列，取位居最中间、或能够均匀对分全体观察值的分数 – 在中位数之上与之下，各有50%的观察值。
平均数
• 平均数（mean；以M表示）
– 取某一变项的所有数值的总和除以观察值个数所得到的值 – 因为是将数据直接以数学算式来计算平均值，又称为算术平均数（arithmetic mean）。 – 母体资料得出的平均数需以希腊字μ表示
X N
第一节
X X N
第八章描述统计
5/31
☆ 量化研究與統計分析…….
不受極值外的個別分數影響，計算方法簡便，適用於所有的測量尺度測量過於粗糙，無法反映所有樣本的狀況。
離散量數四分差

對極端值較不敏感, 但能表現順序尺度的變異情形無法反映所有樣本的變異狀況。
標準差/變異數

測量最為精密，考慮到每一個樣本，具有代表性。易受偏離與極端值的影響。
R X max X min
第二节
第八章描述统计
11/31
☆ 量化研究與統計分析…….
四分差
• 四分差（semi-interquartile range; QR）
– 是一组数据当中的第三四分位数（区隔高分端的前25%的分数，简称Q3）与第一四分位数（区隔低分端的后25%的分数，简称Q1）距离的一半 – 中间百分之五十的样本分数差距的二分之一
– 百分等级的计算必须以分组资料的方式来整理资料 – 百分等级的换算，必须以公式来计算之
X X L 100 PR cf L fx i N
第四节
第八章描述统计
24/31
☆ 量化研究與統計分析…….
标准分数
• 标准分数（standard scores）
負偏態
正偏態
對稱分配
第三节
第八章描述统计
17/31
☆ 量化研究與統計分析…….
地板与天花板效应
• 地板效应（floor effect）
– 指数据多数集中在偏低的一端，但在高分端则有极端值，分数不容易突破低分端，但会往高分端延伸，彷徂有一个地板（或真的存在一个低分限制条件）阻挡了数据往低分移动。 – 由于地板阻隔作用，地板效应常伴随正偏态现象。
( X X ) 4 Kurtosis s4
– 系数可利用Z考验来判定统计显著性 – Z值绝对值大于1.96时（设定为.05），即可推论S系数或K系数显著不等于0，也就是变项呈现非常态，常态化假设遭到违反。
S 0 S z SS 6 N
第三节
K 0 K z SK 24 N
– 用来描述观察值在某一个变项上的分数分散情形的统计量 – 描述统计中，集中量数必须搭配变异量数，才能反应一组数据的分布特征 – 常用的变异量数包括全距、四分差、变异数及标准差
第二节
第八章描述统计
10/31
☆ 量化研究與統計分析…….
全距
• 全距（range）
– 一组分数中最大值（Xmax）与最小值（Xmin）之差 – 是一群分数变异情形最粗略的指标 – 全距容易计算，适用性高，可以应用在名义变项与顺序变项，来求出变项当中类别的多寡。 – 缺点是不精确也不稳定，无法反应一个分配的每个数值的状态。
第二节
第八章描述统计
16/31
☆ 量化研究與統計分析…….
偏态（Skewness）
• 描述一个变项的对称性（symmetry）的量数称为偏态系数 • 不对称的资料称为偏态资料，依其方向可分为负偏（negatively skewed）（或左偏，即左侧具有偏离值）、正偏（positively skewed）（或右偏，即右侧具有偏离值）与对称（symmetrical）三种情形
50、55、60、60、60、65、66、70、90
第一节
第八章描述统计
7/31
☆ 量化研究與統計分析…….
集中量数的特性与优缺点比较
集中量數測量層次眾數中位數平均數
名義順序等距/比率優點缺點
不受偏離值的影響，對數值變化不敏感，較測量最為精密，考慮計算方法簡便。不受極端值影響，計算到每一個樣本，具有方法尚稱簡便代表性。測量過於粗糙，無法無法反應所有樣本的狀易受偏離極端值的影反應所有樣本況。響。
• 离均差平方和（sum of squares; SS）
– SS的概念可以类比为面积的概念，表示分数与平均数变异的面积和 (பைடு நூலகம் X i ) 2 2 2 2 SS ( X i ) SS ( X i X ) X i N
第二节
第八章描述统计
13/31
☆ 量化研究與統計分析…….
第八章描述统计
3/31
☆ 量化研究與統計分析…….
集中量数
• 集中量数（measures of central location）
– 用以描述一组数据或一个分配集中点的统计量数 – 一个能够描述数据的共同落点的指标。 – 常用的集中量数有平均数、中位数及众数
第一节
第八章描述统计
4/31
☆ 量化研究與統計分析…….
• 天花板效应（ceiling effect）
– 则与负偏态有关，是指数据多数集中在偏高的一端，但在低分端则有极端值，分数不容易突破高分端，彷徂有一个天花板（或真的存在一个高分限制条件）阻挡了数据往高分移动。
第三节
第八章描述统计
18/31
☆ 量化研究與統計分析…….
峰度（Kurtosis）
– 利用线性转换的原理，将一组数据转换成不具有实质的单位与集中性的标准化分数。 – 不同的标准分数，其共通点是利用一个线性方程式 y=bx+a进行集中点的平移与重新单位化，使得不同量尺与不同变项的测量数据具有相同的单位与相同的集中点，因此得以相互比较。
☆ 量化研究與統計分析…….
变异数的不偏估计数
• 标准差与变异数的不偏估计数的主要差别在于分母项为N1而非原来的N • N-1称为自由度（degree of freedom；df），表示一组分数当中，可以自由变动的分数的个数。 • 在离均差的计算上，自由度为样本数减1，表示在N个观察值中，只有N-1个数字可以自由运用于离均差的计算。
50、55、60、60、60、65、66、70、90 50、55、60、60、60、65、66、70、90 、95
62.5
第一节
第八章描述统计
6/31
☆ 量化研究與統計分析…….
众数
• 众数（mode；或以Mo表示）
– 一组分数中，出现次数最多的一个分数 – 一组数据中最典型（typical）的数值或次数分配最高点所对应的分数 – 是各集中量数当中，最容易辨认的量数 – 一个分配有两个分数具有相同的最高次数，此时即出现了双众数，称为双峰分配（bimodal distribution）
第四节
第八章描述统计
22/31
☆ 量化研究與統計分析…….
百分等级与百分位数
• 百分等级（percentile rank; PR）
– 系指观察值在变项上的分数在团体中所在的等级 – 在一百个人中，该分数可以排在第几个等级。 – 例如PR＝50代表某一个分数在团体中可以胜过50％的人，他的分数也恰好是中位数。
2 ( X X ) SS i ˆ2 s2 N 1 N 1
ˆ s
第二节
SS N 1
( X i X ) 2 N 1
15/31
第八章描述统计
☆ 量化研究與統計分析…….
变异量数的特性与优缺点比较
測量層次全距名義順序等距/比率優點缺點

第八章描述统计
21/31
☆ 量化研究與統計分析…….
相对量数
• 数据的解读：
– 绝对意义：由数值大小反应 – 相对意义：需从相对比较，甚至于进行变项数据的标准化，才能对于数据的意义进行正确解读。
• 相对量数或相对地位量数（measures of relative position）
– 描述个别观察值在团体中所在相对位置的统计量 – 将某特定观察值在样本中所处的位置，以其他分数进行参照，计算出观察值在该变项上分数的团体地位（位置） – 常用的相对量数包括百分等级,百分位数,标准分数
– 百分等级是将原始分数转化为等级（百分比） – 百分位数则是由某一等级来推算原始分数
第四节
第八章描述统计
23/31
☆ 量化研究與統計分析…….
百分等级与百分位数的计算
• 样本数少时
– 将资料依序排列，算出累积百分比，即可对应出每一分数的百分等级 – 亦可从百分等级推算出各特定百分位数
• 样本数大时
(Q3 Q1 ) QR 2
第二节
第八章描述统计
12/31
☆ 量化研究與統計分析…….
离均差与平方和
• 离均差
– 一组数据中，各分数与平均数的距离，通常以小写的x 来表示 deviation score= x =(X - μ) – 当离均差为正值时，表示分数落在平均数的右方 – 离均差为负值时，表示分数落在平均数的左方 – 平均数是每一个分数加总后的平均值，为一组分数的重心位置
偏態正偏態負偏態對稱偏態係數 g1 > 0 g1 < 0 g1 = 0 峰度高狹峰低闊峰常態峰峰度係數 g2 > 0 g2 < 0 g2 = 0
第三节

e商务文档

spss描述性统计

相关文档推荐：