spss描述性统计
中位数
• 中位数(median;或以Mdn表示)
– 又称为中数、百分等级为50的百分位数(P50) 或第二四分位数(Q2; second quartile)。 – 将某一个变项的数据依大至小或由小至大排列, 取位居最中间、或能够均匀对分全体观察值的 分数 – 在中位数之上与之下,各有50%的观察值。
平均数
• 平均数(mean;以M表示)
– 取某一变项的所有数值的总和除以观察值个数 所得到的值 – 因为是将数据直接以数学算式来计算平均值, 又称为算术平均数(arithmetic mean)。 – 母体资料得出的平均数需以希腊字μ表示
X N
第一节
X X N
第八章 描述统计
5/31
☆ 量化研究與統計分析…….
不受極值外的個別分數 影響,計算方法簡便, 適用於所有的測量尺度 測量過於粗糙,無法反 映所有樣本的狀況。
離 散 量 數 四分差
對極端值較不敏感, 但能表現順序尺度 的變異情形 無法反映所有樣本 的變異狀況。
標準差/變異數
測量最為精密 , 考慮 到每一個樣本 , 具有 代表性。 易受偏離與極端值 的影響。
R X max X min
第二节
第八章 描述统计
11/31
☆ 量化研究與統計分析…….
四分差
• 四分差(semi-interquartile range; QR)
– 是一组数据当中的第三四分位数(区隔高分端 的前25%的分数,简称Q3)与第一四分位数 (区隔低分端的后25%的分数,简称Q1)距 离的一半 – 中间百分之五十的样本分数差距的二分之一
– 百分等级的计算必须以分组资料的方式来整理资料 – 百分等级的换算,必须以公式来计算之
X X L 100 PR cf L fx i N
第四节
第八章 描述统计
24/31
☆ 量化研究與統計分析…….
标准分数
• 标准分数(standard scores)
負偏態
正偏態
對稱分配
第三节
第八章 描述统计
17/31
☆ 量化研究與統計分析…….
地板与天花板效应
• 地板效应(floor effect)
– 指数据多数集中在偏低的一端,但在高分端则有极端 值,分数不容易突破低分端,但会往高分端延伸,彷 徂有一个地板(或真的存在一个低分限制条件)阻挡 了数据往低分移动。 – 由于地板阻隔作用,地板效应常伴随正偏态现象。
( X X ) 4 Kurtosis s4
– 系数可利用Z考验来判定统计显著性 – Z值绝对值大于1.96时(设定为.05),即可推 论S系数或K系数显著不等于0,也就是变项呈 现非常态,常态化假设遭到违反。
S 0 S z SS 6 N
第三节
K 0 K z SK 24 N
– 用来描述观察值在某一个变项上的分数分散情 形的统计量 – 描述统计中,集中量数必须搭配变异量数,才 能反应一组数据的分布特征 – 常用的变异量数包括全距、四分差、变异数及 标准差
第二节
第八章 描述统计
10/31
☆ 量化研究與統計分析…….
全距
• 全距(range)
– 一组分数中最大值(Xmax)与最小值(Xmin) 之差 – 是一群分数变异情形最粗略的指标 – 全距容易计算,适用性高,可以应用在名义变 项与顺序变项,来求出变项当中类别的多寡。 – 缺点是不精确也不稳定,无法反应一个分配的 每个数值的状态。
第二节
第八章 描述统计
16/31
☆ 量化研究與統計分析…….
偏态(Skewness)
• 描述一个变项的对称性(symmetry)的量数称为偏态系数 • 不对称的资料称为偏态资料,依其方向可分为负偏 (negatively skewed)(或左偏,即左侧具有偏离值)、 正偏(positively skewed)(或右偏,即右侧具有偏离值) 与对称(symmetrical)三种情形
50、55、60、60、60、65、66、70、90
第一节
第八章 描述统计
7/31
☆ 量化研究與統計分析…….
集中量数的特性与优缺点比较
集 中 量 數 測量層次 眾數 中位數 平均數
名義 順序 等距/比率 優點 缺點
不受偏離值的影響, 對數值變化不敏感,較 測量最為精密,考慮 計算方法簡便。 不受極端值影響,計算 到每一個樣本,具有 方法尚稱簡便 代表性。 測量過於粗糙,無法 無法反應所有樣本的狀 易受偏離極端值的影 反應所有樣本 況。 響。
• 离均差平方和(sum of squares; SS)
– SS的概念可以类比为面积的概念,表示分数与平均数 变异的面积和 (பைடு நூலகம் X i ) 2 2 2 2 SS ( X i ) SS ( X i X ) X i N
第二节
第八章 描述统计
13/31
☆ 量化研究與統計分析…….
第八章 描述统计
3/31
☆ 量化研究與統計分析…….
集中量数
• 集中量数(measures of central location)
– 用以描述一组数据或一个分配集中点的统计量 数 – 一个能够描述数据的共同落点的指标。 – 常用的集中量数有平均数、中位数及众数
第一节
第八章 描述统计
4/31
☆ 量化研究與統計分析…….
• 天花板效应(ceiling effect)
– 则与负偏态有关,是指数据多数集中在偏高的一端, 但在低分端则有极端值,分数不容易突破高分端,彷 徂有一个天花板(或真的存在一个高分限制条件)阻 挡了数据往高分移动。
第三节
第八章 描述统计
18/31
☆ 量化研究與統計分析…….
峰度(Kurtosis)
– 利用线性转换的原理,将一组数据转换成不具有实质 的单位与集中性的标准化分数。 – 不同的标准分数,其共通点是利用一个线性方程式 y=bx+a进行集中点的平移与重新单位化,使得不同量 尺与不同变项的测量数据具有相同的单位与相同的集 中点,因此得以相互比较。
☆ 量化研究與統計分析…….
变异数的不偏估计数
• 标准差与变异数的不偏估计数的主要差别在于分母项为N1而非原来的N • N-1称为自由度(degree of freedom;df),表示一组分数 当中,可以自由变动的分数的个数。 • 在离均差的计算上,自由度为样本数减1,表示在N个观察 值中,只有N-1个数字可以自由运用于离均差的计算。
50、55、60、60、60、65、66、70、90 50、55、60、60、60、65、66、70、90 、95
62.5
第一节
第八章 描述统计
6/31
☆ 量化研究與統計分析…….
众数
• 众数(mode;或以Mo表示)
– 一组分数中,出现次数最多的一个分数 – 一组数据中最典型(typical)的数值或次数分 配最高点所对应的分数 – 是各集中量数当中,最容易辨认的量数 – 一个分配有两个分数具有相同的最高次数,此 时即出现了双众数,称为双峰分配(bimodal distribution)
第四节
第八章 描述统计
22/31
☆ 量化研究與統計分析…….
百分等级与百分位数
• 百分等级(percentile rank; PR)
– 系指观察值在变项上的分数在团体中所在的等级 – 在一百个人中,该分数可以排在第几个等级。 – 例如PR=50代表某一个分数在团体中可以胜过50%的人,他的分 数也恰好是中位数。
2 ( X X ) SS i ˆ2 s2 N 1 N 1
ˆ s
第二节
SS N 1
( X i X ) 2 N 1
15/31
第八章 描述统计
☆ 量化研究與統計分析…….
变异量数的特性与优缺点比较
測量層次 全距 名義 順序 等距/比率 優 點 缺 點
第八章 描述统计
21/31
☆ 量化研究與統計分析…….
相对量数
• 数据的解读:
– 绝对意义:由数值大小反应 – 相对意义:需从相对比较,甚至于进行变项数据的标 准化,才能对于数据的意义进行正确解读。
• 相对量数或相对地位量数(measures of relative position)
– 描述个别观察值在团体中所在相对位置的统计量 – 将某特定观察值在样本中所处的位置,以其他分数进 行参照,计算出观察值在该变项上分数的团体地位 (位置) – 常用的相对量数包括百分等级,百分位数,标准分数
– 百分等级是将原始分数转化为等级(百分比) – 百分位数则是由某一等级来推算原始分数
第四节
第八章 描述统计
23/31
☆ 量化研究與統計分析…….
百分等级与百分位数的计算
• 样本数少时
– 将资料依序排列,算出累积百分比,即可对应出每一 分数的百分等级 – 亦可从百分等级推算出各特定百分位数
• 样本数大时
(Q3 Q1 ) QR 2
第二节
第八章 描述统计
12/31
☆ 量化研究與統計分析…….
离均差与平方和
• 离均差
– 一组数据中,各分数与平均数的距离,通常以小写的x 来表示 deviation score= x =(X - μ) – 当离均差为正值时,表示分数落在平均数的右方 – 离均差为负值时,表示分数落在平均数的左方 – 平均数是每一个分数加总后的平均值,为一组分数的 重心位置
偏態 正偏態 負偏態 對稱 偏態係數 g1 > 0 g1 < 0 g1 = 0 峰度 高狹峰 低闊峰 常態峰 峰度係數 g2 > 0 g2 < 0 g2 = 0
第三节