SPSS简易使用手册屏师初教系陈正昌编壹、数据从哪里来?一、政府统计资料:例如教育部出版之教育统计、内政部之台闽人口统计、法务部之犯罪状况及其分析、主计处之社会指标……,有部分统计数据也放在网络上,可以直接下载。
二、现成调查数据库:台湾社会变迁数据库。
三、他人研究后发表之结果,这可以用来进行整合分析(meta analysis)或次层分析(secondary analysis)。
中央研究院调查研究中心近年来积极汇整各种调查研究数据,研究者可以提出研究计划向其申请或直接在网络上下载。
四、实验后所得数据。
五、自行使用调查法(面谈、电访,或问卷) 所得之资料。
贰、现成数据如何读入?一、在「档案」的选单下选择「开启旧文件」中之「数据」。
二、内定为SPSS之系统文件,选择所需档案即可。
三、SPSS也可以开启Excel或dBase等软件之数据文件。
四、E xcel数据文件如果第一列有变量名称,则应勾选「从数据第一列开始读取变量名称」。
参、如何自行输入数据一、先建立编码簿(codebook)变量名称变数批注变数性质资料性质字段数选项数值说明sex 性别名义变数字符串 1.0 M:男W:女area 地区名义变数数字 1.0 1:北部2:中部3:南部4:东部age 年龄量尺变数数字 2.0year 教学年资次序变数数字 2.0 1:5年以下2:6~10年3:11~20年4:21年以上a1-1 薪资满意度量尺变数数字 1.0 1:很不满2:不满意3:满意4:很满意a1-2 环境满意度量尺变数数字 1.0 1:很不满2:不满意3:满意4:很满意b1-1 进修意愿量尺变数数字 1.0 1.很不符2:不符合3:符合4:很符合b1-2 留职意愿量尺变数数字 1.0 1.很不符2:不符合3:符合4:很符合height 身高量尺变数数字 5.1weight 体重量尺变数数字 4.1二、在SPSS中选择「输入数据」三、在「变量检视」窗口中输入变量名称,并选择变量类型四、对「变数」及「数值」加以批注五、如果有许多变量的数值定义相同,可以用「复制」及「贴上」的方式处理。
六、如果遗漏值(missing value)有两种以上不同意义,最好加以界定,不然,就直接空白即可七、依次输入数据:横向输入,非直向输入肆、分析前的工作一、检查有无输错,方法一:次数分配表1. 在「分析」选单中选择「描述性统计」之「次数分配表」2. 点选所需变数3. 由报表可看出有一个受访者的数据输入有误 (选项为5),有一个受访者本题未填答留職意願110.011.111.1330.033.344.4220.022.266.7110.011.177.8220.022.2100.0990.0100.0110.010100.0很不符不符合符合很符合5總和有效的系統界定的遺漏遺漏值總和次數百分比有效百分比累積百分比二、检查有无输错,方法二:交叉表1. 在「分析」选单中选择「描述性统计」之「交叉表」2. 选择「横列」及「直行」所需变数3. 结果显示有2个受访者资料可能有误:一位年龄为40,但服务年资为5年以下(有可能是师资班出身);另一位年龄为25,但服务年资为21年以上 (明显有误)。
年齡 * 服務年資 交叉表個數1121111111111111111232310253032354043455060年齡總和5年以下6~10年11~20年21年以上服務年資總和三、反向题之处理1. 在「数据窗口」中选择「转换」选单「重新编码」之「成同一变量」2. 选择所需变量3. 再点选「旧值与新值」4. 依序新增旧值及新值四、变量之计算1. 在「数据窗口」中选择「转换」选单之「计算」2. 自行加入「目标变量」,并完成数值表达式。
五、变量重新分组1. 先对所要重新分组之变量进行次数分配表2. 在「数据窗口」中选择「转换」中「重新编码」之「成不同变量」3. 选择要分组之变量及「输出之新变量」,并点选「旧值与新值」4. 先选择最低值到某一值,定义为第1组5. 再选择从某一值到某一值为第2组6. 接着选择某一值到最高值为第3组伍、图示法一、条形图(bar chart)地區東部南部中部北部個數4.54.03.53.02.52.01.51.0.50.0二、线形图 (line chart)地區東部南部中部北部個數 4.54.03.53.0 2.52.01.51.0.50.0三、圆饼图 (pie chart)1.00 / 10.0%2.00 / 20.0%4.00 / 40.0%3.00 / 30.0%東部南部中部北部四、散布图(scatter plot)薪資滿度意4.54.03.53.02.52.01.51.0.50.0留職意願654321陆、常用单变量统计方法汇整第一变量 (或自变量)质的变数量的变数第 或 二 依 变 变 数数0 图示法、次数分配 描述统计、卡方适合度考验 图示法、描述统计 一个样本t 考验 质的变数 卡方同构型考验 卡方独立性考验 (各种相关) logistic 回归 区别分析 量的变数两个样本t 考验 (独立或相依) 变异数分析(三个样本) 简单相关 简单回归柒、常用单变量统计方法简介一、描述统计1. 选取「描述统计」中之「描述性统计量」2. 选择想要分析的变量3. 在「选项」下有各种统计量4. 报表太宽,可以选「编辑」「SPSS Pivot Table对象」5. 输出报表:各项描述统计量敘述統計99628586.44.752.2425.028-1.232.717.299 1.400個數範圍最小值最大值總和平均數標準差變異數偏態峰度統計量標準誤統計量分量表一有效的 N (完全排除)二、次数分配表1. 选取「分析」中「描述性统计」之「次数分配表」2. 选取所需的统计量数3. 如果需要建立常模,可以选择将观察值分为100等(百分等级)4. 输出报表之一:描述统计及百分位数統計量地區1002.10.312.002.99.99.610.687-.1571.334314211.001.302.003.00有效的遺漏值個數平均數平均數的標準誤中位數眾數標準差變異數偏態偏態的標準誤峰度峰度的標準誤範圍最小值最大值總和25305075百分位數5. 输出报表之二:次数分配表地區327.330.030.0436.440.070.0218.220.090.019.110.0100.01090.9100.019.111100.0北部中部南部東部總和有效的系統界定的遺漏遺漏值總和次數百分比有效百分比累積百分比三、Pearson 积差相关(最好先用散布图看一下两个变量间是否为「直线关系」) 1. 选取「描述统计」中「相关」之「双变数」2. 选取所需之变量(如果是次序变量,则勾选Spearman 等级相关系数)3. 在「选项」下勾选所需统计量4. 输出报表:r=.758, p<.05, n=9相關1.000.758*..01812.00010.0001.333 1.250109.758* 1.000.018.10.00016.0001.250 2.00099Pearson 相關顯著性 (雙尾)叉積平方和共變異數個數Pearson 相關顯著性 (雙尾)叉積平方和共變異數個數環境滿意度留職意願環境滿意度留職意願在顯著水準為0.05 時 (雙尾),相關顯著。
*.四、简单回归1. 选取「分析」中「回归方法」之「线性」2. 选取所需之「自变量」及「依变量」3. 输出报表之一:R 2=.574,表示「环境满意度」可以解释「进修意愿」变异量之57.4%模式摘要.758a .574.513.99模式1R R 平方調過後的R 平方估計的標準誤預測變數:(常數), 環境滿意度a.4. 输出报表之二:F (1,7)=9.431, p<.05,所有自变量可以显著预测依变量變異數分析b9.18419.1849.431.018a6.8167.97416.0008迴歸殘差總和模式1平方和自由度平均平方和F 檢定顯著性預測變數:(常數), 環境滿意度a. 依變數\:留職意願b.5. 输出报表之三:回归方程式,留职意愿=0.918环境满意度+0.347係數a.347.924.375.719.918.299.7583.071.018(常數)環境滿意度模式1 B 之估計值標準誤未標準化係數Beta 分配標準化係數t 顯著性依變數\:留職意願a.五、独立样本t检定1. 选取「比较平均数法」中「独立样本t 检定」2. 指定「依变量」(检定变量)及「自变量」(分组变量,要定义组别)3. 输出报表:F=0.839, p>.05,因此变异数同质。
t=–1.153, df=7, p>.05,因此,性别不同在分量表一的平均得分无不同。
獨立樣本檢定.839.390-1.153-1.1007 5.085.287.321-1.7000-1.70001.4741 1.5460-5.1856-5.65401.7856 2.2540統計量F 檢定顯著性變異數相等的 Levene 檢定t自由度顯著性 (雙尾)平均差異標準誤差異下界上界差異的 95% 信賴區間平均數相等的 t 檢定假設變異數相等不假設變異數相等假設分量表一依變數六、单因子独立样本变异数分析1. 选取「比较平均数法」中之「单因子变异数分析」2. 指定「依变量」及「自变量」3. 在选项中勾选「描述性统计量」及「同构型检定」4. 多重比较一般勾选Scheffé法 (较严、适合细格不等) 或Duncan (较松,适合细格相等)5. 输出报表之一:F (2,6)=2.339, p>.05,符合变异数同构型假设變異數同質性檢定分量表一2.33926.177Levene 統計量分子自由度分母自由度顯著性6. 输出报表之二:ANOVA 之F (2,6)=3.215, p>.05,三个地区教师在分量表一之平均得分无显著差异變異數分析分量表一20.806210.403 3.215.11219.4176 3.23640.2228組間組內總和平方和自由度平均平方和F 檢定顯著性7. 输出报表之三:事后多重比较,如果有显著差异,在平均差异处会加上* 号多重比較依變數: 分量表一2.92 1.37.186-1.497.32-.33 1.64.980-5.60 4.93-2.92 1.37.186-7.32 1.49-3.25 1.56.195-8.25 1.75.33 1.64.980-4.935.603.251.56.195-1.758.25(J) 地區中部南部北部南部北部中部(I) 地區北部中部南部Scheffe 法平均差異 (I-J)標準誤顯著性下界上界95% 信賴區間8. 输出报表之四:同质子集分量表一44.7537.6728.00.08644.7537.6728.00.186地區中部北部南部顯著性中部北部南部顯著性Duncan 檢定a,b Scheffe 法a,b 個數1alpha = .05的子集顯示的是同質子集中組別的平均數。