描述性统计分析一、实验目得1. 进一步了解掌握SPSS专业统计分析软件,能更好地使用英进行数据统计分析。
2. 学习描述性统汁分析及英在SPSS中得实现,内容具体包括基本描述性统汁量得龙义及计算、频率分析、描述性分析、探索性分析、交叉表分析等。
3. 复习权重等前章得知识。
二、实验内容题目一打开数据文件“da ta4-5、sa v“,完成以下统计分析:(1) 计算各科成绩得描述统计虽:平均成绩、中位数、众数、标准差、方差、极差、最大值与最小值;(2) 使用“Recode"命令生成一个新变量“成绩段",其值为各科成绩得分段:90〜1 00为1,8 0〜89为2,70-79为3, 6 0 ~6 9为4, 6 0分以下为5,其值标签设为:1 一优,2-良,3-中,4 一及格,5-不及格。
分段以后进行频数分析,统讣各分数段得人数,最后生成条形图与饼图。
1 •解决问题得原理因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,英后利用频数分析描述统计量并可以生成条形图等。
2、实验步骤针对第一问第1步打开数据菜单选择:“文件一打开一数据”,将“da t a 4-8、sav”导入。
第2步文件拆分菜单选择:“数据一拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确圧。
力櫻8矽仿帕 狄巴・UKfB "㈣CM9SS5M Mew rrwrt” tUl打制梅』<T M•力仕 l-c]勺 xa""注2»/»vn*\■:近多©" Tt第3步描述分析设置:(1) 选择菜单:“分析一描述统计一 描述“,打开“描述性"对话框,将“成绩” “加入到“变量”列表框中。
打开“选项”对话框,选中如下图中得各项。
J 戻制g V E 小血“万走 “ /大II!✓范 i Q®的畅砂◎ 号布r 魁:匚毗-且示亦_C 76iSff(A>C iSNjtljtWJFMfFfC).:找灼值附测W 回点击“继续"按钮。
(4)回到“描述性"对话框,点击确左。
针对第二问第1步频率分析设置:(1) 选择菜单:“分析一描述统计一频率“,(2)打丹濒率(F)”对话框,点击“合计S 再点击“继续”按钮、.25Ujixx»Mica.v.rjMR2*<») "s Q»HS« 55伍密 awsitUe*SStORJitfn*»«Xt5r vT IIr4r TJi”t ifr aT2r 7J r ”r 72r 辛r捕® ■彎|WKM 4MfUXI _」at 一 一《>一1_«_」_at 丄赵―l_ga_J_xa_J_Rl_] jtt 一I I i I i i ; I I Im 却tl 也⑥船屯勺 .aKRU»w»tt»W(U »'. rwitMQ'I S J WEL B 矶"皿•.uNWIttttN• wt ,E 0tt<N'GUW2:■r^• trHMTNnch o^ftaMve⑶打开“图表”对话框,选中“条形” 复选框,点击“继续”按钮。
⑷ 回到“频率(F广对话框,点击确立。
(5)重复步骤(1) (2)把步骤(3)改成打开“图表”对话框,选中"饼图” 复选框,点击“继续”按钮。
再回到c 濒率(F 广对话框,点击确定。
三、实验结果及分析统计量数学N有效 15缺失均值55 • 87中值49、00众数37标准羞24、348 方盪592 、 838极小值24极大值95百分位数 2536、00504,007581 70英语N有效 15缺失均值57、80中值56、00众数56标准差22、697方渥515U71极小值15极大值91百分位数 2534、005056、007578、00存在多个众数。
显示锻小值成绩段料目:语文成塡段成绩段料目:数学ft成塡段不M成纳段科目:英语试址段料目:话文□啸□ A成纳段 科目:敢7语文成绩得平均成绩为67、87,中位数就是73、众数6 0、标准差21、73 8、方差472、552、 极差9 8 -19=79.最大值9 8与最小值1 9 ; 各分数段人数:语文90~10 0为3, 80〜8 9为1, 70〜79为4, 6 0~69为4, 6 0分以下为3, 数学90〜100为1,80〜8 9为3,70-7 9为2,60〜69为0, 60分以下为9, 英语9 0〜1 00为2 ,80-89为1, 70-79为2,60- 6 9为2,60分以下为9 , 生成条形图与饼图如截图所示 题目二1.打开数据文件“d a 24—6、s a g 完成以下统计分析:(1)对身高进行考察,分析四分位数、计算上奇异值、上极端值、下奇异值与下极端值,并生 成茎叶图与箱图:(2) 考察身高、体重与胸用得正态性。
针对第一问试址段 料目:英语□啸 □ A1、解决问题得原理探索性分析第1步打开数据菜单选择:“文件一打开一数据”,将"data 4 — 9 . s av"导入。
第2步探索分析设置:(1)选择菜单“分析一描述统计-探索”,打开“探索”对话框,,将“身髙”字段移入“因变量列表S(2)打开“统讣量”对话框,选中“描述性”及古计:T'选项;因变量列表(R):I 「处 _ _@按索;统曲•一AH描述淫均值的這信区间©:隔| %厨世-估计量(M)O界外徹0E百分位数(E)—[取消J〔帮助|⑶打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验得正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项针对第二问与第一问得方法相似也可用探索性分析第1步探索分析设置:(1)选择菜单“分析一描述统计-探索”,打开“探索”对话框,,将“体重”字段移入“因变量列表M O(2)打开“统计量”对话框,选中“描述性”及“M—估计量”选项;因变量列表(P):- —1 I 几 _ _區抿索;统计呈0描述准均值的這信区间©:協| % 厨世-估计量(M) O界外值◎ B百分位数(E)统计Bootstra(缠续]〔取消H帮助](3)打开“探索:图”对话框,选中“按因子水平分组J “茎叶图”、“带检验得正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项第2步探索分析设置:(1)选择菜单“分析-描述统计 -探索”,打开“探索”对话框,,将“胸围”字段移入“因变量列表”O因变量列表助1 「几 _ _ 區探索;统H 星•一 A 01苗述准均值的這信区间©:隔| % 厨世-估计量(M)O 界外值(Q) 百分位数迟)— [竝簇]|取消]|帮助|(3) 打开“探索:图”对话框,选中“按因子水平分⑵打开“统汁量”对话框,选中“描述性”及“NM 古计量”选项;1 [统计呈]绘制C 」|选项I组二“茎叶图J “带检验得正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项3.结果及分析身咼身高Stem-and-Leaf Plot Frequency Stem & Leaf2.00 16.00 39.00 18.00 13.00 9・9910・ 000000122233334410 ・ 55555555666667777888888899999999999999911 ・ 00000011.222223334411・ 55566677889997.00 12 ・ 00000021.00 12 . 5Stem width; 10.0Each kaf: 1 case(s)从上得茎叶图可以更加详细地分析身髙数据。
125 0-120 0-115.0-110.0-:C5 0-10CCT95 0-DetrondtO Normal Q-Q Plot of>4-o•骞I MoI严小吧z °• s*O $从上得箱图可以分析变量“身高”得四分位数。
ObMrvtd V4纫U的正书QQ朝刿憎的0降iF•鲁QQM从上得Q-Q图中可以瞧出,身髙、体重、胸用三个变量都很好得服从正态分布。
题目三表4、2 2就是对吸烟与患气管炎得调查表,试分析吸烟与患气管炎之间得关系。
(用交叉列联表分析,参见数据文件:data4—10、sav o)1、解决问题得原理:运用交叉表分析2、实验内容第1步打开数据菜单选择:“文件-*打开-*数据”,将"data4— 1 0、sav"导入。
第2步加权设置:菜单选择:“数据一加权个案”,打开“加权个案”对话框,如图设巻。
第3步交叉表分析设置:⑴选择菜单:“分析一描述统计一交叉表”,打开“交叉表”对话框,将“就是否吸烟”及“就是否换气管炎”字段分别加入“行(s )”及“列(0 ”列表框中。
⑵打开“统讣量”对话框,选中“卡方”选项。
3)@交叉表:统计星I 茨1藉确09…圍卡方(旦) □相笑性迟)L 丈B ------------- r-SE ---------------------------包元格匡)…相依系数(9):Gamma(G)格式(巳…□ Phi Cramer 变量二 Somers" d(S)>otstrap(A).[□ Lambda(L)□ Kendall 的 tau •以B)□不定性怒数也) Kendairs tau-c(C)按区间标定0 Kappa(K)□ Eta(E)[□风险①~ McNemar(M)鬥 Cochran's and Mantel-Haenszel 统计呈(A)检验一般几率比等于]:[5^] 帮助)(确定J |粘贴吃)11重置迟)H 取消 H 顾—[(3)打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者 都就是缺省设置。
残差未标准化应)□标准化(g>n 调节的标准化©) 非整数权重◎四舍五入单元格计数迥)©四舍五入个案 ©裁短单元格计数(丄) O 截短个累权重(旦) ◎无调节®)[竝续]〔取消]j3实验结果及分析就是否吸烟*就是否患气管炎Cr os s tabulat i on百分比(C )行迟) □列a、Oc e 1 1 s ( * 0%) have expe c t ed cou n t les s than 5 ' The mini mum expect ed c oun t is 22 • 14 ■b、pu t ed only f or a 2x 2 tableBarChartZJLL> 5炬否吸JW综上所示,各种检验方法显著水平都远小于0、05,所以有理由拒绝“实验准备与评价结果就是独立得”假设,即认为实验准备这一评价指标与评价结果就是相关得。