SPSS的应用
两两比较方法选择: 两两比较采用S-N-K 多组与对照组比较采用LSD
描述统计
方差齐性检验
方差分析结果
Tests of Between-Subjects Effects Dependent Variable: 尿 氟浓 度 Source Corrected Model Intercept GROUP WORK ER Error Total Corrected Total Type III Sum of Squares 47895.877b 362019.463 8182.893 39712.984 17365.561 427280.901 65261.438 df 11 1 2 9 18 30 29 Mean Square 4354.171 362019.463 4091.447 4412.554 964.753 F 4.513 375.246 4.241 4.574 Sig. .002 .000 .031 .003 Noncent. Parameter 49.646 375.246 8.482 41.164 Observed a Power .981 1.000 .666 .972
视作特效药,为此发表过数以百计的文章,并作为定论写入教科 书。40年代末,随机对照临床试验,否定了这种结论。并用几个 月的时间肯定了链霉素、对氨柳酸、异烟肼的疗效。
统计学概述
一、概述 二、科研中的资料类型 三、常用统计方法的选择
二、科研中的资料类型
变量类型
数值变量 无 序 有 序 二分类 多分类 多分类
正 常 组 病 例 组
105.4
107.9 112.1
113.1
96.7 101.0
117.4
97.9 110.7
88.1
92.2 105.9
109.6
101.1 86.9
96.2
106.1 89.0
101.7
95.9
数据编 辑窗口
变量编辑窗口
小数位数 变量名称 变量取值标签
变量宽度
变量类型 变量名标签
Independent Sample t Test
应变量
两组的均数
两组的标准差
方差齐性检验的P值 (应>0.05,方差齐)
t 检验的t值
t 检验的P值
方差齐性检 验的F值
1.2 配对 t 检验
配对设计:成对资料,常见有自身配对、同源配对、随机配对
例2: 治疗前后自身配对,欲比较某一治疗方案有无
方差分解
随机设计:总变异=组内变异+组间变异 (分组因素) 配伍设计: 总变异=组内变异+组间变异+区组变异
(分组因素;区组因素)
随机设计方差分析
(单因素方差分析ANOVA)
Analysis Compare means One- way ANOVA 如:比较不同组别的 身高是否有差别
两辆比较
统计描述
判别分析、 Logistic回 连续变量为主 归分析
各种情形下最常用的统计方法索引
应变量 自变量 二分类 单 个
无序分 类 (含二 分类)
统计方法选择 卡方检验 卡方检验 Logistic回归分析 Logistic回归分析、 最优尺度分析
多分类 连 续 分类变量为主
多 个
连续变量为主
判别分析、 Logistic回归分析
Statistica:为一套完整的统计资料分析、图表、资料管 理、应用程式发展系统;以及对其他技术、工程、工商 企业资料挖掘应用等进阶分析之应用程式。
S-PLUS:S 语言是由AT&T贝尔实验室开发的一种用来进行数据探 索、统计分析、作图的解释型语言。它的丰富的数据类型(向量、 数组、列表、对象等)特别有利于实现新的统计算法,其交互式运 行方式及强大的图形及交互图形功能使得我们可以方便的探索数据。
方差齐性性检验
方差齐性检验P值 〉0.05 表示方差齐 方差分析F值
方差分析P值
两两比较结果 P值
多因素方差分析 Univariate 过程
几乎所有设计的方差分析都可以用此模型进行
分析,包括完全随即设计、配伍设计、交叉设计、
析因设计、拉丁方设计、正交设计、裂区设计等。
配伍设计方差分析
两因素:配伍因素、处理因素
T检验(秩和检验) 单因素方差分析(秩和检验) 相关分析,回归分析
多 个 连续变量为主
分类变量为主 方差分析模型(秩和检验)
线性回归模型
各种情形下最常用的统计方法索引
应变量 自变量 统计方法选择
二分类
单 个 多分类 连 续 多 个 分类变量为主
秩和检验
秩和检验 Logistic回归分析
有序 分类
Logistic回归分析
数值
日期
字符(姓名等) 变量类型的定义:常用的为数值型、日期型
点击此键, 显示标签 模式
分析:
比较病例组与正常对照组的血红蛋白有无差别 应变量: 自变量: 血红蛋白 连续变量 计量资料 二分类 计数资料
分组:病例组、正常组
方法:两样本t检验
Analysis Compare Means
年龄(岁)为计量资料,转换为“未成年、成人”,就是二分
• 分别给予编码0,1,2,3后又为何类资料? 类的计数资料,再转换为“婴幼儿、青 年、中年、老年”则为多分
类有序的计数资料(等级资料)
如治疗效果分类“无效、好转、显效、痊愈”为多分类有序
的计数资料,分别给予编码0,1,2,3后即便为计量资料了
统计学概述
– 无科学设计、数据量不够、统计结果与专业结
论自相矛盾、无法得出期望的统计结果
– 此刻,才考虑用什么统计方法得到想要的结果,
统计成了“数字游戏”。
正确运用统计方法的前提:
– 良好完善的研究设计
如果没有科学的设计、良好的数据质量,那
么无论用什么方法和软件都无法获得真实的结 果,甚至得出错误的结论。 例:20世纪30-40年代,金的化合物普遍用于治疗结核病,
SPSS是软件英文名称的首字母缩写,原意为Statistical Package
for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS 产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将 英文全称更改为Statistical Product and Service Solutions,意为“统计 产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。 SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生 于20世纪60年代末研制,同时成立了SPSS公司,并于1975年在芝加哥 组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析 软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极 大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科 学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予 了高度的评价与称赞。迄今SPSS软件已有30余年的成长历史。全球约 有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制 造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最 广泛的专业统计软件。
效果,即比较某一指标在治疗前后有无差别。
试验号 1 2 3 治疗前 14.1 13.2 16.9 治疗后 16.2 15.9 21.3
Analysis Compare Means Paired-Sample T Test
. . .
.. .. ..
.. .. ..
T值
P值
2. 方差分析
应变量(Y):连续 条件: 独立、正态、方差齐 自变量(X):多分类
变量值表现
定量(具体数值) 对立的两类属性 不相容的多类属性 类间有程度差异的 属性
实例
血红蛋白等 性别(男,女) 血型(A,B,O) 文化程度(初中、 高中、大学...)
资料类型
计量资料
分 类 变 量
计数资料
等级资料
计量资料:先确定观察单位后,进行某项指标的测量 计数资料:将观察单位按属性分类,然后清点每一属性的观察单位数 等级资料:半定量资料,有序分类变量,将观察单位按某种属性的不同程度或 某个指标的大小分成不同等级,然后清点每个等级的观察单位数。
某疫苗皮下注射免疫结果
观察对象 1 2 … 抗体滴度 1:40 1:60 … 目测判断抗体水平 ++ ++++ … 免疫效果观察 无效 有效 …
为何类资料? 计量资料
为何类资料? 有序多分类 等级资料
为何类资料? 二分类 计数资料
数据类型的相互转换
• • • •
如年龄(岁),为何类资料? 转换为“未成年、成人”,是何类资料? 再转换为“婴幼儿、青年、中年、老年”则又是何类资料 ? 如治疗效果分类“无效、好转、显效、痊愈”为何类资料 ?
一、概述
二、科研中的资料类型
三、常用统计方法的选择
三、常用统计方法选用
统计方法回顾: 单因素分析 t 检验 方差分析 卡方检验 秩和检验(非参数) 直线回归与相关
多因素分析 多元线性回归 Logistic回归 生存分析 聚类分析 判别分析 …….
各种情形下最常用的统计方法索引
应变量 自变量 二分类 单 个 连续 多分类 连 续 统计方法选择
Stata :一个小型的统计软件 ,采用命令行方式来操作 , 绘制的统计图形相当精美,很有特色 EViews 、 Minitab、SYSTAT……
1. T检验
例1
欲比较病例组与正常对照组的血红蛋白有无差别。
124.3 123.8 123.2 130.6 118.2 117.4 118.8 124.2 122.3 112.7 117.7 129.7 119.1 117.2 113.9 109.9 123.7 110.7 128.9 117.1