当前位置:
文档之家› spss统计软件培训数据分析
spss统计软件培训数据分析
• 相关和回归分析的研究对象:统计关系
17
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.5 二分类Logistic回归(续)
• Logistic回归:应变量为分类变量,自变量: 连续/ 分类变量,研究该分类变量与一组自变量之间的关系
• 0/1:治愈/未治愈,或患病/未患病 • 有序分类:治愈/好转/未治愈 • 无序分类:腺癌、鳞癌、大细胞癌
2020/12/10
SPSS 1.2 比较均值
• 完全随机化设计单组计量资料的均数与总体均数比较的 t检验
• 某个小区1000个6岁男孩的身高与重庆市所有6岁男孩的 身高平均值的比较
• 配对设计两组相关计量资料均数间比较的t检验
• 自身配对:如治疗前后某项指标比较。
• 异体配对:如对两只兔子两种处理方法的结果比较。
SPSS中的相应功能:“探索”过程
8
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.2.2 分类变量的统计描述
• 频数分布情况的描述:绝对频数、百分比
• 集中趋势的描述:众数
• 使用相对数进行深入描述:比、构成比、率
• SPSS中的相应功能:“频率”过程、“描述”过程和 “探索”过程
9
重庆市疾控慢病所 宿昆
• 完全随机化设计两组独立计量资料均数间比较的t检验
• 如男女BMI比较
• 完全随机化设计多组独立计量资料均数间比较的单因素
ANOVA
• 如比较不同乡镇BMI
10
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.2 比较均值
11
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.3 χ2检验
• 回归的最初含义:生物学含义 英国的遗传学家F.Galton和K.Pearson注意到一个有趣的现象, 即父亲高,儿子也高,父亲矮,儿子也矮,但儿子的身高离平均水 平更近些,即子代身高有向人群的平均身高回归(regression to the mean)的趋势,这就是“回归”的生物学内涵,Galton 称该现象为“普遍回归法则(law of universal regression)”。这是很自然的,否则,岂不一代比一代无限制地 远离平均值,导致身高两级分化?
22
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.6 基于秩次的非参数检验
• 完全随机化设计单组样本的基于秩次的非参数检验
• 完全随机设计两组独立样本的基于秩次的非参数检验
• 配对设计两组相关样本的基于秩次的非参数检验
• 完全随机设计多组独立样本的基于秩次的非参数检验
23
重庆市疾控慢病所 宿昆
2020/12/10
保加利亚文:Благодарности
21
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.5 二分类Logistic回归(续)
哑变量
• 每个哑变量只代表某两个级别或若干个级别间的差异,这样得到 的回归结果才能有明确而合理的实际意义
• 对于取值具有n个水平的自变量Xi,可以生成n-1个哑变量
• 模型中哑变量遵循“同进同出” 的原则
18
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.5 二分类Logistic回归(续)
模型中参数的意义 • Β0为常数项:自变量取值全为0时的基线状况,未必有实际
意义 • Βi为偏回归系数,代表固定其它Xj时,Xi改变一个单位引
起logit(P)平均值的改变量
ln1 (P 1P '1')/1 ( P 1P 1)lnO Ri
15
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.4 简单线性回归模型(续)
16
重庆市疾控慢病所 宿昆
2020/12/10
SPSS
1.5 二分类Logistic回归
• 相关(correlation)与回归(regression)简介 • 在大量的医学研究中还需要对两个变量之间的关系进行
• 哑变量
偏回归系数表示其它自变量Xj不变,Xi每改变一个单位, 所导致logitP的平均变化量
• x为连续性/二分类变量:没有问题 • x为多分类变量:不太合适
• 无序多分类:民族,各族之间不存在大小问题 • 有序多分类:家庭收入分为高、中、低三档,它们之间的差距
无法准确衡量
• 在以上这些情况时,我们就必须将原始的多分类变量转 化为数个哑变量(Dummy Variable),
• 线性回归分析的一般步骤 • (1)确定因变量和自变量 • (2)绘制散点图 • (3)从样本数据出发确定变量之间的数学关系式,并 对回归方程的各个参数进行估计. • (4)对回归方程进行各种统计检验.:回归方程的显 著性检验;拟合优度检验;残差(Y的估计值Ŷ与实测 值的差)分析(y/残差-x/X or Ŷ) • (5)利用回归方程进行预测与控制;
SPSS
SPSS
SPSS
SPSS
SPSS 1.2.1 连续变量的统计描述(续)
SPSS中的相应功能:“频率”过程
6
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.2.1 连续变量的统计描述(续)
SPSS中的相应功能:“描述”过程
7
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.2.1 连续变量的统计描述(续)
量化研究,一是确定两个变量间是否有联系及联系的程 度如何,二是定量地确定它们之间的互依关系,相关与 回归就是研究这种关系的统计方法。 • 变量间的关系
• (1)函数关系(确定性关系):如:圆面积和圆半径. • (2)统计关系(非确定性关系):不象函数关系那样直接,但却普
遍存在,且有强有弱, 如:身高与体重. (变异)
• 完全随机设计的单样本计数资料的率/构成比与已知总 体率/构成比比较
• 完全随机设计的两(多)独立样本计数资料的率(构成比) 比较
• 配对设计的两组相关样本计数资料的率/构成比比较与 Kappa一致性检验
• 完全随机设计的分层χ2检验
12
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.4 简单线性回归模型
• 当其它自变量(Xj)取值保持不变时, Xi取值增加一个单位 引起OR自然对数值的变化量,因此在使用上OR值要远比βi 本身更常用
19
重庆市疾控慢病所 宿昆
2020/12/10
SPSS 1.5 二分类Logistic回归
20
重庆市疾控慢病所 宿昆
2020/1ogistic回归(续)
• 回归的现在含义:完全不同了,回归分析是研究事物或 现象之间的数量依存关系,控制/预测
13
重庆市疾控慢病所 宿昆
2020/12/10
SPSS
1.4 简单线性回归模型(续)
• 模型: Yi Xi i( i随机误差)
^
Yi a bXi
14
重庆市疾控慢病所 宿昆
2020/12/10
SPSS
1.4 简单线性回归模型(续)