当前位置:文档之家› 医学统计学复习提纲 考试必过

医学统计学复习提纲 考试必过


一、直线回归
n n
直线回归系数的意义及其假设检验 直线回归方程的建立 直线回归的应用
n
二、直线相关
n n
n
直线相关系数的意义和计算 直线相关系数的假设检验 直线回归系数与相关系数的区别和联系 •等级相关系数的适用范围 •等级相关系数的计算和假设检验。
三、秩相关
常用统计图表
1. 列表的原则 2. 列表的基本要求 3. 图的种类 ★ 4. 制图的基本要求
正常
正常
%
双侧
正态分布法
单侧 只有下限 只有上限
百分位数法
单侧 双侧 只有下 只有上限 限
90 95 99
. X ± 1 64 S X - 1 28 S . . X ± 1 96 S X - 1 64 S .
X + 1 28 S .
设计、收集资料、整理资料、统计分 析。其中统计分析包括: (1)统计描述:选择正确的统计指标反映 资料的数量特征;为便于分析和比较,可 绘制相应的统计图表 (2)统计推断:用样本信息推断总体特 征,包括参数估计和假设检验。
定量资料的统计描述 一、频数分布图表
㈠频数分布表编制 ㈡频数分布的类型
二、统计指标
估计参考值范围的步骤与要点
设计:①样本:“正常人”,大样本n≥100。②单侧或双侧。 ③指标分布类型。 计算:①若直方图看来像正态分布,用正态分布法。 ②若直方图看来不像正态分布,用百分位数法。
置信区间示意图
均数的 分布
个体值 的分布
­ t , n S x a ­ t , n S x a
数据类型 定量资料

等级资料

分类资料 统计 描述 率,比, 构成比 总体 率的 置信 区间
正态?
统计 描述
X ± S
统计 描述 Md,Q t 方 检差 验分 析
总体 均数 置信 区间
秩和 检验
2 c 检 验
回归与相关
★ 两个关联变量资料的统计分析步骤: 1. 统计描述: 指标:回归系数b­­­描述Y依赖X的直线变化数量关系 相关系数r­­­相关的密切程度和方向 图表:散点图 2. 参数估计:回归系数的置信区间 3. 假设检验:t检验
当b+c³40时可不校正,而b+c<40时则一定要校正
2 4. 多个率比较的c 检验
秩和检验
★ 1. 非参数统计的基本思想: 非参数统计是不依赖于总体分布具体形式的统计 方法。特点:不受总体参数的影响,比较的是分布 或分布位置,而不是参数。 ★ 2. 几种秩和检验的编秩方法
单变量统计方法的选择
n K ­ 1 N ­ 1
MS
F
MS 处理 MS 误差
SS 处理 n 处理 SS 区组 n 区组
MS 区组 MS 误差
SS 总 ­ SS 处理 ­ SS 区组 (k­1)( n­1) SS 误差 n 误差
X ∑ 2 ­ C
N ­ 1
C = ( X ) / ∑ 2 N
①请指出该资料中一个错误使用的概念,正确的名称应 该是什么? ② 能否据此认为“不饮酒”相对与“饮酒”来说更易于导致 高血压,为什么?应该怎样做? 答:(1)发病率,应该是患病率。 (2)不能,性别构成不齐同。采用直接标化法。
正态分布
一、正态分布的基本特征
(1)正态曲线在横轴上方均数处最高。 (2)正态分布以均数为中心,左右对称。 (3)正态分布有两个参数,即均数(位置参数) 和标准差(变异度参数)。 (4)正态曲线下的面积分布有一定规律。
X + 1 64 S .
P5 ~ P95 P10 P90 P2.5~P97.5 P5 P95 P0.5~P99.5 P1 P99
X ± 2 58 S X - 2 33 S X + 2 33 S . . .
总体均数的估计和假设检验--统计推断
一、均数的抽样误差与标准误
标准正态分布 ­1~1 ­1.96~1.96 ­2.58~2.58
正态分布 面积或概率 68.27% μ±σ 95.00% μ±1.96σ 99.00% μ±2.58σ
四、医学参考值范围
单侧下限­­­过低异常 单侧上限­­­过高异常 双侧­­­过高、过低均异常
异常 双侧下限 正常 异常 异常 异常
抽样误差:在抽样研究中,由个体变异和其它随机因 素造成的样本统计量(如 X )与总体参数(m )的差 别,以及样本统计量( X)之间的差别。 样本均数的标准误:反映了样本均数间的变异程 度,也反映了样本均数与总体均数间的差异,说明 均数抽样误差的大小。
S x = S n
二、t分布 图形和特征:
随机区组设计: SS =SS +SS +SS 总 组内 处理组间 区组间 +SS 误差
ν总= ν组内+ ν 处理组间 + ν区组间 + ν误差
SS
1 ( X ∑∑ ij ) 2 ­ C n i j
1 ( X ∑∑ ij ) 2 ­ C k j i
f(t) 0.3
υ=1 υ=∞(标准正态分布) υ=5
0.2
0.1
­5
­4
­3
­2
­1
0
1
2
3
4
5
图 3.5 标准正态分布和 t 分布的图形 ν=∞时的 t 分布即标准正态分布
三、总体均数的估计
1.点估计:→m 2.置信区间估计: 95%CI:认为算出的置信区间包含总体参数,置信程 度为95%≠总体参数落在该范围的可能性为95%
六、方差分析 1.方差分析基本思想:
(1) 离均差平方和分解(变异数分析),以及自 由度分解 (2) 求方差(均方):计算组间和组内的“平均”变 异程度 (3) 求F统计量:F=MS组间/MS误差(H 成立 0 则F=1)
2.方差分析基本步骤:
(1) 作检验假设:H :总体均数相等; 0 H :总体均数不等或不全相等 1 (2) 计算统计量F值: (3) 确定P值并作出结论: (4) 两两均数间比较(当P≤0.05时)
2 c 检 验
1. c2 检验基本思想: H 成立时,可参照合计率计算理论数,其理论 0 数与实际数的差别代表随机误差,一般不会很大。 2 当c 值大到一定程度,超过检验界值时,便可在a水 准下拒绝H 0
2 ★ 2.四格表c 检验(选公式) 应用条件: 2 ① 当n³40且所有T³5时,用一般的c 检验,若所得 P»a,改用确切概率法; 2 ② 当n³40但有1£T<5时,用校正的c 检验; 2 ③ 当n<40或有T<1时,不能用c 检验,用确切概率法 2 ★ 3.配对四格表c 检验(选公式)
成组设计方差分析与成组设计t检验关系
2 k=2时,F=t , P值相等 ­­­­ 二者等价
配伍设计方差分析与配对设计t检验关系
2 k=2时,F =t , P值相等 ­­­ 二者等价 处理
变异和自由度的分解
完全随机设计: SS =SS +SS , ν总= ν组内+ ν 总 组内 组间
例1 有人为研究饮酒与高血压的关系,普查了 某地区得到如下资料:
饮酒组 不饮酒组 检查人数 患者 发病率 (/千 ) 检查人数 患者 发病率 (/千 ) 1339 35 26.14 591 14 26.69 男 127 7 55.12 895 31 34.64 女 42 28.65 1486 45 30.28 合计 1466
3.概率 概率:描述某件事情发生的可能性大小的数值,记为P。 必然事件 P=1 不可能事件 P=0 随机事件 0≤P≤1 小概率事件 P≤0.05 实际很不可能发生
4. 同质与变异
同质:指事物的性质、影响条件或背景相 同或非常相近。 变异:指同质的个体之间的差异 。
5. 统计工作的基本步骤
t检验以t分布为理论基础。 小样本时要求假定条件: 资料服从正态分布,方差齐同。
2.第一类错误、第二类错误及检验功效
Ⅰ型错误:H 成立却错误 0 地拒绝H ,其概率为α。 0 Ⅱ型错误:H 不成立却不拒 0 绝H ,其概率为β。 0 功效1­β:检验效 能,是当两总体确有差 异,按规定检验水准α 所能发现差异的能力。
α与β的关系: ①当n一定时,α愈小,β愈大; ②要同时减小α、β,增大n。
例1 假设检验中α与P的区别何在?
答:以t检验为例,α 与P都可用t分布尾部面积 大小表示,所不同的是: α 值是指在统计推断时预 先设定的一个小概率值,就是说如果H 是真的,允 0 许它错误的被拒绝的概率。P值是由实际样本获得 的,是指在H 成立的前提下,出现大于或等于现有 0 检验统计量的概率。
平均数指标 离散指标
★据分布类型选用统计指标: 1.服从或近似正态分布:均数±标准差(X ± S ) 2.对数正态分布:几何均数G 3.偏态分布资料:中位数M, 四分位数间距Q
分类资料的统计描述
1.率 2.构成比 3.比 ★ 标准化法基本思想 采用统一的标准人口年龄构成,以消除不同人口 构成对两地死亡率的影响,使得到的标准化死亡率 具有可比性。 应用相对数指标的时候要注意:分母不宜过小;不 要以比代率;资料的可比性;样本指标比较时应做假 设检验。
正常
μ
x
t , n S x a t , n S x a
异常
异常
双侧下限 ­Z S α
双侧上限 Z S α
★二者不可混淆!
参考值范围示意图
四、假设检验
五、t检验
1.要求:根据资料类型正确选用t检验
定量资料(正态)→两均数→一个样本一个总体→单样本t检验
两个样本→配对→配对t检验 未配对→成组t检验
医学统计复习提纲
概论:
1. 统计资料类型 变量:指标,指观察单位的某项特征 资料:观察所得的变量值或指标值 资料类型: 二项分类 定量资料 无序分类 多项分类 定性(分类)资料 有序分类(等级资料)
相关主题