当前位置:文档之家› 医学统计学笔记

医学统计学笔记

分发生的强度和概率。 ⒉分母过小时相对数不稳定 ⒊用以比较的资料应是同质的 ⒋要考虑存在的抽样误差,对总体进行推断时应作统计学检验
率的标准化:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除 其内部构成(年龄、性别、工龄、病程长短等)的影响。
标准构成:⑴选取有代表性、较稳定、数量较大的人群构成为标准 ⑵选择相互比较的各组例数合计为标准构成 ⑶从比较的各组中任选其一作为标准构成
【 2 检验】 2 检验:英国统计学家 Peason 提出的一种用途广泛的假设检验方法。该检验以 2 分布为理论依据,可以推断两个(或多个)总体率以及构成比之间有无差异。
四格表资料的 2 检验
理论频数 TRC (nR • nc ) n
四格表资料 2 检验专用公式 2
(ad bc)2 n
Medical Statistics
【Introduction】 医学统计工作的内容 ⒈实验设计:最关键、最重要 ⒉收集资料:最基础
[原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表 质量控制:精度和偏倚 ⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表) ⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断
(a b)(c d)(a c)(b d)
四格表 2 检验校正公式 2 ( ad bc n 2)2 n (a b)(c d)(a c)(b d)
通常规则:①n 40 且所有的 T 5 基本公式(或专用公式)
②n 40 但有 1 T<5 校正公式
③n<40,或 T<1
Fisher 确切概率法
误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差 ⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌
握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。 ⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然
因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、 电压、环境温度的差异。 没有固定的倾向,时高时低;应采取措施加以控制。
【方差分析】 方差分析:将全部观测值的总变异按影响因素分为相应的若干部分变异,在此基
础上,计算假设检验的统计量 F 值,实现对总体均数是否有差别的推断。 条件:来自于正态分布总体,且总体方差相等的 k 个样本均数的比较(k>=3)
完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因 素设计方法。只考虑一个处理因素
样本的特征:⑴代表性 ⑵随机性 ⑶可靠性
*抽样的要求:代表性,随机性,可靠性,可比性
完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体 中随机抽样进行研究。可为两样本或多样本得比较,但样本含量 不宜相差太大。
随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中 的受试对象分别随机分到两个处理组中,而配伍组设计中的每个 “配伍组”,包含多个受试对象,要将它们分别随机分到各处理 组中。
标准正态分布:均数μ=0,标准差σ=1 的正态分布。
转化公式: u X
☆适用条件总结:①样本标准差 正态,对数正态
②变异系数
单位不同或均数相差较大
③四分位数间距 偏态
医学参考范围:也称正常值范围,正常人的解剖、生理、生化、免疫及组织代谢 产物的含量等各数据的波动范围。 (习惯上是包含 95%参照总体的范围)
变量:观察单位的某些特征 变量值:观察、测定的结果
【集中趋势的统计描述】 频数表(计量资料):同时列出观察指标的可能取值区间及各区间的频数 集中趋势:变量值的集中位置 离散趋势:变量值围绕集中位置的分散情况
平均数:描述一组观察值集中位置或平均水平的统计指标。常作为一组数据的代 表值用于分析或进行组间比较。
☆中心极限定理:在样本含量 n 很大(>=50)的情况下,无论原始测量变量服从什 么分布,的抽样分布都近似服从正态分布 N(μ, 2 n )
标准误:反映样本均数间变异的标准差。 (反映样本均数间的离散程度,也反映样本均数与总体均数的差异)
理论值 n X
估计值 S S n X
参数估计:由样本统计量估计总体参数。 点估计:使用单一的数值直接作为总体参数的估计值。如用 X 估计相应的μ
标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度 (反映样本值的离散程度)
X X 2
S n 1
标准差变异系数(CV):均数相差较大或单位不同的几组观察值的变异程度的比较 CV S 100% (百分数,可能大于 1) X
正态分布曲线下的面积 横轴: ( f ) f=2.58, 1.96, 1, 0(居中) 对应 99%, 95%, 68.3%
[适用条件]:对称分布或偏度不大的资料,尤其适合正态分布 算术均数( X ):简称均数,说明一组观察值平均水平或集中趋势(描述计量资料) 几何均数(G):描述观察值间按倍数关系变化的资料的平均水平,如滴度、浓度、
血清效价、细菌计数。
中位数(M):观察值按从小到大排列时,居于中心位置的数值。 n 为奇数时,M=第(n+1)/2 项 n 为偶数时,M=第 n/2 项和第(n/2+1)项的平均值 [适用条件]:分布明显呈偏态;频数分布的一端或两端无确切值
单侧,f=2.33,1,645, 1, 0
正态分布的特征 均数处最高,以均数为中心,两端对称 中心μ对应的 f(x)最大;x 越远离μ,f(x)越趋近于 0,但不会为 0 永远不与 x 轴相交的钟型曲线 有两个参数:均数——位置参数;标准差——形状(变异度)参数 正态曲线下的面积分布有一定规律 正态分布具有可加性
死亡率:某地某年每 1000 人中的死亡率 年龄别死亡率:某地某年龄组每 1000 人口中的死亡数 死因别死亡率:某年每 10 万人中,由于患某疾病死亡的人数 死因构成:相对死亡比,某种死因引起的死亡人数占总死亡人数的百分比
发病率:某一时期内特定人群中患某病新病例的频率 患病率:某一时点某人群中患某病的频率(可大于 100%) 病死率:某期间内,某病患者因某病死亡的频率 治愈率:接受治疗的病人中治愈的频率
t X 0 ,v n 1 Sn
配对样本均数 t 检验:受试对象依特征配对,随机分别分配到两个实验组
t d Sd / n
两独立样本均数 t 检验:两总体服从正态分布,且总体方差齐
方差齐性:两独立样本的总体方差
2 1
2 2
Sc2
n1
1 S12
n1
(n2 1)S22 n2 2
方差不齐时两样本均数的 t’检验
⑶抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。原因是个体 之间存在变异,抽样时只能抽取总体的一部分作为样本。 不可避免,要用统计方法进行正确分析。
概率:描写某一事件发生可能性大小的一个度量。 频率:样本实际发生率
小概率事件:P<=0.05(差别有统计学意义)或 P<=0.01(差别有高度统计意义)的事件
总变异 SST :n 个观测值的离均差平方和 组间变异 SSTR :组内均值与总均值之差的平方和 组内变异 SSE :组内各个观测值与本组内均值之差的平方和
(反映各组内样本的随机波动)
完全随机设计的方差分析表(自由度 ) F= t2
随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成 m 个区 组,每个区组中有 k 个受试对象,再将其随机地分到 k 个处理组中。 (属于无重复数据的两因素方差分析)
(未考虑抽样误差的影响) 区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
可信度:事先给定的概率 1-α(通常取 0.95 或 0.99);计算得到的是可信区间 95%可信区间 ( X 1.96 X , X 1.96 X )
假设检验:即显著性检验,是统计推断的重要内容,比较总体参数之间有无差别。 首先对所需比较的总体提出一个无差别假设,然后通过样本数据去推 断是否拒绝这一假设。
方差齐性检验
F
S12 S22
(较大) (较小)
,v1
n
1, v2
n
1
(P>0.05,可认为总体方差齐)
t’检验
u 检验:总体标准差已知,或样本量较大时,样本均数与总体均数的比较
t 检验中的注意事项 ⒈样本资料必须能代表相应总体 ⒉t 检验以正态分布为基础;非正态数据尝试变换为正态,或用非参数检验 ⒊完全随机设计的两样本均数比较,要求两组方差齐 ⒋对同一资料作单侧检验更容易获得显著结果 ⒌假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围
百分位数(P):在一组数据中找到一个数值 Px,全部观察值的 x%小于 Px。 P25, P75 描述资料的离散程度 P2.5, P97.5 规定医学 95%的参考值范围
【变异程度的统计描述】 极差(R):即全距,观察值中最大值与最小值之差。不适用于开口资料
四分位数间距(Q):一组观察值按大小排序后,分成四个数目相等的段落,每段 观察值占总例数的 25%,去掉两端含有极端数值的 25%,取 中间 50%的数据范围即为 Q。(适用于偏态分布&开口资料) [Q=P75 - P25] Q 越大,则数据变异越大
配对四格表资料的 2 检验
观察结果的四种情况:①A+, B+ [a] ②A+, B- [b] ③A-, B+ [c] ④A-, B- [d]
公式:㈠ 2 (b c)2 , =1 bc
(b + c均差距。即各观察值与均数之差的绝对值之
和的平均。
平均偏差= X X n
离均差平方和:通过取平方避免正负抵消
SS X X 2
方差:离均差平方和再取平均,分母用自由度 v=n-1 代替 *自由度(v):在所有的 n 个离均差平方项中,只有 n-1 个是独立的。
相关主题