当前位置：文档之家› 医学统计学笔记

医学统计学笔记

分发生的强度和概率。 ⒉分母过小时相对数不稳定 ⒊用以比较的资料应是同质的 ⒋要考虑存在的抽样误差，对总体进行推断时应作统计学检验
率的标准化：为了比较两个不同人群的患病率、发病率、死亡率等资料时，消除其内部构成（年龄、性别、工龄、病程长短等）的影响。
标准构成：⑴选取有代表性、较稳定、数量较大的人群构成为标准 ⑵选择相互比较的各组例数合计为标准构成 ⑶从比较的各组中任选其一作为标准构成
【 2 检验】 2 检验：英国统计学家 Peason 提出的一种用途广泛的假设检验方法。该检验以 2 分布为理论依据，可以推断两个（或多个）总体率以及构成比之间有无差异。
四格表资料的 2 检验
理论频数 TRC (nR • nc ) n
四格表资料 2 检验专用公式 2
(ad bc)2 n
Medical Statistics
【Introduction】医学统计工作的内容 ⒈实验设计：最关键、最重要 ⒉收集资料：最基础
[原始资料] 实验数据，现场调查资料，医疗卫生工作记录、报告、报表质量控制：精度和偏倚 ⒊整理资料：资料的逻辑、一致性检查，原始数据的加工(频数分布表) ⒋分析资料：统计描述(表、图、离散趋势、集中趋势)和统计推断
(a b)(c d)(a c)(b d)
四格表 2 检验校正公式 2 ( ad bc n 2)2 n (a b)(c d)(a c)(b d)
通常规则：①n 40 且所有的 T 5 基本公式（或专用公式）
②n 40 但有 1 T<5 校正公式
③n<40，或 T<1
Fisher 确切概率法
误差：泛指观测值与真实值之差，以及样本统计量与总体参数之差 ⑴系统误差：在收集资料过程中，由于仪器调整、试剂校验、医生对疗效的掌
握等因素，造成观察结果倾向性的偏大活偏小。要尽量查明原因，必须克服。 ⑵随机测量误差：在收集资料过程中，即使系统误差已经避免，由于各种偶然
因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。没有固定的倾向，时高时低；应采取措施加以控制。
【方差分析】方差分析：将全部观测值的总变异按影响因素分为相应的若干部分变异，在此基
础上，计算假设检验的统计量 F 值，实现对总体均数是否有差别的推断。条件：来自于正态分布总体，且总体方差相等的 k 个样本均数的比较(k>=3)
完全随机设计：又称单因素方差分析，将实验对象随机分配到不同处理组的单因素设计方法。只考虑一个处理因素
样本的特征：⑴代表性 ⑵随机性 ⑶可靠性
*抽样的要求：代表性，随机性，可靠性，可比性
完全随机设计：将受试对象随机分配到各处理组或对照组中，或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较，但样本含量不宜相差太大。
随机区组设计：也称配伍设计，是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中，而配伍组设计中的每个 “配伍组”，包含多个受试对象，要将它们分别随机分到各处理组中。
标准正态分布：均数μ=0，标准差σ=1 的正态分布。
转化公式： u X
☆适用条件总结：①样本标准差正态，对数正态
②变异系数
单位不同或均数相差较大
③四分位数间距偏态
医学参考范围：也称正常值范围，正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各数据的波动范围。（习惯上是包含 95%参照总体的范围）
变量：观察单位的某些特征变量值：观察、测定的结果
【集中趋势的统计描述】频数表（计量资料）：同时列出观察指标的可能取值区间及各区间的频数集中趋势：变量值的集中位置离散趋势：变量值围绕集中位置的分散情况
平均数：描述一组观察值集中位置或平均水平的统计指标。常作为一组数据的代表值用于分析或进行组间比较。
☆中心极限定理：在样本含量 n 很大(>=50)的情况下，无论原始测量变量服从什么分布，的抽样分布都近似服从正态分布 N（μ， 2 n ）
标准误：反映样本均数间变异的标准差。（反映样本均数间的离散程度，也反映样本均数与总体均数的差异）
理论值 n X
估计值 S S n X
参数估计：由样本统计量估计总体参数。点估计：使用单一的数值直接作为总体参数的估计值。如用 X 估计相应的μ
标准差(S)：将方差取平方根，还原为与原始观察值单位相同的变异量度（反映样本值的离散程度）
X X 2
S n 1
标准差变异系数(CV)：均数相差较大或单位不同的几组观察值的变异程度的比较 CV S 100% （百分数，可能大于 1） X
正态分布曲线下的面积横轴： ( f ) f=2.58, 1.96, 1, 0(居中) 对应 99%, 95%, 68.3%
[适用条件]：对称分布或偏度不大的资料，尤其适合正态分布算术均数( X )：简称均数，说明一组观察值平均水平或集中趋势(描述计量资料) 几何均数(G)：描述观察值间按倍数关系变化的资料的平均水平，如滴度、浓度、
血清效价、细菌计数。
中位数(M)：观察值按从小到大排列时，居于中心位置的数值。 n 为奇数时，M=第(n+1)/2 项 n 为偶数时，M=第 n/2 项和第(n/2+1)项的平均值 [适用条件]：分布明显呈偏态；频数分布的一端或两端无确切值
单侧，f=2.33,1,645, 1, 0
正态分布的特征均数处最高，以均数为中心，两端对称中心μ对应的 f(x)最大；x 越远离μ，f(x)越趋近于 0，但不会为 0 永远不与 x 轴相交的钟型曲线有两个参数：均数——位置参数；标准差——形状（变异度）参数正态曲线下的面积分布有一定规律正态分布具有可加性
死亡率：某地某年每 1000 人中的死亡率年龄别死亡率：某地某年龄组每 1000 人口中的死亡数死因别死亡率：某年每 10 万人中，由于患某疾病死亡的人数死因构成：相对死亡比，某种死因引起的死亡人数占总死亡人数的百分比
发病率：某一时期内特定人群中患某病新病例的频率患病率：某一时点某人群中患某病的频率（可大于 100%）病死率：某期间内，某病患者因某病死亡的频率治愈率：接受治疗的病人中治愈的频率
t X 0 ,v n 1 Sn
配对样本均数 t 检验：受试对象依特征配对，随机分别分配到两个实验组
t d Sd / n
两独立样本均数 t 检验：两总体服从正态分布，且总体方差齐
方差齐性：两独立样本的总体方差
2 1
2 2
Sc2
n1
1 S12
n1
(n2 1)S22 n2 2
方差不齐时两样本均数的 t’检验
⑶抽样误差：由抽样不同引起的样本均数与总体均数之间的差异。原因是个体之间存在变异，抽样时只能抽取总体的一部分作为样本。不可避免，要用统计方法进行正确分析。
概率：描写某一事件发生可能性大小的一个度量。频率：样本实际发生率
小概率事件：P<=0.05(差别有统计学意义)或 P<=0.01(差别有高度统计意义)的事件
总变异 SST ：n 个观测值的离均差平方和组间变异 SSTR ：组内均值与总均值之差的平方和组内变异 SSE ：组内各个观测值与本组内均值之差的平方和
（反映各组内样本的随机波动）
完全随机设计的方差分析表（自由度） F= t2
随机区组设计：又称配伍组设计，先将受试对象按条件相同或相近组成 m 个区组，每个区组中有 k 个受试对象，再将其随机地分到 k 个处理组中。（属于无重复数据的两因素方差分析）
（未考虑抽样误差的影响）区间估计：按预先给定的概率，计算出一个区间，使它能够包含未知的总体均数。
可信度：事先给定的概率 1-α(通常取 0.95 或 0.99)；计算得到的是可信区间 95%可信区间（ X 1.96 X ， X 1.96 X ）
假设检验：即显著性检验，是统计推断的重要内容，比较总体参数之间有无差别。首先对所需比较的总体提出一个无差别假设，然后通过样本数据去推断是否拒绝这一假设。
方差齐性检验
F
S12 S22
(较大) (较小)
，v1
n
1, v2
n
1
(P>0.05,可认为总体方差齐)
t’检验
u 检验：总体标准差已知，或样本量较大时，样本均数与总体均数的比较
t 检验中的注意事项 ⒈样本资料必须能代表相应总体 ⒉t 检验以正态分布为基础；非正态数据尝试变换为正态，或用非参数检验 ⒊完全随机设计的两样本均数比较，要求两组方差齐 ⒋对同一资料作单侧检验更容易获得显著结果 ⒌假设检验用于推断总体均数间是否相同；可信区间用于估计总体均数所在范围
百分位数(P)：在一组数据中找到一个数值 Px，全部观察值的 x%小于 Px。 P25, P75 描述资料的离散程度 P2.5, P97.5 规定医学 95%的参考值范围
【变异程度的统计描述】极差(R)：即全距，观察值中最大值与最小值之差。不适用于开口资料
四分位数间距(Q)：一组观察值按大小排序后，分成四个数目相等的段落，每段观察值占总例数的 25%，去掉两端含有极端数值的 25%，取中间 50%的数据范围即为 Q。（适用于偏态分布&开口资料） [Q=P75 - P25] Q 越大，则数据变异越大
配对四格表资料的 2 检验
观察结果的四种情况：①A+, B+ [a] ②A+, B- [b] ③A-, B+ [c] ④A-, B- [d]
公式：㈠ 2 (b c)2 , =1 bc
(b + c均差距。即各观察值与均数之差的绝对值之
和的平均。
平均偏差= X X n
离均差平方和：通过取平方避免正负抵消
SS X X 2
方差：离均差平方和再取平均，分母用自由度 v=n-1 代替 *自由度(v)：在所有的 n 个离均差平方项中，只有 n-1 个是独立的。

e商务文档

医学统计学笔记

相关文档推荐：