医学统计学符号-公式-重点
在偏态分布时,易受极值影响;
1. 当观察例数 n 为奇数时,中位
算术均数
数是按顺序排列在第(n+1)/2 项
算数均数(均数):线性尺度上的 n 为偶数时,中位
几何均数及应用
数是按顺序排列在第 n/2 和
几何均数:对数尺度上的平均水
(n/2)+1 项观察值的平均值;
几何均数
中位数
均数尺度 适用
线性 对称分布
对数
对数正态分布 (指数、等比分布)
顺序 偏态分布
单侧 95%=双侧 90%=1.645 μ±σ:68%
正态分布及应用
μ±1.96σ:95%
正态分布有两个参数 和 , 分别表示均数和标准差
μ±2.58σ:99% 二、医学参考值范围的制定方法
页脚内容7
医学统计学总结
平;
百分位数
1. 几何均数的对数等于各观察 百分位数 Px:指在一组数据中找
值对数的算术均数;
到这样一个数值,全部观察值的
页脚内容5
x%小于 Px ,其余(100-x)%大于 Px。
算术均数
几何均数
中位数
均数尺度 适用
线性
对数
对称分布
对数正态分布 (指数、等比分布)
顺序 偏态分布
医学统计学总结
定量:频数表/图
异
不同类型变异程度指标的比较
当μ=0,σ=1 时,称为标准正态
特点
极差
四分位数间距 方差和标准差
变异系数
特点
简单,粗略;不 稳定,受极端值
影响大
相对稳定;未使 用所有观察值
使用全部信息, 应用广泛
比较无量纲或多 组均数相差较大
数据
适用范围 所有数据
所有数据
对称数据
对称数据
分布 正态分布曲线下面积
算术均数
H0:
0,该地难产儿与一般
新生儿平均出生体重相同;
H1:
0,该地难产儿与一般
新生儿平均出生体重不同;
集中趋势的统计描述
表示组距。
一、统计描述
频数表和直方图的用途
1. 作为陈述资料的形式; 总体和样本具有同质和变异
两个特征。
2. 便于观察数据的分布类型;
集中趋势—同质的统计描 3. 便于发现资料中含有的异常
述;
值;
变异程度—变异的统计描 4. 可用各组段的频率作为概率
述;
的估计值;
统计描述主要通过统计量和 二、平均数
异质:个体观察值之间的变 异超出允许范围。
一、总体、抽样、样本、参数、 统计量
总体:同质的个体所构成的全体 研究对象。总体同时具有同质和
5、 资料:又称为数据,由变量 变异两个特点。
的观察值构成。
有限总体:总体中的个体
变异:个体观察值之间具有
数量是有限的。
的差异。
无限总体:总体中的个体
变异和同质是对统计学数据
医学参考值范围的制定方法
围。
(四)选择适当的百分范围
参考值的百分范围应根据
页脚内容8
医学统计学总结
第四章 抽样误差与假设检验
μd≠0,即治疗前后血清甘油三
假设检验(基本步骤)
酯差异有显著统计学意义。
1、 建立假设和确定检验水准; 建立假设(反证法的假设命题)
3)若 P> α,不能拒绝拒绝 H0 ; 认为μd=0,即治疗前后血清甘油 三酯差异无显著统计学意义。
计数资料:由离散变量的 观察值构成的资料。先将 观察对象的观测指标按性 质或类别进行分组,然后 计数各组的数目所得的资 料,例如性别、患病、血 型。
生活中随机性的例子(思 考题);
等级分组资料:由等级变 量的观测值构成的资料。 具有计数资料的特征,同 页脚内容2
医学统计学总结
时又具有半定量性质的资
反证法思想 小概率事件原理 关于α的说明
学意义”,即是否有证据 表明存在差异。
3. 界值代表容许犯错的最大概 率,是事先确定的,不能随便
1. 检验水准,显著性水平,即定
移动 。
义小概率事件;
假设检验的两类错误
2. 界 值 是 人 为 确 定 的 , 常 用 0.05,0.01;某些情况下可取 0.1,0.001;
单侧还是双侧检验—研究目的决 定
医学统计学总结
页脚内容11
医学统计学总结
第五章 t 检验
标准正态分布中 u 值大小与尾部
t 分布特征 自由度ν不同,曲线形态不 同,t 分布是一簇曲线;
面积(概率 )有关,以 u (单 侧)和 u /2(双侧)表示;
P、自由度 与 t 值关系
自由度ν越大,t 分布越接近 于正态分布;当自由度ν逼近
1. 在 t 分布中,t 值与 P、 的 大小有关;
∞时,t 分布趋向于标准正态 2. 在 t 分布中,当自由度一定时
分布;
P 越小,|t|越大;
自由度较小时,曲线峰的高度 3. 在 P 一定时,自由度越小,|t|
低于标准正态曲线,且曲线峰 越大,大于 u 值;
的宽度也较标准正态分布曲 线峰狭,尾部面积大于标准正 态曲线尾部面积,而且自由度 越小,t 分布的这种特征越明 显(翘尾低狭峰)。
医学统计学总结
第一章 医学统计中的基本概念 1、 医学统计学是研究医学数据 的收集、整理、分析、解释和呈 现其结果的一门学科。 2、 个体:研究的基本观察单位。 3、 变量:用于观察研究对象的 指标。 4、 观察值:个体变量的数值。
统计学是研究变异规律的科 学!
同质:个体观察值之间的变 异在允许范围内。
事件发生的可能性很小。
料,例如细菌培养阳性结 果。
“小概率事件”统计意义(两面 性)
二、3 种设计类型:完全随机设 计;配对设计;配伍组设计。
三、 抽样误差、概率和小概率事 件
抽样误差:由抽样引起的样 本统计量与总体参数之间 的差异。
小概率事件几乎不会发 生,或者说可以认为在一 次试验中不会发生→统计 推断基础(正面:应用);
1. 为了判断两组样本代表的总 体之间的差异是由抽样误差
1)计算获得 t 值的概率 P 值,并
还是总体之间本质差别引起
与检验水准α比较。
的?
2)若 P≤α,小概率事件发生, 2. 作假设。H0:抽样误差引起的;
矛盾,拒绝 H0 ,接受 H1;认为
H1 :总体本质差别引起的。
页脚内容9
医学统计学总结
也就是重心。
线图中位数描:述将某一统计 组量观随察另一 值连从续小性数 到值大变量变化而 变化的趋势
直 箱方 式按图 图顺序描 描排述 述列数 数,值 据居变 的中量 分的 布心频 特位数 征置分布的数值,
常用在对称分布,尤其是正态分 统计地图 描述某指标在地理区域的分布 记为 M。
布;
中位数的精确计算
随机性:保证总体中每个 个体都有相同的几率被抽样。
随机性是代表性的保证;
资料
计量资料
计数资料 (分类资料) 等级资料 (有序多分类资料)
二分类资料 无序多分类资料
计量资料:由连续变量的 观察值构成的资料。对每 个观察对象的观察指标用 定量方法测定其数值大小 所得的资料,一般有度量 衡单位,例如年龄、身高、 血糖。
数量是无限的。
的要求!
样本:从总体中随机抽取
变异是统计学研究的真正对
的部分个体。
象!
样本量:样本所包含的个
页脚内容1
医学统计学总结
体数目。 参数:刻画总体特征的指 标。 统计量:刻画样本特征的 指标。
抽样:从总体中随机抽取部分个 体的过程。抽样具有代表性、随 机性、可靠性、可比性; 原则:代表性:样本能充分反映 总体特征。
参考值范围估计主要有百分 位数法和正态分布法。 总结 衡量变异程度的指标
有些指标过高或过低均属异 常(A) ,故其参考值范围需要分
极差、四分位数间距、方差和 标准差、变异系数
别确定下限和上限,称作双侧参 正态分布的特征和曲线下面积分
考值范围。有些指标仅在过高(B) 布规律
或过低时为异常(C),只需确定其 上限或下限,称作单侧参考值范
(一)选择一定数量的参照样本; 资料的性质和研究目的选择,它
(二)对选定的参照样本进行准 确的测定;
(三)决定取单侧范围还是双侧 范围值;
与诊断阈值有确定的关系。百分 范围的不同将导致不同的假阳性 率和假阴性率。
(五)估计参考值范围的界限
(四)选择适当的百分范围; (五)估计参考值范围的界限; (三)决定取单侧范围还是双侧 范围值
• 样本量越大; 单样 t 检验的应用条件:
表明差异无统计学意义,按 0.05 水准不拒绝 H0,根据现
有样本信息,尚不能认为该地难
小样本资料(如 n<40)且服从正 产儿与一般新生儿平均出生体重
态分布,或大样本资料。
不同。
单样本 t 检验——检验步骤
配对样本均数 t 检验
1. 建立检验假设,确定检验水准 配对样本均数 t 检验:简称配对
4.在单侧时(尾部面积取单侧)t 界值表示为 t , , 双侧时表 示为 t /2, ,其意义为
单样本 t 检验原理
f (t) v v5
标 v 1
准
正 概率 、与 u 值关系
态
分
在 H0 : = 0 的假定下,可以 认为样本是从已知总体中抽取 的,根据 t 分布的原理,单样本 t 检验的公式为:
页脚内容12
小概率事件偶然会发生, 如果发生了→统计推断发 生错误(反面:警惕);
抽样误差的原因;抽样 误差是不可避免的。
概率 P:表示某事件发生的 可能性大小的度量。
小概率事件:统计学上习惯 将 P≤0.05 或 P≤0.01 的事 件称为小概率事件,表示该