当前位置:文档之家› 医学统计学的基本内容.ppt

医学统计学的基本内容.ppt

•医学上常用统计概率:对某一随机现象进行大量观察后得到的 •百分数,如高血压患病率,乳腺癌术后五年生存率。
频率
频率(frequency):是通过样本研究计算出的。 某药治愈率=治愈70人/总治疗100例病人
=0.70 概率是理论参数,频率是概率的可能值。 当观察例数越来越多时,频率越来越接近概率。
医学统计学的差不多内 容
统计学是一门运用概率论和数理 统计的差不多原理研究数据收集、整 理和分析的方法学,医学统计学方法 是统计学在医学领域中的应用。
要紧内容
➢医学统计学的差不多概 念 ➢统计资料的类型
➢医学统计工作的差不多步骤
➢统计表与统计图
第一节 医学统计学的差不多概 念
【一】同质和变异 【二】总体与样本 【三】参数与统计量 【四】误差 【五】概率
三类资料间关系
例:一组2040岁成年人的血压(舒张压)
<8 低血压
等 8 正常血压
级 资 料
12 15
轻度高血压 中度高血压
17 重度高血压
计量资料 计数资料
以12kPa(90mmHg)为界分为
正常与异常两组,统计每组例
数。
变量的转换:
依照研究的需要,可将变量重新编码.
1. 定量变量测定数据可转换成有序分类变量的数据,或 二分类数据。甚至可变换成无序分类变量的数据。如年 龄变量的测定值可等级化为有序分类数据。 连续变量:(1, 2, 3, … , 87)岁;
第二节 统计资料的类型
在收集医学研究的资料时,首先要依 照研究目的确定观察单位,然后对观察单 位的某个特征—变量(variable)进行观察或 测定。观察结果或测定值称为变量值。
第二节 统计资料的类型
【一】数值变量 【二】分类变量 【三】变量的转化
数值变量(numerical variable):
其变量值是用定量方法测得的, 变量值有大小之分,一般有度量衡单 位。所得的资料称为计量资料。
分类变量(categorical variable):
又称定性变量。其变量值是用定 性方法得到的,通常将观察单位按某 种属性或类别分组,然后汇总各组个 数所得到的数值。
1.无序分类变量
①二项分类变量 ②多项分类变量 无序分类变量构成的资料称为计数资料。 2.有序分类变量 有序分类变量构成的资料称为等级资料。
观察单位 observations
个体individuals
Units;elements
变量 varia 计 量资料
Qualitative data 计 数资料
等级资料 Rank data
变量的转化
不同类型的变量其统计处理方法 不同。在实际工作中,依照统计分析 的具体要求和研究目的,各种不同的 变量间能够互相转化。
2. 有序分类能够用数值 表示其等级关系。
如:无效=0,好转=1, 显效=2,治愈=3:
3. 多分类变量的重新编码
职业:工人,农民,商业, 学生,职员:
第三节 医学统计工作的差不多步骤
【一】研究设计(research design) 【二】收集资料 (data collection) 【三】整理资料 (data sorting) 【四】分析资料 (statistical analysis)
【一】同质和变异
同质(homogeneity): 是指观察单位或观察指标受共同因素
制约的部分。 变异(variation):
是指在同质的基础上个体间的差异。
例1 调查2003年长沙市7岁男童的身高和体重 同质:2003年、长沙市、7岁男童 变异:身高和体重各不相同
例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同
四个步骤是相互联系、不可分割的。
统计学在科研活动各个阶段的作用
1. 【一】医学研究设计(design)
2. 专业设计:包括研究目的、意义、创新性、研究 对象(纳入标准和排除标准) 、研究内容与方法、观 察指标的设立、研究进度及预期结果等。
对样本数据进 行观察或计算 统计指标, 目的是推论总 体。
【三】参数与统计量
参 数 (parameter) : 根 据 总 体 中 全 部 个 体 值计算出来的描述总体特征的指标。参数 一般用希腊字母表示,如总体均数μ、总 体率π等。(一般是未知的,或假设的)
统计量(statistic):根据样本中个体值计算 出来的描述样本特征的指标。统计量用拉 丁字母表示,如样本均数x、样本率p。
样本(sample): 是指从总体中随机抽取部分观察单位某
项指标实测值的集合。 由于直截了当研究总体通常是不可能
的,故一般采用抽样研究。 抽样(sampling):
从总体中抽取部分个体的过程称为抽样
随机抽样 (random sampling)
为了保证样本的可 靠性和代表性,需 要采用随机的抽样 方法(在总体中每 个个体具有相同的 机会被抽到)。
【四】误差
误差(error):泛指观测值与真值之差。 随机误差:
在随机误差中,最重要的是抽样误差 (sampling error)。抽样误差是抽样引起的样本 统计量与总体参数之间的差异。抽样误差有规律可 循,样本越大,抽样误差越小。
系统误差 过失误差
【五】概率
概率(probability):是描述某一随机事件发 生可能性大小的指标,常用P表示,取值范 围0≤P≤1。 小 概 率 事 件 : 统 计 学 上 把 概 率 P≤0.05 的 事 件称为小概率事件。
统计资料的几种类型
变量类型
变量值表现
实例
资料类型
数值变量
定量(具体数值)
身高(cm) 计量资料
分 类
无 序

量有

二分类 多分类
对立的两类属性 不相容的多类属性
疗效(有效、无效) 计数资料
血型(A,B,O,AB)
多分类
有程度差异的多类属 性(又称等级资料)
文化程度(初中、 高中、大学...)
等级资料
观察单位(observed unit):亦称个体 (individual),是统计研究中最差不多的 单位,能够是一个人,一个样品等。
【二】总体与样本
总体(population): 是指依照研究目的所确定的同质观
察单位的全体,更确切地说,是同质的 所有观察单位某项观察值的集合。
分为有限总体和无限总体两类。
相关主题