统计学(第一章) 绪论
例1.2: 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差为=4.79cm,试估计该地 8岁男孩身高在130cm以上者占该地8岁男孩总 数的百分比?
征就称为变量。被观察单位的该项特征值为变量值。
二、统计学的若干概念
变量的类型
数值变量
◆ 数值变量: ◆分类变量:
通过确定每个观察单位的某项特征的性 通过测定每个观察单位的某项特
B.
C. D.
E.
抽样时应使得总体中的每一个个体都有同 等的机会被抽取 研究者在抽样时应精心挑选个体,以使样 本更能代表总体 随机抽样即随意抽取个体 为确保样本具有很好的代表性,样本量应 越大越好 选择符合研究者意愿的样本
练习:
5、对某地200名16岁中学生口腔 检查,发现龋齿的人数54人, 该资料属于( B )
如:某药治疗200个病人,其治愈率为80% 。
二、统计学的若干概念
频率与概率
Certain
1
必然事件 随机事件 不可能事件
P = 1
0 < P < 1 0.5
P = 0
Impossible
0
统计分析中的很多结论都是带有概率性的。 习惯 上将 P≤0.05或P ≤ 0.01 ,称为小概率事件,表示在 一次实验或观察中该事件发生的可能性很小,可以视为 很可能不发生。
第2步
收集资料
第3步
整理资料
第4步
分析资料
练习
练习:
1.统计学中所说的有代表性的样 本指的是( ) E
随意抽取的总体中任意个体 有意识地选择总体中有典型个体 依照研究者要求选取总体中有意义的个体 最方便获取的部分个体 依照随机原则抽取总体中的个体
A. B. C. D. E.
练习:
2.下列变量的观测结果属于等级 资料的是( D )
二、统计学的若干概念
同质与变异
例:研究某地2005年活产婴儿的出生体重。
同质性: 研究对象具有相同的状况或属性等共性。 变异:同一总体内的同质的各观察单位其某变量值之间的差异。
例如:研究某新药治疗胃溃疡的效果?
二、统计学的若干概念
总体与样本
总体:根据研究目的确定的同质观察单位的全体。
如:欲研究2009年厦门市成年人高血压患病率情况 。 • 根据总体中观察单位数是否已知,分为: 有限总体: 有确定的时间、空间和有限个观察单位。
白细胞计数 住院天数 门诊就诊人数 患者病情分级 各临床科室的患者数
A. B. C. D.
E.
练习: 3.抽样的目的是(
A. B.
B
)
C.
D. E.
研究样本统计量 由样本统计量推断总体参数 研究典型案例 研究总体统计量 研究特殊个体特征
练习:
4.关于随机抽样,下列哪一项说法 是正确的( A )
A.
样本:是指总体中的一部分观察单位的某项变量 值的集合,必须对总体具有代表性。
如:欲调查某地2005年活产婴儿的出生体重 欲研究某药治疗胃溃疡的效果
二、统计学的若干概念
误差
泛指测量值与真值之差.
包括: 系统误差
随机测量误差
抽样误差
二、统计学的若干概念
误差 系统误差: 指数据搜集和测量过程中 由于仪器不准确、标准不规范 等原因,造成观察结果呈倾向 性的偏大或偏小,这种误差称 为系统误差。
计量资料 计数资料 总体 个体
练习:
1.在研究工作中 随机测量 误差是不可避免的, 系统 误差是可以而且应该避免的,统计方法能 处理的是 误差。 抽样
2.统计工作的四个步骤 收集资料 ,整理资料 , 分析资料 。 是: 设计 ,
练习:
某年级甲班、乙班各有50人。从 两个班各抽取10人测量身高,并求其 平均身高,如果甲班的平均身高高于 乙班,能否推论甲班所有同学的平均
质或类别得到的数据,例如,职业、性别等 征的大小得到的数据。有 度量衡单位。
分类变量 包括:无序分类变量:多分类变量(血型) 连续型变量:如,血压、身高、体重等。
离散型变量:如,一月中的手术病人数,
有序分类变量:疗效(好、中、差) 一年里的新生儿数等。
二分类变量(性别)
二、统计学的若干概念
变量的类型
计数资料
以12kPa(90mmHg)为界分为正常与
异常两组,统计每组例数。
二、统计学的若干概念
变量的类型
资料类型
数值变量 无序分类变量 分类变量 有序分类变量 等级资料 计量资料 计数资料
二、统计学的若干概念
统计资料类型:
资料类型
计量资料
变量类型 示例
数值变量 人体身高 170cm 168cm 171cm 无序分类 性别 变量 男 女 有序分类 治疗效果 变量 痊愈 好转 无效
• 例1.1
北京大学一个课题组欲研究人们经常食用的 一种食品是否含有雌激素,是否对小鼠有 雌激素作用。
统计学设计: 1.需要多少大鼠?2.如何分组? 3.如何设立对照?4.是否使用盲法? 5.选用何种指标表示雌激素作用?
6.选用何种统计方法?
一、学习卫生统计学的意义
• 例1.2 :
★ 德国(1960年代初),药物酞胺哌啶酮(又称反应停)
无限总体:没有确定的时间、空间限制,观察单位数为无限。
二、统计学的若干概念
总体与样本
为了保证样本的可靠性和代 表性,需要采用随机的抽样方 法(在总体中每个个体具有相 同的机会被抽到)。
总体
抽取部分观察单位 样本
总体与样本的关系
μ?
统计推断
X
例1.2: 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差为=4.79cm,试估计该地 8岁男孩身高在130cm以上者占该地8岁男孩总 数的百分比?
三、统计工作的步骤
第 1步
设
计
制定计划,对整个过程进行安排。是整个工作 的关键。如何进行设计?举例。背景-目的-方 法-内容-经费预算 根据计划取得可靠、完整的资料。收集资料的 方法有三种:统计报表、日常性工作、专题调 查。注重资料的真实性。 原始资料的整理、清理、核实、查对,使其条 理化、系统化便于计算和分析。可借助于计算 机(常用软件:EPI、SPSS、SAS)。 统计学的关键所在。运用统计学的基本原理和 方法,分析计算有关的指标和数据,揭示事物 内部的规律。包括统计描述和统计推断。
计量资料 计数资料 等级资料 经变量转换也可以作为计量资料
A. B.
C.
D.
练习:
6、下面的变量中,属于分类变量 的是( B )
A.脉搏 B. 血型 C.肺活量 D.红细胞计数 E.血压
练习: 7、某人记录了50名病人体重的测定结果:小于
50Kg的13人,介于50Kg和70 Kg间的20人, 大于70 Kg的17人 ,此种资料属于( C )
变量转化:变量只能由高级向低级转化: 连续型 有序 分类 二分类
离散型变量常常通过适当的变换或连续性校
正后借用连续型变量或有序变量的方法来分析。
二、统计学的若干概念
变量的类型
例:一组2040岁成年人的血压(舒张压) <8 低血压 正常血压
等 级 资 料
8
计量资料
12
15 17
轻度高血压
中度高血压 重度高血压
特点:可避免,不可估计其大小。
二、统计学的若干概念
误差 随机测量误差:
在消除了系统误差的前提下,由于非人为的偶然因素, 对于同一样本多次测定结果不完全一样,结果有时偏大有 时偏小,没有倾向小。
二、统计学的若干概念
误差 抽样误差:
总体
抽取部分观察单位 样本
卫生统计学
王秀琴
工作生活中常见的统计学问题
如何判断药物的疗效?(假设检验) 体育彩票能否中奖?(概率论) 子女为什么象父母,其强度有多大? (相关与回归)
第一章
绪论
一、学习卫生统计学的意义
概念
统计学:是关于数据的收集、整理、分析、解释和表述的科学。
数理统计学
应用统计学
卫生统计学:是数理统计学的基本原理和方法在医学 领域中的应用,是关于医学研究中资料的收集、整理、分 析、解释和表述的一门科学。
统计指标
平均数, 标准差
统计分析方法
t,Z,F,直线相 关与回归
计数资料
率,比, 构成比
卡方检验,Z 检验
例1.2: 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差为=4.79cm,试估计该地 8岁男孩身高在130cm以上者占该地8岁男孩总 数的百分比?
等级资料
构成比
秩和检验
二、统计学的若干概念
观察单位与变量 变量的类型
同质与变异 总体与样本 误差 概率与频率
二、统计学的若干概念
观察单位与变量
例:欲观察某地2000年7岁正常儿童的身高。 观察单位:某地2000年每个7岁正常儿童
被观察或测量对象的最基本单位,也称个体,可以是一
个人、一个动物或一个采样点等。 变量:身高 对每个观察单位的某项特征进行测量或观察,该项特
疗慢性咽炎疗效有无差别,将病情相似的80名患
者随机分成两组,分别用两种药物治疗。
药物 疗效 合计
有效
兰芩口服液 银黄口服液 合计 41 24 65
无效
4 11 15 45 35 80
问题:这两种药物的疗效是否相同?
一、学习卫生统计学的意义
例1.5 某研究者欲评价新药按摩乐口服液治疗高 甘油三脂血症的疗效,将高甘油三脂血症患者 189 例随机分为两组,分别用按摩乐口服液和山楂精降 脂片治疗,数据见表10-4,问两种药物治疗高甘油 三脂血症的疗效有无不同?
A.计量资料 B.计数资料 C.等级资料 D.无序分类的计数资料 E. 名义变量资料