当前位置:文档之家› 随机抽样及随机分组-课件PPT

随机抽样及随机分组-课件PPT


• 研究肥胖对冠心病的影响情况;
• 研究当今中国儿童生长发育情况;
• 研究分析经济危机形成的原因;
• 。。。。等。
•3
调查研究资料的特点
• 无法随机化分组 • 组间不均衡 • 存在混杂因素
• 例如, 肥胖对冠心病的影响研究中,研究者不可 能象药物研究那样, 随机地安排一部份人去肥 胖,安排另一部人不肥胖。两组人群中存在着很 多因素不均衡的因素混杂, 从而需要特殊的统 计学设计和分析。
中,建立数据库.
• 2 产生随机数 点击
• 设计→实验设计→随机化方法→分层抽样 • 选择分层变量:班级
每个班人数都赋值为3 • →数据 查看抽样结果: 1标记为被抽取对象
•22
练习题
• 现某年级2个班,1班6名同学,2班9名同学, 现要从1班随机抽取2名同学, 2班随机抽 取3名同学参加比赛,如何抽取?
•19
• 优缺点 优点是在大规模调查中,整群抽样 易于组织,可节省人力物力,容易控制调 查质量;缺点是一般来说各群间差异较大 ,所以抽样误差较大。
•20
㈣分层抽样
• 先按影响观察值变异较大的某种特征,将总体分为 若干层(strata),再从每层内随机抽取一定数量的 观察单位组成样本(样本含量为n)又称分类抽样。
•12
CHISS的实现
• 例如,现在某校有500名研究生,要随机抽 取10%,即50同学参加比赛,问:该如何抽取?
•13
CHISS实现
• 1 编号建数据库 将500学生的学号录入数据库 中,建立数据库,并每人给一个编号从1,2,…500 .
• 2 产生随机数 点击
• 设计→实验设计→随机化方法→产生随机数 • 选择条件:正态分布,数据行数为500,正态分布
•23
各种抽样方法抽样误差的关系
• 各种抽样方法的存在抽样误差,一般是: • 整群抽样单纯随机抽样系统抽样分层
平均数为0,标准差为1 • 3 排序 按随机数从小到大排序,前50名即为所
求 • 数据→行编辑→数据排序 选变量:RND正态 • →数据
•14
练习题
• 现在某班有20个同学,要从中随机抽取5名参 加比赛,如何平公的进行抽取?
•15
㈡系统抽样
• 系统抽样又称等距抽样或机械抽样。方法是按照 一定顺序,机械地每隔若干个观察单位抽取一个观 察单位组成样本。
• 优缺点 ①抽样误差比较小;②先要将总体分层, 层内个体差异越小越好,层间个体差异越大越好, 便于对不同的层采用不同的抽样方法。
•21
CHISS的实现
• 例如,某校有3个不同专业的研究班,每班10个同学,现 要从每班各随机抽取3名同学参加比赛,如何抽取?
• CHISS实现步骤: • 1 编号建数据库 将30学生的学号及班级录入数据库
• 抽样调查是统计学上第一次技术革命. • 抽样调查技术通过部分认识整体,同时,节
省大量时间大量的人力,物力和成本。
•8
优缺点
学问题只能作抽样调查 ,如药物疗效观察等。
• 缺点:调查设计、实施及资料分析复杂,若样本 达到总体75%时则直接采用普查。
•11
㈠简单随机抽样 P10
• 简单随机抽样亦称单纯随机抽样要求每个观察对 象有同等概率被选入样本。
• 从有N个观察单位中抽取m个观察单位方法: • 先将N个观察单位编号,并且每个赋一个随机数。
再将N个随机数排序,前m个随机数对应的观察 单位编号即为所抽取。 • 优缺点 简单随机抽样是最基本的抽样方法,优 点是均数(或率)及其标准误的计算简便,缺点是 当总体例数较多时,实施抽样比较困难。适用于 小型调查。
随机抽样及随机分组
童新元 中国人民解放军总医院
•1
设计类型
•干预试验 (动物实验,临床试验) •观察研究
•2
调查研究设计
• 研究者无须或无法施加干预措施,而是对现
场发生的实际情况进行观察,称为调查研究
(Investigation
Study),亦称观察研究(
observation study)。例如:
• 例如:上述例子中我们抽取的住户均为单 号,其住房可能都是一个朝向,若作采光等卫 生学调查,将产生明显的偏性。
•17
• 典型案例:央视收视率调查
•18
㈢整群抽样
• 先将总体划分为K个群,每个群包括若干 个观察单位,再随机抽取t个“群”(kt) ,并将被抽取t个群的全部观察单位组成样 本。
• 例如:要检查某学校学习情况时,随机抽取 几个班,对几个班的全部同学进行考查。
•4
调查方法
• 根据调查的范围和调查对象的选择方式可 分为:
• 普查 • 抽样调查
•5
普查(overall survey)
• 亦称全面调查(complete survey),将组成 总体的所有观察单位全部加以调查
• 普查一般都是用于了解总体某一特定“时点” 的情况,如年中人口数、时点患病率等。
• 如我国人口普查等。
• 例如,在美国大选中,对1000名至3000名选民 进行调查,来预测近1亿选民的投票情况,抽样 误差不超过3%。
•9
抽样研究的两个重要问题
• 抽样的样本大小 • 怎样抽样
•10
随机抽样方法
• 简单随机抽样(simple random sampling) • 系统抽样(systematic sampling) • 分层抽样(stratified sampling) • 整群抽样(cluster sampling)
•6
• 优点: • ①理论上只有普查才能取得总体参数,因
为普查没有抽样误差; • ②普查能全面地了解总体的分布特征。 • 缺点: • ①普查工作量大,较费时费力; • ②调查质量难以保证,系统误差大。
•7
抽样调查(sampling survey)
• 抽样调查是从总体中随机抽取一定数量的 观察对象组成样本,用样本信息推断总体 特征。
• 例如:要从1000户中抽取100户作样本,可先在门 牌号1~ 10号之间随机抽取一户(假定为第5号住户 ),其后每间隔10号抽取一户,即抽取5、15、25、35 、…、995,共100户组成样本。
• 抽样间隔=总数/样本含量
•16
• 3.优缺点 优点是易于理解,简便易行,容易得 到一个按比例分配的样本;缺点是一般情 况下,虽然系统抽样的抽样误差小于简单随 机抽样,但是在某些特殊情况下可能有偏性 。
相关主题