统计分析培训ppt课件
理论上
–
当N和N(1- )均大于5时,或同样的,当X0和N-X0均大于5 时,样本计数近似服从均数为N,方差为N(1- )的正态分 布,样本率近似服从均数为,方差为(1- )/N的正态分布。
实际上
–
当Np和N(1- p)均大于5时,或同样的,当X0和N-X0均大于5 时,样本计数近似服从均数为Np,方差为Np(1- p)的正态分 布,样本率近似服从均数为p,方差为p(1- p)/N的正态分布。
– –
演习:随机抽查某乡村民100人,发现感染血吸虫者21人,该 乡血吸虫感染率? 利用可信区间推断样本是否来自于一已知总体
– –
查表法 正态近似法
演习:已知某地区血吸虫感染率为15%,现随机抽查某乡村 民100人,发现感染血吸虫者21人,问该乡血吸虫感染率是否 高于一般?
总体百分构成或总体率的统计推断
– –
均数:p1 - p2 方差:S2(p1-p2)=p(1-p)(1/n1+1/n2),p=(X1+X2)/(n1+n2)
利用可信区间 利用假设检验
– –
正态近似法 2检验法
演习:随机抽查A乡村民100人,发现感染血吸虫者21 人,随机抽查B乡村民100人,发现感染血吸虫者15人, 问AB两乡血吸虫感染率是否相同?
Poisson分布的性质及其集中趋势和离散趋势
Poisson分布资料的性质
–
–
–Leabharlann 平稳性:样本计数大小只与观察单位的大小有关 独立性:各所关心事件的发生与否互不相关 普通性:所关心事件离散发生,无聚集性
Poisson分布的均数
–
样本计数:X0
样本计数:X0
Poisson分布的方差
–
Poisson分布的单位问题及正态近似
演习:已知某地区血吸虫感染率为15%,现随机抽查某乡村 民100人,发现感染血吸虫者21人,问该乡血吸虫感染率是否 高于一般?
两个样本百分构成或两个样本率比较的统计分析
两个率比较的目的是其所代表的总体率相同,即:1 = 2 或 1 - 2 = 0 (无效假设) 两个样本率之差的均数和方差
10人中B型血人数X的概率分布图
100人中B型血人数X的概率分布图
举例:二项分布近似正态分布示意图
总体百分构成或总体率的统计推断
点估计
– –
p 百分构成或率:p = X0/N 常规疗法治疗流行性出血热病人50例,死亡8例,病死率为16% 查表法(基于二项分布的确切概率) 正态近似法
区间估计
– –
查表法 正态近似法
演习:长期观察可知沪闵高架一个月发生交通事故50起,上 个月发生60起,问上个月交通事故发生数是否多于往常?
Poisson分布的正态近似
–
–
Poisson分布资料总体计数的统计推断
点估计
– –
X0 沪闵高架某天发生交通事故6起 查表法(基于Poisson分布的确切概率) 正态近似法
区间估计
– –
演习:沪闵高架上个月发生交通事故60起,沪闵高架一个月 发生交通事故数? 利用可信区间推断样本是否来自于一已知总体
利用假设检验推断样本(样本率为p)是否来自于一已知总体 (总体率为0)
–
基本步骤 1、建立无效假设和备择假设H0: = 0; H1: 0 2、确定检验水准 = 0.05 3、在无效假设的前提下直接计算概率或利用正态近似法计算检 验统计量后找到p值 a、确切概率法 b、正态近似法 4、根据概率或p值作出推断
统计分析培训教学
二项分布资料的统计分析
二项分布 Binomial Distribution
二分类变量:有且只有两种结果的变量,如性别、死 亡生存、复发未复发,一般用0和1表示其结果 Bernouli试验:具有两值结果的一次试验。条件:1、 互斥的有且只有两种结果;2、独立性;3、每次关心 结果的发生概率不变。 二项分布:进行的N次Bernouli试验中,所关心结果 按不变概率发生0、1、2、…、N-1、N次的概率分 布 N N X N ! N X P X 1 , X X ! N X ! X
虽然观察单位不是Poisson分布的参数,但Poisson 分布资料的统计分析一定要注意单位的转换
– –
Poisson分布资料的可加性 观察单位的不可扩展性但可缩减性:大观察单位可转换为小 观察单位但反之不可 当(样本为X0)大于50时,样本计数X近似服从均数和方差 均为 (样本为X0)的正态分布。 当(样本为X0)大于50时,如将大观察单位缩减为1/n的小 观察单位,转换后的样本计数X’服从均数为/n (样本为 X0/n),方差为/n2(样本为X0/n2)的正态分布
Poisson分布资料的统计分析
Poisson分布
单位时间、面积、空间内所关心事件发生数的概率分 布 二项分布数据当N很大X0很小(比例很低)时X的概率 分布 例:沪闵高架1天中发生的交通事故数(注:交通事故 发生的时间可以短至1秒)。 X PX e 一个参数(对于样本X0)。 X! Notation:X~P()。 练习:长期统计数据显示:沪闵高架一天发生交通事 故5起,问今天发生0,1,2,3,4,5起交通事故的概率?最 多(至少)发生3起的概率?
二项分布 N人中B型血人数X的概率分布
0.5 0.4 0.3 0.2 0.1
0.08
1.60E-01 1.40E-01 1.20E-01 1.00E-01 8.00E-02 6.00E-02 4.00E-02 2.00E-02 0.00E+00
0.08
0
0 1
2
3
4
5
6
7
8
9
0
2
4
6
8
10 12 14 16 18
练习:4张牌里有一张A,放回抽样抽5次,抽到 0,1,2,3,4张A的概率是多少?至少抽到2张A的概率?
二项分布的集中趋势和离散趋势
二项分布的均数
–
–
样本计数:X0=np 样本率:p 样本计数:Var(X)=np(1-p) 样本率:Var(p)=p(1-p)/n
二项分布的方差
–
–
二项分布近似正态分布