当前位置:
文档之家› 统计学 三大分布-经典案例全集
统计学 三大分布-经典案例全集
§2.3 常用的离散型分布: . 常用的离散型分布: 超几何分布→二项分布→泊松分布/正态分布 超几何分布→二项分布→泊松分布 正态分布 *六、超几何分布
* √四、二项分布
* √七、泊松(Poisson)分布 一、退化分布 二、两点分布 三、离散均匀分布
注解:凡是带有×可以不讲,√都是重点,*都是难点
离散分布之一:超几何分布 二项分布 离散分布之一:超几何分布vs二项分布
1,超几何分布:基本意义/期望方差 与二项 ,超几何分布:基本意义 期望方差 期望方差/与二项 分布的关系 2,二项分布:基本意义 期望方差 与超几何 期望方差/与超几何 ,二项分布:基本意义/期望方差 分布的关系 有放回抽样模型=重复抽样模型 重复抽样模型=二项分布 有放回抽样模型 重复抽样模型 二项分布 B(n,P),EXCEL:BINOMDIST(k,n,P,逻辑值 逻辑值) 逻辑值 不放回抽样模型=不重复抽样 不重复抽样=超几何分布 不放回抽样模型 不重复抽样 超几何分布 H(n,N1,N), EXCEL:HYPGEOMDIST(k,n,N1,N)
k N1
n 0 C N 1C N 2 n CN
Cn0P0qn , Cn1P1qn-1, Cn2P2qn-2 … CnkPkqn-k… CnnPnq0
λ λ λ λ λ λ0e−λ/0!, λ1e −λ /1!,λ2e −λ /2 … λke−λ/k! … λne−λ/n! ,
超几何分布→二项分布→泊松分布/ 超几何分布→二项分布→泊松分布/正态分布
伦敦上空的鹰究竟是有目的的轰炸行为还是随机的行为? 伦敦上空的鹰究竟是有目的的轰炸行为还是随机的行为? 二次世界大战期间, 二次世界大战期间,德军飞机对英伦三岛进行了无数次的轰炸 空袭行动,为了了解英军情报是否泄密,英国密码是否被破译, 空袭行动,为了了解英军情报是否泄密,英国密码是否被破译, 英国情报机构对英国各被轰炸地区进行一项统计调查, 英国情报机构对英国各被轰炸地区进行一项统计调查,他们对 伦敦划分成586区,统计每个地区实际被轰炸次数如下: 每个地区实际被轰炸次数如下: 伦敦划分成 区 统计每个地区实际被轰炸次数如下 X= 0 1 2 3 4 5 6 7… 7 1 0 0… 频数 229 221 93 35 EX=0.93次=λ=nP但是德军空袭次数n未知,理论被炸区数 但是德军空袭次数n 次 λ=nP但是德军空袭次数 未知, P(λ P(λ)=231.2 215 100 31 7.2 1.34 0.2 0.02 结论:德军的空袭对任何地区发生的概率均等, 结论:德军的空袭对任何地区发生的概率均等,且每次空袭袭 击任何地区的概率都是P 试验属于n 击任何地区的概率都是P,试验属于n重独立试验 类似案例:公司销售数据概率分布的获得, 类似案例:公司销售数据概率分布的获得,如eg2.20 2,….,10, 12,…, k,…mean=EX= mean=EX=λ X= 0, 1, 2, .,10, 11, 12, , k, mean=EX=λ 频率f=f Pk…实际概率 实际概率f 频率f=f0 f1 f2 … f10 f11 f12… Pk 实际概率f P(X)= P0 P1 P2 … P10 P11 P12… Pk…理论概率P Pk 理论概率P 理论概率 |fi-Pi|<a(阈值 then概率分布为P(X),否则, 阈值) 概率分布为P(X) If Σ|fi-Pi|<a(阈值) then概率分布为P(X),否则,非P(X)
销售数据
实际销售数据概率
销售累计概率=不脱销率 销售累计概率= 4.53999E4.53999E-05 0.000453999 0.002269996 0.007566655 0.018916637 0.037833275 0.063055458 0.090079226 0.112599032 0.125110036 0.125110036 0.113736396 0.09478033 0.072907946 0.052077104 0.03471807 0.021698794 0.012763996 4.53999E4.53999E-05 0.000499399 0.002769396 0.010336051 0.029252688 0.067085963 0.130141421 0.220220647 0.332819679 0.457929714 0.58303975 0.696776146 0.791556476 0.864464423 0.916541527 0.951259597 0.97295839 0.985722386
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
图示:实际销售数据概率/不脱销率的变化规律
销售数据概率 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 1 3 5 7 9 11 13 15 17 19 21 销售数据概率
销售累计概率=不脱销率 1.2 1 0.8 0.6 0.4 0.2 0 1 3 5 7 9 11 13 15 17 19 21 销售累计概率=不 脱销率
0.2 0.15 0.1 0.05
5
10
15
20
一、超几何分布→二项分布:案例分析 案例: 产品 产品, 任取3 案例:10产品,3-7+;100件,30-70+,任取 ; 件 任取 无放回: 1 2 3 无放回:X= 0 P(X=)=C73/C103 C31C72/C103 C32C71/C103 C33/C103 0.2917 0.525 0.175 0.0083 C703/C1003,C301C702/C1003,C302C701/C1003,C303/C1003 0.339 0.448 0.188 0.025 有放回=C 有放回 300.73 C310.310.72 C320.320.71 C330.33 0.343 0.441 0.189 0.027 显然: 显然:当N→+∞,H(n,N1,N2,N)→b(n,P) →+∞,H(n,N1,N2,N)→b(n,P) 图形分析: 产品总量N越大,n/N越小 则越接近! 越小, 图形分析:1,产品总量N越大,n/N越小,则越接近! 得到正态模型! 2,两者图形向两边延伸 ,得到正态模型!
结论: 超几何分布→ 结论:当n<<N(n<=0.05N)超几何分布→二项分布 超几何分布
0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4
0.5 0.45 0.4 0.35 0.3 超几何分布 0.25 二项分布 0.2 0.15 0.1 0.05 0 1 2 3 4
超几何分布 二项分布
案例: 案例:二项分布适用范围
1.所有卖场销售数据:每天进场人数n不详,每天购买概率 所有卖场销售数据:每天进场人数 不详 不详, 所有卖场销售数据 P未知,但是每天销售数据 已知,如何求解销售数据的 未知, 已知, 未知 但是每天销售数据nP已知 概率分布? 概率分布? 好又多家乐福沃尔马/苏宁国美 苏宁国美/DELL/本田 万科 本田/万科 好又多家乐福沃尔马 苏宁国美 本田 2.电子商务销售数据:已知点击人数 购买率 ,购买人数 电子商务销售数据: 购买率P, 电子商务销售数据 已知点击人数n,购买率 np,求解分布 阿里巴巴 当当购物 阿里巴巴/当当购物 ,求解分布-阿里巴巴 3.网络邮箱 网络硬盘使用率:点击使用藤讯人数n,邮箱或 网络邮箱/网络硬盘使用率:点击使用藤讯人数 邮箱或 网络邮箱 网络硬盘使用率 硬盘使用率P,使用人数nP, 硬盘使用率 ,使用人数 , 藤讯QQ/网易 网易/163/Hotmail/MSN/yahoo…. 藤讯 网易 4.饭店 酒店食物定购:真功夫 麦当劳 肯德基 饭店/酒店食物定购 麦当劳/肯德基 饭店 酒店食物定购:真功夫/麦当劳 5.自己开店:花店 电脑城 自己开店: 电脑城/……如何进货销售曲线 自己开店 花店/电脑城 如何进货销售曲线 注解:案例1+5属于 属于n,p未知,案例 未知, 属于n,p已知 注解:案例 属于 未知 案例2+3+4属于 属于 已知
10=3次+7正,任取3件, 有放回 无放回
100=30次+70正,任取3件, 有放回 无放回
理论基础 数据: 总体个数, 总体中A的个数 数据:N=总体个数,N1=总体中 的个数, 总体个数 总体中 的个数, n=样本个数,k=样本中 的个数; 样本中A的个数 =样本个数, 样本中 的个数; 逼近关系: 逼近关系:
*√本节重点难点:超几何分布的极限分布是二项分布,二 项分布的极限分布是 Poisson 分布
课件分布规律与上课指南: 课件分布规律与上课指南: 1.离散分布之一:超几何与二项 离散分布之一: 离散分布之一 2.离散分布之二:二项与泊松 离散分布之二: 离散分布之二 小结:超几何转二项, 小结:超几何转二项,二项转泊松正态 3.离散分布之三:四大分布数字特征 离散分布之三: 离散分布之三 4.附录 附录 注意1:附录三有各种分布的EXCEL求解公式 注意 :附录三有各种分布的 求解公式 注意2:上课可以先将几个不重要的分布, 注意 :上课可以先将几个不重要的分布,在附录 1-退化 两点 退化/两点 均匀分布先简介30分钟 退化 两点/0-1/均匀分布先简介 分钟,再 均匀分布先简介 分钟, 用90分钟讲解四大分布及其关系 分钟讲解四大分布及其关系
N件产品,其中N1件次品 不放回抽n,其中次品k件 超几何分布 n<=0.05N N件产品,次品率N1/N n<<N 放回抽n,其中次品k件
二项分布
Ex.案例:已知一麻袋种子,(共有 万颗,其中 万颗 案例:已知一麻袋种子, 共有 万颗,其中90万颗 共有100万颗 万颗) 案例 发育正常90%,今从其中任取 粒,求播种后 恰有 粒 恰有8粒 发育正常 ,今从其中任取10粒 求播种后(1)恰有 (2)至少有 粒发芽的概率?(3)取1万颗,>8000发芽概率 至少有8粒发芽的概率? 取 万颗, 发芽概率 至少有 粒发芽的概率 万颗