4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics汽车销售数量N Valid10Missing0MeanMedianMode10Std. DeviationPercentiles2550754.2 随机抽取25个网络用户,得到他们的年龄数据如下:1915292524 2321382218 3020191916 23272234244120311723要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。
(3)计算平均数和标准差; Mean=;Std. Deviation=(4)计算偏态系数和峰态系数: Skewness=;Kurtosis=(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:()lg25lg() 1.398111 5.64lg(2)lg20.30103nK=+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷组数=(41-15)÷6=,取53、分组频数表网络用户的年龄 (Binned)分组后的均值与方差:分组后的直方图:4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:要求:(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:Statistics企业利润组中值Mi(万元)N Valid120Missing0 MeanStd. DeviationSkewnessStd. Error of Skewness KurtosisStd. Error of Kurtosis4.9 一家公司在招收职员时,首先要通过两项能力测试。
在A 项测试中,其平均分数是100分,标准差是15分;在B 项测试中,其平均分数是400分,标准差是50分。
一位应试者在A 项测试中得了115分,在B 项测试中得了425分。
与平均分数相比,该应试者哪一项测试更为理想解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
Z A =x x s -=11510015-=1;Z B =x x s -=42540050-= 因此,A 项测试结果理想。
4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量为什么均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大 成年组 幼儿组平均 平均 标准差 标准差离散系数 离散系数幼儿组的身高差异大。
从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差σ=86414,构建总体均值μ的95%的置信区间。
解: 已知n =100,x =104560,σ = 85414,1-=95% ,由于是正态总体,且总体标准差已知。
总体均值在1-置信水平下的置信区间为 104560 ± ×85414÷√100= 104560 ±从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫ ⎪⎝⎭置信区间为:22x z x z n n αα⎛-+ ⎝,n 100 (1)构建μ的90%的置信区间。
2z α=0.05z =,置信区间为:(×,81+×)=(,)(2)构建μ的95%的置信区间。
2z α=0.025z =,置信区间为:(×,81+×)=(,)(3)构建μ的99%的置信区间。
2z α=0.005z =,置信区间为:(×,81+×)=(,) 利用下面的信息,构建总体均值的置信区间(1)x =25,σ=,n=60,置信水平为95% (2)x =,s=,n=75,置信水平为95%(3)x =,s=,n=32,置信水平为90%解:∵∴ 1) 1-=95% ,其置信区间为:25±×÷√60= 25± 2) 1-=98% ,则=, /2=, 1-/2=,查标准正态分布表,可知: 其置信区间为: ±×÷√75= ±3) 1-=90%, 其置信区间为: ±×÷√32= ±某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据求该校大学生平均上网时间的置信区间,置信水平分别为95%。
解:(1)样本均值x =,样本标准差s=; (2)抽样平均误差: 重复抽样:x σ=n n ≈=6= 不重复抽样:x σ=1N n N n -⋅-1N n N n -≈⋅-=7500367500136-⋅- =×0.995=×=(3)置信水平下的概率度:1α-=,t=2z α=0.025z =(4)边际误差(极限误差):2x x x t z ασσ∆=⋅=⋅ 1α-=,2x x x t z ασσ∆=⋅=⋅=0.025x z σ⋅重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=×=不重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=×=(5)置信区间: 1α-=,重复抽样:(),x x x x -∆+∆=()3.320.525,3.320.525-+=(,)不重复抽样:(),x x x x -∆+∆=()3.320.441,3.320.441-+=(,)从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10、8、12、15、6、13、5、11.,求总体均值μ的95%的置信区间解:本题为一个小样本正态分布,σ未知。
先求样本均值:= 80÷8=10再求样本标准差:= √84/7 =于是 ,μ的置信水平为1-α的置信区间是,已知1-α=25,n = 8,则α=,α/2=,查自由度为n-1 = 7的分布表得临界值所以,置信区间为: 10±×÷√77.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。
现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(g)包数96~98 98~100 100~102 102~104 104~1062 3 34 7 4合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的95%的置信区间。
解:大样本,总体方差未知,用z 统计量x z =()0,1N 样本均值=,样本标准差s=置信区间:22x z x z αα⎛-+ ⎝ 1α-=,2z α=0.025z =2x z x z αα⎛-+ ⎝=101.4 1.96 1.96⎛-+ ⎝=(,) (2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。
解:总体比率的估计大样本,总体方差未知,用z 统计量z =()0,1N 样本比率=(50-5)/50=置信区间:22p z p z αα⎛ -+ ⎝ 1α-=,2z α=0.025z =22p z p z αα⎛ -+ ⎝=0.9 1.96 1.96⎛ -+ ⎝ =(,) 某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间(2)若小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查解:1)已知N=50,P=32/50=,α=,α/2 = ,则置信区间:P±√{P(1-P)/N}= ±√×50= ±×=±2)已知丌= , E = , α=,α/2 = ,则N= ²丌(1-丌)/E²= ²××÷²≈62已知某炼铁厂的含碳量服从正态分布N(,²),现在测定了9炉铁水,其平均含碳量为,如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为解:已知μ0=,σ²=²,N=9,=,这里采用双侧检验,小样本,σ已知,使用Z统计。
假定现在生产的铁水平均含碳量与以前无显著差异。
则,H0 :μ = ; H1 :μ≠α=,α/2 = ,查表得临界值为计算检验统计量: =决策:∵Z值落入接受域,∴在=的显著性水平上接受H0。
结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为。
8.2 一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。
解:H0:μ≥700;H1:μ<700 已知:x=680 σ=60由于n=36>30,大样本,因此检验统计量:xz==-2当α=,查表得zα=。
因为z<-zα,故拒绝原假设,接受备择假设,说明这批产品不合格。
某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270公斤。
这种化肥是否使小麦明显增产解:已知μ0 =250,σ = 30,N=25,x =270 这里是小样本分布,σ已知,用Z 统计量。
右侧检验,α =,则Zα=提出假设:假定这种化肥没使小麦明显增产。
即 H0:μ≤250 H1: μ>250计算统计量: Z = (x-μ0)/(σ/√N)= (270-250)/(30/√25)= 结论:Z统计量落入拒绝域,在α =的显著性水平上,拒绝H0,接受H1。
决策:有证据表明,这种化肥可以使小麦明显增产。
10..1从3个总体中各抽取容量不同的样本数据,结果如下。