统计学习题区间估计假设检验..第五章抽样与参数估计一、单项选择题1、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( B )A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( D )A、N(100,25)B、N(100,5/n)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( C )A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的( A )A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( C )A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是( C )A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( B )尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( D )A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( A )A、分层抽样B、简单随机抽样C、等距(系统)抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( A )A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有( ADE )A、总体各单位标志值的差异程度B、调查人员的素质C 、样本各单位标志值的差异程度D 、抽样组织方式E 、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。
根据抽样结果进行推断,下列说法正确的有( ADE )A 、n=200B 、n=30C 、总体合格率是一个估计量D 、样本合格率是一个统计量E 、合格率的抽样平均误差为2.52%3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( BCE )A 、np ≤5B 、np ≥5C 、n (1–p )≥5D 、p ≥1%E 、n ≥30三、填空题1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。
请列出四种常见的抽样方法:、、、,当对全校学生的名单不好获得时,你认为方法比较合适,理由是。
四、简答题1、分层抽样与整群抽样有何异同?它们分别适合于什么场合?2、解释抽样推断的含义。
五、计算题1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。
对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知;(8125.1,8331.1,2281.2,2622.210,05.09,05.010,025.09,025.0====t t t t );2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。
该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。
为了节约调查费用,样本将尽可能小,试问样本量应该为多大?3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。
(1)试对家庭每天平均看电视时间进行区间估计。
(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05)答案:一、B ,D ,C ,A ,C ;C ,B ,D ,A ,A 。
二、ADE ,ADE ,BCE 。
三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。
四、1、答:都要事先按某一标志对总体进行划分的随机抽样。
不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。
分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。
2、答:简单说,就是用样本中的信息来推断总体的信息。
总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。
五、1、解:n=10,小样本(1)方差已知,由x ±z α/2nσ得,(494.9,501.1)(2)方差未知,由x ±t α/2ns 得,(493.63,502.37)2、解:n=222/1xp p z ?-??)(α=2202.05.05.01.6448??=1691 3、解:(1)x ±t α/2ns =6.75±2.131×1625.2=(5.55,7.95)(2)边际误差E= t α/2ns =2.131×1625.2=1.2n=2222/E z σα?=2222.15.21.96?=17第六章假设检验练习题一、单项选择题1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用( C )。
A 、左侧检验B 、右侧检验C 、双侧检验D 、左侧检验或右侧检验2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为( C )。
A 、抽样是不科学的B 、检验结论是正确的C 、犯了第一类错误D 、犯了第二类错误3、当样本统计量的观察值未落入原假设的拒绝域时,表示( B )。
A 、可以放心地接受原假设B 、没有充足的理由否定与原假设C 、没有充足的理由否定备择假设D 、备择假设是错误的4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( A )。
A、都减少B、都增大C、都不变D、一个增大一个减小5、关于检验统计量,下列说法中错误的是( B )。
A、检验统计量是样本的函数B、检验统计量包含未知总体参数C、在原假设成立的前提下,检验统计量的分布是明确可知的D、检验同一总体参数可以用多个不同的检验统计量二、多项选择题1、关于原假设的建立,下列叙述中正确的有( CD )。
A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2、在假设检验中,α与β的关系是( CE )。
A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β三、判断分析题(判断正误,并简要说明理由)1、对某一总体均值进行假设检验,H0:X=100,H1:X≠100。
检验结论是:在1%的显著性水平下,应拒绝H0。
据此可认为:总体均值的真实值与100有很大差异。
2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。
为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。
那么原假设可以为:H0:P≤1/3。
四、简答题1、采用某种新生产方法需要追加一定的投资。
但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。
(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。
(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?五、计算题1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。
从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。
假设产品重量服从正态分布。
(1)建立适当的原假设和备择假设。
(2)在α=0.05时,该检验的决策准则是什么?(3)如果x =12.25克,你将采取什么行动?(4)如果x =11.95克,你将采取什么行动?答案:一、1、C 2、C 3、B 4、A 5、B 二、1、CD 2、CE三、1、错误。
“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。
2、错误。
要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P (或男孩所占的比例P*)所以原假设为:H 0:P=3/4(或P ≤3/4);H 1:P >3/4。
也可以是:H 0:P*=1/4(或P ≥1/4);H 1:P*<1/4。
四、1、(1)H 0:x ≥350;H 1:x <350。
(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。
犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。
五、1、(1)H 0:μ=120;H 1:μ≠12。
(2)检验统计量:Z=nx /0σμ-。
在α=0.05时,临界值z α/2=1.96,故拒绝域为|z|>1.96。
(3)当x =12.25克时,Z=nx /0σμ-=25/0.61212.25-=2.08。
由于|z|=2.08>1.96,拒绝H 0:μ=120;应该对生产线停产检查。
(4)当x =11.95克时,Z=nx /0σμ-=25/0.61211.95-=-0.42。
由于|z|=-0.42<1.96,不能拒绝H 0:μ=120;不应该对生产线停产检查。
第七章相关与回归分析一、单项选择题1、下面的关系中不是相关关系的是( D )A 、身高与体重之间的关系B 、工资水平与工龄之间的关系C 、农作物的单位面积产量与降雨量之间的关系D 、圆的面积与半径之间的关系2、具有相关关系的两个变量的特点是( A )A 、一个变量的取值不能由另一个变量唯一确定B 、一个变量的取值由另一个变量唯一确定C 、一个变量的取值增大时另一个变量的取值也一定增大D 、一个变量的取值增大时另一个变量的取值肯定变小3、下面的假定中,哪个属于相关分析中的假定( B )A 、两个变量之间是非线性关系B 、两个变量都是随机变量C 、自变量是随机变量,因变量不是随机变量D 、一个变量的数值增大,另一个变量的数值也应增大4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为( A )A 、完全相关关系B 、正线性相关关系C 、非线性相关关系D 、负线性相关关系5、根据你的判断,下面的相关系数取值哪一个是错误的( C )A 、–0.86B 、0.78C 、1.25D 、06、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着( A )绝对值大于0.8A 、高度相关B 、中度相关C 、低相关D 、极弱相关7、在回归分析中,描述因变量y 如何依赖于自变量x 和误差项ε的方程称为( B )A 、回归方程B 、回归模型C 、估计回归方程D 、经验回归方程 8、在回归模型y=01x ββε++中,ε反映的是( C )A 、由于x 的变化引起的y 的线性变化部分B 、由于y 的变化引起的x 的线性变化部分C 、除x 和y 的线性关系之外的随机因素对y 的影响D 、由于x 和y 的线性关系对y 的影响9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误( B )A 、∧y =25–0.75xB 、∧y = –120+ 0.86x C 、∧y =200–2.5x D 、∧y = –34–0.74x10、说明回归方程拟合优度的统计量是( C )A 、相关系数B 、回归系数C 、判定系数D 、估计标准误差11、判定系数R 2是说明回归方程拟合度的一个统计量,它的计算公式为( A )A 、SST SSR B 、SSE SSR C 、SST SSE D 、SSRSST12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( A )4854/(4854+146)A 、97.08%B 、2.92%C 、3.01%D 、33.25%13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是( D )A、较高的男子趋于较重B、身高与体重存在低度正相关C、体重较重的男子趋于较高D、45%的较高的男子趋于较重14、下列回归方程中哪个肯定有误( A )A、∧y=15–0.48x,r=0.65 B、∧y= –15 - 1.35x,r=-0.81C、∧y=-25+0.85x,r=0.42 D、∧y=120–3.56x,r=-0.9615、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R2为( C )A、0.8B、0.89C、0.64D、0.4016、对具有因果关系的现象进行回归分析时( A )A、只能将原因作为自变量B、只能将结果作为自变量C、二者均可作为自变量D、没有必要区分自变量二、多项选择题1、下列现象不具有相关关系的有( ABD )A、人口自然增长率与农业贷款B、存款期限与存款利率C、降雨量与农作物产量D、存款利率与利息收入E、单位产品成本与劳动生产率2、一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明( E )中度A、二者之间具有高度的正线性相关关系B、二者之间只有63.14%的正线性相关关系C、63.14%的高收入者具有较高的受教育程度D、63.14%的较高受教育程度者有较高的收入E、通常来说受教育程度较高者有较高的收入三、判断分析题(判断正误,并简要说明理由)1、一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。