样本与总体一、一周知识概述(1)所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本.比如:为了考察一个学校的学生参加课外体育活动的情况,调查了其中20名学生每天参加课外体育活动的时间. 其中该校学生每天参加体育活动时间的全体是总体,每个学生每天参加课外体育活动的时间是个体,所抽查的20名学生每天参加课外活动的时间是从总体中抽取的一个样本.(2)抽样之前,不能预测到哪些个体会被抽中,像这样不能够事先预测结果的特性叫做随机性.常用的随机抽样的方法主要有简单的随机抽样、分层随机抽样、整群随机抽样和等距抽样.简单的随机抽样就是总体中每个个体被抽到的机会是均等的,并且在抽取一个个体之后总体内成分不变.(3)判断抽样调查选取样本的方法是否合适应从以下几个方面考虑:①要调查的个体在总体中必须有代表性;②样本要足够大;③仔细检查总体中的每个个体是否都有可能成为调查对象.为什么可用样本的情况去估计总体的情况?一是在很多情况下总体包含的个体数往往很多,甚至无限,不可能一一加以考察;二是有些从总体中抽取个体的试验带有破坏性(例如灯泡的使用寿命试验),因而抽取的个体不允许太多.当样本空间足够大时,用样本估计总体是比较可靠的。
用样本推断总体时,不同的样本,得到的结果一般也不相同.但是当样本容量较大且具有较好的代表性时,样本的平均数具有某种稳定性,而且接近总体的平均数.所以常用样本的平均数估计总体的平均数.同样也用样本的方差估计总体的方差.(4)数据对于决策具有重要的作用,注意选取恰当的统计图或统计量进行分析,作出决策。
二、重难点知识1、重点:初步学会随机抽样的方法和操作过程,并能判断抽样调查哪些是合理,哪些不是合理的.借助调查做决策.2、难点.(1)选取恰当的随机取样方法;(2)用样本估计总体的方法.三、重点知识讲解例1、小红帮助母亲预算家庭4月份电费开支情况,下表是小红家4月初连续8天每天早上电表显示的读数:电表计数器上先后两次显示读数之差就是这段时间内消耗的电能的度数,如果根据7天用电的平均度数,进而估计4月份的用电度数,你认为小红的这个抽样调查的方案合适吗?为什么?若每度电收取电费0.42元,估计小红家4月份(按30天计)的电费是多少元?解析:合理,因为7天的用电度数具有代表性,且相对于30天来说,样本空间已经足够大.==4.4月份(按30天计)的电费是:0.42×4×30=50.4(元)例2、某人对旅游区的旅游人数进行10天的统计,结果如下表:求这10天平均每天旅游的人数,以下是彬彬、强强和红红三位同学的解答.彬彬:(800+1200+700+1200+700+800+800+700+700+700)÷10=830(人).即这10天平均每天旅游人数是830人.强强:即这10天平均每天旅游人数是830人.红红:从10天人数中抽出有800人,1200人及700人的三天人数为代表,算出这三天的每天平均人数作为这10天每天旅游的平均人数,即:则这10天平均每天旅游人数约900人.(1)他们三人中谁的计算结果是正确的.(2)谁的计算方法最好,这种方法叫什么方法.解析:(1)显然,彬彬和强强的计算结果是正确的.他俩都是用求平均数的方法计算出的,所以计算结果都是830人.而红红抽样方法不合理,这种方法在总体只有10的情况下,是不合理的.(2)在彬彬和强强计算过程中,强强的方法最好.它避免了烦杂的计算,把人数相同的机械加法转化为乘法,这种方法叫“加权平均”.例3、某市电视台在本市调查某体育节目的收视率,其中小红调查了全班40名同学,有10个人收看了这个节目;小亮在火车站调查了50人,只有2人收看了这个节目;小明在他爸爸工作的大学调查了100名大学生,其中有40人收看了这个节目;小惠利用互联网调查,共有200人做了回答,其中30人收看了这个节目;电视台按照不同年龄、不同的文化背景,特约1000人进行调查.每个人和电视台的调查结果以及估计的收视率列在下表中:(1) 不同的调查得到的收视率为什么差别很大?(2) 你认为谁的调查代表性较好?(3) 抽样调查应该注意什么?(4) 抽样调查的优点是什么? 缺点是什么?解析:(1)因为抽样调查只抽取了部分个体,当所选取的样本不同时,就本题而言,调查的人群不同时,所得到的结果也不尽相同,并且样本容量越大,结果越准确.(2)电视台的代表性较好.(3)抽样调查应该注意样本容量要足够大;要调查的个体在总体中必须有代表性;仔细检查总体中的每个个体是否都有可能成为调查对象.(4)优点是节省时间,比较经济,可以完成不适合作普查的工作;缺点是抽样调查只考察了总体中一部分个体,其调查结果不如普查准确.例4、为了了解中学生的身体发育情况,对某中学同龄的100名学生的身高进行了测量,结果如下(单位:cm)小明用简单随机抽样的方法,得到了第一个样本,这5个随机数是:小华用简单随机抽样的方法,得到了第二个样本,这5个随机数是:小英用简单随机抽样的方法,得到了第三个样本,这5个随机数是:小强用简单随机抽样的方法,得到了第四个样本,这10个随机数是:以上抽样调查的结果可靠吗?解析:以上抽样调查的结果是否可靠,要看它与总体水平的接近程度.所取样本容量越大,则抽样结果更接近总体水平,所以,根据以上四组数据,分别画出总体、样本频率数、分布直方图、平均数和标准差.其中,平均数.标准差S:,可用计算器计算.频数:落在各个小组内的数据的个数.解1:计算总体平均身高,标准差,绘出频率分布直方图.总体平均身高为159cm,标准差为5.4cm,100名学生身高频率直方图如下:2、计算小明取得的第一个样本的平均身高,标准差及频数分布直方图.平均身高为158.4cm,标准差为4.7cm,及频数分布直方图.3、计算小华取得的第二个样本的平均身高是157.8cm,标准差为6.0cm,绘出5个同学身高频数分布直方图如下:4、计算小英取得的第三个样本的平均身高为158.2cm,标准差为4.0cm,5个同学身高频数分布直方图如下:5、计算小强取得第四个样本的平均身高为159.4cm,标准差为5.1cm,绘出10个同学身高频数分布直方图如下:6、从以上几个图比较可以看出小强的样本的平均身高、标准差与总体的平均身高、标准差的差距更小,说明样本越大越接近总体,精确度越高.例5、某校准备在今年暑假组织全体初三教师去新、马、泰(新加坡、马来西亚、泰国)旅游,由1名校长带队.是学校组织团队前往还是联系旅行社出行呢?如果联系旅行社是首先考虑服务质量还是首先考虑旅行费用呢?最后通过本市有关报纸的介绍了解了全市几十家旅行社的服务质量,决定在服务质量最好的甲、乙两家旅行社中选择一家价格便宜的旅行社.该校校长通过上网查询得知两家旅行社的报价都是每人2800元,后通过电话查询了解到这两家旅行社暑期对于教师都可给予优惠,但优惠方案不同.具体优惠措施如下:甲旅行社可给予每位教师(包括一名带队校长)八五折优惠;乙旅行社可免去一名带队校长的费用,其余教师九折优惠.(1)请你帮助校长作出选择:选择两家旅行社中的哪一家,使学校支付的旅游总费用最少.(2)若初三教师共有21人(不包括带队校长),问应选哪家旅行社?这时应支付旅游总费用多少元?分析:外出旅游既要价钱便宜又要舒适方便,从而真正体现“休闲”,玩得舒心.为了避免旅途中在交通、食宿安排等方面分配过多的精力,团队外出旅游一般都联系旅行社.至于选择哪家旅行社,我们可以通过丰富的媒体去调查了解服务质量,在服务质量保证的前提下,我们还可借助媒体了解价钱,综合运用我们所学的数学知识,帮助我们作出决策……解:(1)设该校有x名初三教师在1名校长带领下去新、马、泰旅游,选择甲、乙旅行社的费用分别为、,则由题意得:,.①若,则,解得;②若,则,解得;③若,则,解得.(2)由于21>18,所以选择甲旅行社,此时(元).答:(1)若初三教师为18人(不包括带队校长),则在甲、乙两家旅行社中任选一家;若初三教师人数少于18人,则选择乙旅行社;若初三教师人数超过18人,则选择甲旅行社.(2)由于该校初三教师共有21人(不包括带队校长),超过18人,故选择甲旅行社较为便宜,这时应支付旅游总费用为52360元.小结:(1)有时作出一个决策需要许多信息,象上面的实际问题中,我们需要许多信息,如全市各家旅行社的服务质量、各旅行社的价钱比较等等,而借助媒体得到相关数据则是一种便捷的获取丰富、实时的信息的有效渠道与方式.(2)从媒体上得到相关数据后,还必须结合实际情况加以分析,才能作出决策.如上面问题中,必须对该校初三教师的人数进行分类讨论,才能作出相应的决策.而这则需要我们具有“分类”的数学思想与“函数”的意识与方法.选择题1、下列调查属于简单的随机抽样的是()A.为了估计某家庭一年中每月的平均用电量,调查7月份的用电量;B.了解全班同学的视力情况,向全班同学调查;C.了解全校同学的视力情况,计算机抽出180名学生的学号,对这些同学进行调查;D.一居民住宅楼每层楼梯有20个台阶,小亮测量了一个台阶高为15cm;2、下列调查的样本缺乏代表性的是()A.从一篮鸡蛋中随意称出一斤,数数个数.B.在医院里调查老年人的健康状况;C.从一棵苹果树收获的所有苹果中,任意拿出20个,称量它们的质量.D.用问卷调查的方式了解各阶层的人的月薪.3、为估计湖里有多少条鱼,先捕了100条鱼,做好标记,然后放回到湖里过一段时间,待带有标记的鱼完全混于鱼群后,再捕上200条,发现其中带有标记的鱼只有2条,则湖里大约有()条鱼.A.800 B.6000 C.10000 D.200004、某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋数量如下(单位:个)33,25,28,26,25,31如果该班有45名同学,那么根据提供数据估计,本周全班同学各家总丢弃塑料袋的数量约为()A.900个B.1080个 C.1260个D.1800个5、对某班40名同学的一次数学成绩进行统计后,列出了频数分布表,并计算出表中80.5—90.5这一组频率为0.2,那么在80.5—90.5之间学生人数应是()A.10 B.11 C.9 D.86、下面说法正确的是()A.一组数据的平均数可以大于每一个数据B.一组数据的平均数就是中位数C.一组数据的标准差是这组数据的方差的平方D.通常用样本的频数分布去估计总体的频数分布7、有四位同学从编号1~50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编号分别为:①5,10,15,20,25,30,35,40.②43,44,45,46,47,48,49,50.③1,3,5,7,9,11,13,15.④43,25,2,17,35,9,24,19.你认为样本()较具有随机性.A.④ B.③ C.② D.①8、在某次体育活动中,统计甲、乙两班学生每分钟跳绳的成绩(单位:次)情况如下表,下面3个命题:班级参加人数平均次数中位数方差甲班55 135 149 190乙班55 135 151 110(1)甲班学生的平均成绩高于乙班学生的平均成绩;(2)甲班学生成绩的波动比乙班学生成绩的波动大;(3)甲班学生成绩优秀的人数不会多于乙班学生成绩优秀的人数(跳绳次数≥150次为优秀),则正确命题有()个.A.0 B.1 C.2 D.39、“神舟六号”发射前,工作人员应采用那种方式调查零部件质量是否合格()A.抽样调查B.抽查主要部位零部件质量C.抽查一半的零部件质量D.普查10、为了估计一次考试外语的成绩,某教师在求出38名考生分数的样本平均数后,因为疏忽而把这个样本平均数和38个分数混在一起了,然后求出这39个分数的样本平均数,则后一个样本平均数与正确的样本平均数的比是()A.1︰1 B.38︰39C.39︰38 D.2︰1B 卷二、解答题.11、(1)问题1:在计算20个男同学平均身高时,小华先将所有数据按由小到大的顺序排列,如下表所示:然后,他这样计算这20个学生的平均身高:小华这样计算平均数可以吗?为什么?(2)问题:假设你们年级共有四个班级,在半期考中各班的数学平均成绩和学生人数如下表:小强这样计算全年级的数学平均成绩:小强这样计算全年级的平均成绩可以吗?为什么?12、为了从甲、乙两名学生中选拔一人参加今年六月份的全市中学生实验操作竞赛,每个月对他们的实验水平进行一次测验. 下图给出两人赛前的5次测验成绩。