初中数学专题讲义-数据的收集与整理一、课标下复习指南 (一)数据的收集和整理 1.全面调查与抽样调查统计调查分全面调查和抽样调查两种,实际中常采用抽样调查的方式. (1)考察全体对象的调查属于全面调查.(2)从总体中抽取样本进行调查,属于抽样调查.抽样调查是根据样本来估计总体的一种调查,简称抽查.抽查体现了用样本估计总体的思想.(3)总体、个体及样本总体:所要考察对象的全体,称为总体; 个体:总体中的每一个考察对象,称为个体;样本:从总体中抽取的一部分个体,称为总体的一个样本. 样本中个体的数目称为样本容量.说明 抽样调查是实际中应用非常广泛的一种调查方式,它是从总体中抽取样本进行调查,根据样本来估计总体的一种调查;常采用问卷调查等调查方式.用划记法记录数据,通过表格整理数据,可以帮助我们找到数据的分布规律. 说明 对于不同的抽样,可能得到不同的结果. 2.频数与频率(1)频数:落在不同小组中的数据个数称为该组的频数.(2)频数与数据总数的比称为频率.频率反映了各组频数在总数中所占的百分比. 3.几种常见的统计图表(1)条形图将数据按要求分成若干小组,并用“划记”的方法统计出各小组的频数;再根据统计的频数画出条形图.(2)扇形图将数据按要求分成若干小组,统计出各小组的频数,并算出各组的频数占数据总数的百分比;画一个圆,并规定圆的面积表示100%;算出各百分数所对应的扇形的圆心角的度数,用量角器画出各扇形,并标出各百分数.(3)折线图以横轴表示统计的时间,纵轴表示数据,建立平面直角坐标系;在坐标平面内描点;用线段从左到右将这些点依次连接起来.(4)频数分布直方图用频数分布直方图描述数据的一般步骤为:计算最大值与最小值的差;确定组距与组数;决定分点;列数频分布表;画频数分布直方图.①把数据按一定的规律分成组的个数为组数,每一组两个端点的差称为组距.1+-=的整数部分组距最小值最大值组数;②数据分组时,对数据要遵循“不重不漏”的原则,既不能有一个数据同时落在两个组内重复出现的现象,也不能有一个数据不在任何组内的遗漏现象;③频数分布直方图能够显示各组频数的分布情况,易于显示各组之间频数的差别. (5)频数折线图频数折线图可以在频数分布直方图的基础上画出来.取频数分布直方图中每一个矩形上边的中点,然后在横轴上取两个频数为0的点,即在直方图的左边和右边各取一个频数为0的点,再用线段从左到右将这些点依次连接起来.说明 利用统计图表示经过整理的数据,能更直观地反映数据规律. (1)条形图:能显示具体数据,易于比较数据差别;(2)扇形图:用扇形的面积占圆的面积的百分比表示部分在总体中所占百分比,易于显示每组数据相对于总体的大小;(3)折线图:易于显示数据的变化趋势;(4)直方图:能显示各组频数分布的情况,易于显示各组之间频数的差别. (二)数据的分析1.平均数、众数与中位数(1)算术平均数).(121n x x x nx +++=Λ (2)加权平均数如果一组数据中,x 1,x 2,x 3,…,x k 出现的次数分别是f 1,f 2,f 3,…,f k ,那么这组数据的加权平均数⋅++++++++=kkk f f f f f x f x f x f x x ΛΛ321332211(3)众数与中位数①在一组数据中,出现次数最多的数据叫做这组数据的众数(一组数据的众数有时不止一个);②将一组数据按从小到大(或从大到小)的顺序排列,把处在最中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;③众数、中位数和平均数从不同的角度描述了一组数据的集中趋势. (4)平均数、中位数、众数的特征①平均数、中位数和众数都是数据的代表,它们刻画了一组数据的平均水平; ②平均数容易受极端值的影响,而中位数则不能充分利用所有数据的信息,众数在各个数据的重复次数大致相等时往往没有特别的意义. 2.极差和方差、标准差(1)极差:一组数据中数据最大值减去最小值的差叫做这组数据的极差.①极差用来反映一组数据变化范围的大小,是刻画数据离散程度的最简单的统计量; ②极差受极端值的影响较大,不能反映中间数据的离散情况.(2)方差:在一组数据x 1,x 2,x 3,…,x n 中,各数据与它的平均数x 的差的平方和的平均数叫做这组数据的方差,即].)()()[(1222212x x x x x x ns n -++-+-=Λ①方差是用来反映一组数据波动情况的特征数,常常用来比较两组数据的波动大小,方差越大,数据的波动越大;方差越小,数据的波动越小;②方差的单位是原数据单位的平方.(3)标准差:一组数据的方差的算术平方根叫做这组数据的标准差,即.2s s =*标准差的计算公式: ⋅-++-+-=])()()[(122221x x x x x x ns n Λ 说明 (1)一组数据的众数可以不唯一,但一定出现在这组数据中;而一组数据的其他统计量都是唯一的,但未必出现在这组数据中;(2)一组数据都在常数a 上下波动,即x'1=x 1+a ,x 2'=x 2+a ,…,x n '=x n +a 时,平均数a x x ++';方差s'2=s 2.二、例题分析例1 下列调查方式,合适的是( ).A .要了解一批灯泡的使用寿命,采用普查方式B .要了解甘肃电视台“陇原风貌”栏目的收视率,采用普查方式C .要保证“神舟六号”载人飞船成功发射,对重要零部件的检查采用抽查方式D .要了解人们对环境的保护意识,采用抽查方式 解 D .说明 当一项调查具有破坏性或以现有的人力、物力、财力很难(或没有必要)进行普查时,就选择抽查,对像“神舟六号”重要零部件的检查这类调查则必须选择普查.例2 某校对1200名女生的身高进行了测量,身高在1.58~1.63(单位:m)这一小组的频率为0.25,则该组的人数为( ).A .150人B .300个C .600人D .900人分析 1200名女生就有1200个身高,故数据总数为1200.同理,该组的人数即为落在该组的数据个数,即该组的频数.由频率=频数÷数据总数得,频数=频率×数据总数=0.25×1200=300.故该组的人数为300人.故选B .说明 对频数与频率的考查大多数放置于数据处理的背景之下,侧重于对概念的理解与运用,单独考查时一般以填空和选择的题型出现,但更多的是与统计图等结合考查.例3A .27℃,28℃B .27.5℃,28℃C .28℃,27℃D .26.5℃,27℃分析 由上表可知,一共统计了7个数据,将它们按从小到大排列为25,26,27,27,28,28,28,第4个数据是27,故这组数据的中位数是27(℃).又数据28出现的次数最多,所以众数是28(℃).故选A .说明 (1)求中位数时,先看这组数据的个数是奇数还是偶数,然后将这组数据按从小到大的顺序排列.若有奇数个数据,则最中间那个数据就是这组数据的中位数;若有偶数个数据,则最中间两个数据的平均数即是这组数据的中位数;(2)求众数时,先数出各数据在这组数据中出现的次数,出现次数最多的数据就是这组数据的众数.有时一组数据的众数不只一个.例4 某单位欲从内部招聘管理人员一名,对甲、乙、丙3名候选人进行了笔试和面试两项测试,3图19-1根据录用程序,组织200名职工对三人利用投票推荐的方式进行民主评议,三人得票率(没有弃权票,每位职工只能推荐1人)如图19-1所示,每得一票记作1分.(1)请算出三人的民主评议得分;(2)如果根据三颂测试的平均成绩确定录用人选,那么谁将被录用(精确到0.01)?(3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按的4∶3∶3比例确定个人成绩,那么谁将被录用?解 (1)三人民主评议的得分分别为:甲200×25%=50(分),乙200×40%=80(分),丙200×35%=70(分).(2)按三项平均成绩计算,甲的成绩是31(75+93+50)≈72.67,乙的成绩是31(80+70+80)≈76.67,丙的成绩是31(90+68+70)=76.00.乙的成绩最高,他将被录用. (3)若笔试、面试、民主评议三项测试得分按4∶3∶3的比例确定,三人的成绩分别为:.9.72334350393475=++⨯+⨯+⨯=甲x.0.77334380370480=++⨯-⨯+⨯=乙x.4.77334370368490=++⨯+⨯+⨯=丙x丙的成绩最高,他将被录用.说明 (1)计算加权平均数,随着权数的不同,结果可能不同.权数最大的数据对平均数的结果影响最大;(2)在实际问题中,往往采用加权平均数算法,而很少用算术平均数的算法.例5 甲、乙两同学近期5次百米跑测试成绩的平均数相同,甲同学成绩的方差2甲s =4,乙同学成绩的方差2乙s =3.1,则对他们测试成绩的稳定性判断正确的是( ).A .甲的成绩较稳定B .乙的成绩较稳定C .甲、乙成绩的稳定性相同D .甲、乙成绩的稳定性无法比较分析 因为方差越小,波动就越小,且2甲s >2乙s ,所以乙同学的成绩波动就小,即乙的成绩较稳定.故选B .说明 中考对极差、方差和标准差这三个统计量的考查,主要侧重于在实际情景中对其意义的理解,以及根据统计结果做出合理的判断和预测.例6 某校从甲、乙两名优秀选手中选择一名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8狄,测试成绩如下表:(单位:s)1 2 3 4 5 6 7 8 甲选手的成绩 12.1 12.2 13.0 12.5 13.1 12.5 12.4 12.2 乙选手的成绩12.012.412.813.012.212.812.312.5根据测试成绩,请你运用所学过的统计知识做出判断,派哪一位选手参加比赛更好?为什么?解 通过计算,可得甲x =12.5,乙x =12.5,2甲s =0.12,2乙s =0.1025.∵甲x =乙x ,∴两位选手的平均成绩相等. 又∵2甲s =2乙s ,∴乙选手的成绩更稳定.因此应该派乙选手去参加比赛.说明 (1)当用求平均数的方法(包括众数和中位数)无法比较两组数据的集中趋势时,还要用方差(包括极差)进一步比较两组数据的波动情况;看谁的波动小,就说明谁更稳定.(2)分数 50 60 70 80 90 100 人 (1)班 3 5 16 3 11 12 数 (2)班251112137请你根据所学的统计知识,分别从①平均数;②众数;③方差等不同的角度判断,综合分析这两个班中哪个班的考试成绩更加优秀.解 通过观察和计算,九年级(1)班:平均数80,众数70,方差244; 九年级(2)班:平均数80,众数90,方差180.从平均数看,两个班考试成绩相当,不分优劣;从众数看(2)班成绩较好;从方差看(2)班成绩较稳定;综上所述(2)班成绩更加优秀.(3)比较的角度不同,所得结论不一定相同. 三、课标下新题展示例7 某校为了解九年级学生体育测试成绩情况,以九年(1)班学生的体育测试成绩为样本,按A ,B ,C ,D 四个等级进行统计,并将统计结果绘成如下两幅统计图(见图19-2),请你结合图中所给信息解答下列问题:图19-2(说明:A 级:90分~100分;B 级:75分~89分;C 级:60分~74分;D 级:60分以下)(1)求出D 级学生的人数占全班总人数的百分比; (2)求出扇形统计图中C 级所在的扇形圆心角的度数; (3)该班学生体育测试成绩的中位数落在哪个等级内; (4)若该校九年级学生共有500人,请你估计这次考试中A 级和B 级的学生共有多少人? 解 (1)4%;(2)72°;(3)B ;(4)依题意知:A 级和B 级学生的人数和占全班总人数的76%,500×76%=380,所以估计这次考试中A 级和B 级的学生共有约380人.例8 在第49届世界乒乓球锦标赛中,男子单打决赛在我国选手马琳和王励勤之间展开.双方苦战七局,最终王励勤以4∶3获得胜利.七局比分如下表:(1)).(2)信互动且预测结果正确的观众,都能参加“乒乓大礼包”的抽奖活动.据不完全统计,有32320名观众参与了此次短信互动活动,其中有50%的观众预测王励勤获胜.刘敏同学参加了本次“短信互动”活动,并预测了王励勤获胜,如果从中抽取20名幸运观众,并赠送“乒乓大礼包”一份,那么刘敏同学中奖概率有多大?解 (1)马琳得分的众数为11;王励勤得分的平均数为9.7,中位数为11.(2)根据题意,预测正确的观众总数为32320×50%=16160,他们成为幸运观众的可能性相同,而幸运观众数为20,故刘敏中奖的概率为⋅=80811616020四、课标考试达标题 (一)选择题1.某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查.你认为抽样比较合理的是( ).A .在公园调查了1000名老年人的健康状况B .在医院调查了1000名老年人的健康状况C .调查了10名老年邻居的健康状况D .利用派出所的户籍网随机调查了该地区10%的老年人的健康状况2.图19-3中,用来表示不同品种的奶牛的平均产奶量最为合适的是( ).图19-33.某地今年1月1~4日期1月1日 1月2日 1月3日 1月4日最高5℃4℃0℃4℃气温最低0℃-2℃-4℃-3℃气温其中温差最大的是A.1月1日B.1月2日C.1月3日D.1月4日4.已知样本x1,x2,x3,x4的平均数是2,则x1+3,x2+3,x3+3,x4+3的平均数为( ).A.2 B.2.75 C.3 D.55.数学老师对小明参加的四次中考数学模拟考试成绩进行统计分析,判断小明的数学成绩是否稳定,因此老师需要知道小明这四次数学成绩的( ).A.平均数B.众数 C.中位数D.方差6.在1000个数据中,用适当的方法抽取了50个数据作为样本进行统计.频率分布表中,在54.5~57.4这一组的频率是0.12,那么估计总体落在这一组之间的数据有( ).A.120个B.60个C.12个D.6个(二)填空题7.在扇形统计图中,占圆12%的扇形的圆心角是______°,圆心角是144°的扇形占它所在圆的面积的______(填百分数).8.班主任为了解学生周末在家的学习情况,家访了班内的六位学生,了解到他们在家的学______.学生姓名小丽小明小颖小华小乐小恩学习时间4 6 3 45 8(小时)9.数据-2,-1,0,1,2的方差是______.10.某生物小组11人到校外采集植物标本,其中有2人每人采集到6件,有4人每人采集到3件,有5人每人采集到4件,则这个小组平均每人采集标本______件.(三)解答题11.宁波港是一个多功能、综合性的现代化大港,年货物吞吐量位居中国内地第二、世界排名第五,成功跻身于国际大港行列.如图19-4是宁波港1994年至2004年货物吞吐量统计图.图19-4(1)从统计图中你能发现哪些信息,请说出两个;(2)有人判定宁波港货物吞吐量每两年间的增长率都不超过30%,你认为他的说法正确吗?请说明理由.12.某校初一年级学生每人都只使用甲、乙、丙三种品牌中的一种计算器,图19-5是该年级全体学生使用3种不同品牌计算器人数的频率分布直方图.图19-5(1)求该校初一年级学生的总人数;(2)你认为哪种品牌计算器的使用频率最高?并求出这个频率.(3)通过以上统计结果,请你给为学校供货的商家提出一条进货的合理化建议.参考答案数据的收集与整理1.D . 2.D . 3.D . 4.D . 5.D . 6.A . 7.43.2,40%. 8.4,4.5. 9.2. 10.4. 11.(1)略;(2)不对;比如1994年到1996年的年增长率为30.6%,超过了30%. 12.(1)20+60+120=200(人);(2)丙牌使用频率最高,为%100200120=60%; (3)多进丙牌计算器.。