数据的收集、整理与描述——备课人:发【问题】统计调查的一般过程是什么?统计调查对我们有什么帮助?统计调查一般包括收集数据、整理数据、描述数据和分析数据等过程;可以帮助我们更好地了解周围世界,对未知的事物作出合理的推断和预测.一、数据处理的一般程序二、回顾与思考Ⅰ、数据的收集1、收集数据的方法(在收集数据时,为了方便统计,可以用字母表示调查的各种类型。
)①问卷调查法:为了获得某个总体的信息,找出与该信息有关的因素,而编制的一些带有问题的问卷调查。
②媒体调查法:如利用报纸、、电视、网络等媒体进行调查。
③民意调查法:如投票选举。
④实地调查法:如现场进行观察、收集和统计数据。
例1、调查下列问题,选择哪种方法比较恰当。
①班里谁最适合当班长()②正在播出的某电视节目收视率()③本班同学早上的起床时间()④黄河某段水域的水污染情况()2、收集数据的一般步骤:①明确调查的问题;——谁当班长最合适②确定调查对象;——全班同学③选择调查方法;——采用推荐的调查方法④展开调查;——每位同学将自己心目中认为最合适的写在纸上,投入推荐箱⑤统计整理调查结果;——由一位同学唱票,另一位同学记票(划正字),第三位同学在旁边监督。
⑥分析数据的记录结果,作出合理的判断和决策;3、收集数据的调查方式(1)全面调查定义:考察全体对象的调查叫做全面调查。
全面调查的常见方法:①问卷调查法;②访问调查法;③调查法;特点:收集到的数据全面、准确,但花费多、耗时长、而且某些具有破坏性的调查不宜用全面调查;(2)抽样调查定义:只抽取一部分对象进行调查,然后根据调查数据来推断全体对象的情况,这种方法是抽样调查。
总体:要考察的全体对象叫做总体;个体:组成总体的每一个考察对象叫做个体;样本:从总体中抽取的那一部分个体叫做样本。
样本容量:样本中个体的数目叫做样本容量(样本容量没有单位);特点:省时省钱,调查对象涉及面广,容易受客观条件的限制,结果往往不如全面调查准确,且样本选取不当,会增大估计总体的误差。
性质:具有代表性与广泛性,即样本的选取要恰当,样本容量越大,越能较好地反映总体的情况。
(代表性:总体是由有明显差异的几个部分组成时,每一个部分都应该按照一定的比例抽取到)(3)实际调查中常常采用抽样调查的方法获取数据,抽样调查的要什么?①总体中每个个体都有相等的机会被抽到;②样本容量要适当.例2、〔1〕判断下面的调查属于哪一种方式的调查。
①为了了解七年级(22班)学生的视力情况(全面调查)②我国第六次人口普查(全面调查)③为了了解全国农民的收支情况(抽样调查)④灯泡厂为了掌握一批灯泡的使用寿命情况(抽样调查)〔2〕下面的调查适合用全面调查方式的是 .①调查七年级十班学生的视力情况;②调查全国农民的年收入状况;③调查一批刚出厂的灯泡的寿命;④调查各省市感染禽流感的病例。
〔3〕为了了解某七年级2000名学生的身高,从中抽取500名学生进行测量,对这个问题,下面的说确的是〔〕A、2000名学生是总体B、每个学生是个体C、抽取的500名学生是样本D、样本容量是500〔4〕请指出下列哪些抽查的样本缺少代表性:①在大学生中调查我国青年的上网情况;②从具有不同文化层次的市民中,调查市民的法治意识;③抽查电信部门的家属,了解市民对电信服务的满意程度。
Ⅱ、数据的整理1、表格整理2、划记法Ⅲ、数据的描述1、统计表定义:将要统计的数据填入相应的表格,利用表格统计法可以很好地整理数据;优点:统计表中的数据比较准确、详实,可以清楚地反映各个量之间的真实情况;缺点:统计表得到的信息需要进行分析,表达不够直观;2、统计图(1)条形统计图定义:用一个单位长度在坐标系中表示一定的数量,根据数量的多少画出长短不同的直线;图形:特点:条形图能够显示出各个项目的具体数目、易于比较组间数据之间的差别;优点:能够清楚地表示出各个项目的具体数目(表示数据清);缺点:不能准确地描述各部分量之间的关系;(2)扇形统计图定义:用来表示各部分量与总数之间的关系。
图形:娱乐特点:扇形图能够用扇形的面积表示出各部分在总体中所占的百分比、易于显示每组数据相对于总数的大小; 优点:能够清楚地表示出各部分在总体中所占的百分比(表明百分比); 缺点:不能从统计图中看出每个项目的具体数量;步骤:①计算百分数;②计算圆心角;③画出圆和扇形并标明百分数;(用整个圆表示总体,每个扇形代表总体的一部分,用各个扇形的大小表示各部分数据,圆心角0=360 百分比) (3)折线统计图 图形:特点:折线图更易于显示数据的变化趋势优点:能够清楚地反映事物的变化情况(反映变化清); 缺点:不能表示各部分在总体中所占的比值; (4)直方图 图形:特点:能够显示各组频数分布的情况、易于显示各组之间频数的差别; 绘制频数分布直方图的步骤:①计算最大值与最小值的差;——变化围 ②决定组距与组数;——组数据的取值围频数/)301020400娱乐 动画③列频数分布表;——将一组数据分组后落在各个小组数据的个数叫做小组的频数④画频数分布直方图;注意:组距与组数的确定没有固定的标准,要凭借经验和研究的具体问题来确定。
通常数据越多,分成的组数也越多,当数据在100个以时,根据数据的多少通常分成512个组。
小长方形的面积= 频数=频数组距数据的分析——备课人:发本章是属于“统计与概率”领域的容,是我们在七年级下册学习了“数据的收集、整理与描述”之后,对数据统计的进一步的认识,为初三学习概率做好铺垫.在前面的学习中,我们学习了收集、整理和描述数据的常用方法,将收集到的数据进行分组、列表、绘图等处理工作后,数据分布的一些面貌和特征可以通过统计图表等反映出来.为了进一步了解数据分布的特征和规律,还需计算出一些代表数据一般水平或分布状况的特征量.对于统计数据的分布的特征,可以从两个方面来分析:一是分析数据分布的集中趋势,反映数据向其中心值(平均数)靠拢或聚集的程度;二是分析数据分布的离散程度,反映数据远离其中.这两个方面分别反映了数据分布特征的不同侧面.本章主要从前两个方面来研究数据的分布特征,集中学习分析数据的集中趋势和离散程度的常用方法.一、知识结构框架本章知识的结构框图:本章知识的展开顺序:二、本章具体容 1、数据的代表平均数、中位数和众数这三个量的相同之处主要表现在:都是用来描述数据集中趋势的统计量;都可用来作为一组数据的代表,且都可用来反映数据的一般水平.平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据较大或较小,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列有关,个别数据的波动对中位数没影响;当一组数据中不少数据多次重复出现时,可用众数来描述.⑴平均数:一般地,如果n 个数123,,,n x x x x ……,有1231(+)n x x x x x n=+++……,那么x 叫做这n 个数的算术平均数.极差波动情况集中趋势 用样本平均数估计总体平均数用样本方差估计总体方差数 字 特 征 课题学习实际应用加权平均数:如果在n 个数中, 1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次k f 次,(这里12+=k f f f n ++……)那么根据平均数的定义,这n 个数的平均数可以表示为11221(+)k k x x f x f x f n=++……这样求得的平均数叫做加权平均数,其中12k f f f 、、……叫做权.80,85,77,82,78,95,83,79,75,82,去掉一个最高分和一个最低分后的平均分是 分.【分析】这是一道关于算术平均数的计算,去掉一个最高分95,去掉一个最低分75,剩下的分数加起来再除以8,可以得到最终答案:80.75.例2:某生期中考试中,语、数、英三科的平均分为78分,物理、政治两科的平均分为80,则该生这5门学科的平均分为 .【分析】由部分的平均分求整体的平均分,可列式23280378+⨯+⨯得到5科平均分:78.8.例3:某中学规定学期总评成绩评定标准为:平时30%,期中30%,期末40%,小明平时成绩为95分,期中成绩为85分,期末成绩为95分,则小明的学期总评成绩为 .【分析】本题考查加权平均数“权”的第一种类型:百分数,可列式9530%8530%9540%9230%30%40%⨯+⨯+⨯=++.例4:某生在英语技能水平测试中,听、说、读、写四方面的成绩分别为85、83、88、80,请你按听:说:读:写=3:3:2:2的比例算出他的成绩.【分析】本题考查加权平均数“权”的第二种类型:比例,即:842233280288383385=+++⨯+⨯+⨯+⨯为所求.例5:某区参加希望杯数学邀请赛,成绩如图所示:则竞赛成绩的平均数为【分析】这是一道用直方图展现出来的考查加权平均数“权”的第三种类型:数字(人数、次数……)的题目,把每一个分组的头尾两数的平均数作为组中值,则每一分组的组中值分别为55、65、75、85、95,可算出平均分为745253525105952585357525651055=++++⨯+⨯+⨯+⨯+⨯.⑵中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.——唯一且带有单位.中位数作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适.中位数与数据的排列位置有关,而某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不易受数据极端值的影响.中位数像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”.中位数是一个不完全“虚拟”的数.当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数.中位数意义:若一组数据中的中位数是a ,则说明大于或小于a 的数各占一半. ⑶众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据的众数.众数作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。
在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合.众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,众数是一组数据中出现次数最多的数据,而不是该数据出现的次数,一组数据中的众数不唯一,可以有多个,也可以没有众数,但不能说众数是零.——带单位众数不受极端值的影响,其缺点是具有不惟一性,反映了出现次数最多的数据,用来代表一组数据的“多数水平”.是一组数据中的原数据 ,它是真实存在.例6:已知一组数据的中位数为80,可知这组数据于或小于这个中位数的数据各占 ,中位数有 个。