第五讲、数据分析
一、数据的代表
(一)、(1)平均数:一般地,如果有n个数x1,x2,,x n,那么,x= 1(x +x + +x)叫做这n个数的平均数,x读n 1 2 n 作“x拔”。
注:如果有n个数x1, x2,, x n的平均数为x,则①ax1, ax2,,ax n的平均数为a x;②x1+b,x2+b,,x n+b的平均数为x+b;③ax1+b,ax2+b,, ax n +b的平均数为a x +b。
(2)加权平均数:如果n个数中,x1出现f1次,x2出现f2次,…,x k出现f k次(这里f1+ f2+f k =n),
那么,根据平均数的定义,这n个数的平均数可以表示为x = x1f1+x2f2+xk fk,这样求得的平均数x叫做加权平均
n
数,其中f1, f2,, f k叫做权。
( 3 )平均数的计算方法
①定义法:当所给数据x1, x2 ,, x n,比较分散时,一般选用定义公式:x = 1(x +x + +x)
1 2 n
n 1 2 n
②加权平均数法:当所给数据重复出现时,一般选用加权平均数公式:x= x1f1+x2f2+xk fk,其中n f1+ f2+f k =n。
③新数据法:当所给数据都在某一常数a的上下波动时,一般选用简化公式:x=x'+a。
其中,常数a通常取接近这组数据平均数的较“整”的数,x'1= x1 a,x'2=x2 a,…,x'n=x n a。
x'=1(x' +x' + +x' )是新数n 1 2 n 据的平均数(通常把
x1,x2,,x n,叫做原数据,x'1,x'2,, x'n ,叫做新数据)。
(4)算术平均数与加权平均数的区别与联系①联系:都是平均数,算术平均数是加权平均数的一种特殊形式(它特殊在各项的权相等,均为 1 )。
②区别:算术平均数就是简单的把所有数加起来然后除以个数。
而加权平均数是指各个数所占的比重不同,按照相应的比例把所有数乘以权值再相加,最后除以总权值。
(二)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。
(注:不是唯一的,可存在多个)
(三)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
(注:①在找中位数的时候一定要把数据按大小依次排列;②如果n是奇数,则中位数是第n+1个;若n是偶数,则中位2
数处于第n和第n +1个的平均数;③中位数一般都是唯一的)
22
二、数据的波动
(一)极差:
(1)概念:一组数据中的最大数据与最小数据的差叫做这组数据的极差。
(2)意义:能够反映数据的变化范围,是最简单的一种度量数据波动情况的量,极差越大,波动越大。
(二)方差:
(1)概念:在一组数据x1,x2,,x n,中,各数据与它们的平均数x的差的平方的平均数,叫做这组数据的方差。
通常用
“ s2”表示,即s2= 1[(x1x)2+(x2x)2+ +(x n x)2]
1 2 n (2)意义:衡量数据波动大小的量,方差越大,数据的波动越大;方差越小,数据的波动越小,
n
数据的波动越稳定。
注:如果有n个数x1, x2,,x n的方差为s2,则①ax1,ax2,,ax n的方差为a2s2;②x1+b,x2+b,,x n+b的方差为s2;③ax1+b, ax2
+b,,ax n +b的方差为a2s2。
(三)方差的计算
(1)基本公式:s2= 1[(x1x)2+(x2x)2+ +(x n x)2]
1 2 n (2)简化计算公式(Ⅰ):2 1 2 2 2 2也可写成s2=1[(x2+x2+ +x2)] x2此公式的记忆方法是:方差
n
等于原数据n1 2 n n 平方的平均数减去平均数的平方。
12
(3)简化计算公式(Ⅱ): s2= 1[(x'12+x'22+ +x'2n ) nx'2] n 1 2 n
当一组数据中的数据较大时,可以依照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据x'1= x1a,x'2=x2a,…,x'n=x n a,那么,s2= 1[(x'2+x'2+ +x'2)] x' 此公式的记忆n 1 2 n 方法是:方差等于新数据平方的平均数减去新数据平均数的平方。
(4)新数据法:原数据x1, x2 ,,x n,的方差与新数据x'1=x1 a,x'2=x2 a,…,x'n=x n a的方差相等,也就是说,根据方差的基本公式,求得x'1,x'2,, x'n ,的方差就等于原数据的方差。
(四)方差的算数平方根叫做这组数据的标准差,用“ s ”表示,即
s= s2= 1[(x1x)2+(x2x)2+ +(x n x)2]
n
三、统计学中的几个基本概念
1 、总体 : 所有考察对象的全体叫做总体。
2、个体:总体中每一个考察对象叫做个体。
3、样本:从总体中所抽取的一部分个体叫做总体的一个样本。
4、样本容量:样本中个体的数目叫做样本容量。
5、样本平均数:样本中所有个体的平均数叫做样本平均数。
6、总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。