当前位置:文档之家› 数据资料的统计处理

数据资料的统计处理

数据资料的统计处理● 对数据的统计分析方法一、s x -分析法 二、综合达标度三、次数分布表和次数分布图 四、应答信息分析法 ● 相关关系分析 ● 数量标志的统计检验● 品质标志的统计检验一、s x -分析法1、平均值x :描述样本的总体分值集中趋势的量,反映总体分值的一般水平。

nx x i∑=n :样本的个数2、标准差S :描述样本的总体分值中各分值离散程度的量,反映总体中各分值的总体平均值离差(x ;-x )的平均水平。

s=nx xi∑-2)(将x 和S 结合起来共同描述样本的整体水平比较科学。

一、分析方法:将x 和S 结合起来,分析整体学习水平例1:某学科30名学生考试成绩如下表1,试分析30名学生整体学习水平。

表1 n=30i1.计算x =83 2. S=nx xi∑-2)(=7.73≈7.83图1 x -s 分析图二、综合达标度采用综合加权的方法,对达标的程度进行分析 计算方法:例2、抽取30份物理试卷,分析概念“力”的综合达标度 规定权重b :知识=1、理解=2、应用=3、分析=4、综合=5、评价=6 总体目标系数K=6321=++=∑ib综合加权得分H= ∑ib ·iG =1×0.97+2×0.87+3×0.77=5.02综合达标度84.0602.5===K H T综合达标分析:三、数据资料的次数分布表和次数分布图分析法(一)数据资料的分类1、计数资料:指计数事物个数的数值,这个数值称次数如:在某个分数段所对应得分的学生数在向卷量表上,同意某种意见的人数。

2、测量资料:指测量事物时产生的度量值,这个度量值叫量数,如:考试的分数。

(二)特点:以最简单最直观的形式,最大限度的容纳数据信息。

如,数据的分布情况,集中趋势和离散程度等。

(三)次数分布表的制作方法次数分布表是用表格的形式,表示数据在某些规定的组别中次数的分布情况,是整理,分析数据的第一步下面以50名学生物理考试成绩为例,阐述编制次数分布表的方法和步骤。

1、求全距RR=最大数-最小数=98-51=472、定组数:一般以10—20组为宜。

太多了计算麻烦,太少了可能把很多不同事实归于一类,掩盖了分布特征。

本例分10组表3 50名学生物理考试成绩次数分布表组距是每组的间隔,常用的组距是5和10。

58.4101471≈=+=+=组数全距组距+1的目的是为了包括全体次数而略余(取整数) 4、定组限:确定每组的最低数和最高数值,一般由全距的最低组距开始。

第一组:下限50,上限55 第二组:下限55,上限60 ┆ ┆ ┆ 第十组,下限95,上限100对于处于限上的分数,规定记在上一组中。

5、求组中值Xc :每组的中心数值称组中值,它是相应组限的代表数值。

2上限下限组中值+=5.52255501=+=c χ 5.57260552=+=c χ …… 5.9721009510=+=c χ 6、列表归类如表3中的1、2、3、4列所示7、次数分布表的扩充:(5—8列所示) (1)次数百分比:某组距的次数分布占次数总数的百分比:100100⨯=N f 次数百分比 (2)累积次数:反映某分数限以下次数分布有多少: 将次数由低组距向高组距依次相加。

(3)累积百分比反映某分数限以下次数分布的百分比:100100⨯=次数总数累计次数累计百分比(4)总分 总分=∑⋅cXf本例总分3890(实际为3862) (5)计算标准差: 公式:i Nfd NfdS ⋅-=∑∑22)(=05.125)503(502912=⨯-∑(四)次数分布图的制作方法根据次数分布表,用直线式曲线的形式显示数据的分布情况:1、次数分布直方图:(图2)制作方法:(1)建立直角座标系 横轴等距刻度标明分组的组限 纵轴等距刻度标明次数(2)以每个组距的下限为横座标,相对应的次数为纵座标描点。

(3)将所描各点分别用平行横轴和平行于纵轴的直线连接起来便得到次数分布直方图,其中每个直线的宽度表示组距,高度表示次数。

2、次数分布曲线图(图3)制作方法:(1)建立直角座标系:横轴等距刻度标明分组的组限,并标出各组限的组中值,纵轴等距刻度标明次数。

(2)以组中值为横座标,相对应的次数为纵座标描点。

(3)用线段将各点连接起来,便得到次数分布的曲线图。

3、累积次数曲线和累积百分比曲线(图4)制作方法:(1)建立直角座标系横轴等距刻度标明组限和组中值纵轴等距刻度标明累积次数和累积的数。

(2)以组中值为横座标,累积次数或累积百分数为纵座标描点。

(3)用光滑曲线将各点连接便得到一条S型曲线。

累计百分比分布曲线2040608010012052.557.562.567.572.577.582.587.592.597.5分数累计百分比(%)图4累积次数分布曲线10203040506052.557.562.567.572.577.582.587.592.597.5分数累积次数(e f )图5相关关系分析问题的提出:在现代教育技术科学研究中,常常会遇到类似这样的问题: 1、教学媒体的教学效果与哪些因素有关系? 2、怎样选择评卷教师?3、在运用某种媒体学习时男生、女生是否存在差别? 解决这类问题,就要利用相关关系分析方面的知识。

一、相关的概念:相关就是从数量方面来研究两种或两种以上变量之间的关系。

依照两种变量变动的方向将相关关系分成以下三类: 1、正相关:两种变量变化的方向相同。

2、负相关:两种变量变化的方向相反。

3、零相关:一种变量变化时,不能引起另一变量的变化。

二、相关程度的描述—相关系数γ1、值域:(1.00—-1.00)(表1) 正负号表示相关的方向,绝对值表示相关的程度2、由于相关系数r 是个比值,不是等单位度量值所以,当γ1=0.70, γ2=0.35时,只能说明γ1比γ2相关更高,但不能认为r 1的相关 程度是r 2的两倍,同理也不能认为r 由0.70—0.80时与0.30—0.40变化一样大。

三、相关系数的计算1、积差相关(积矩相关 ) 研究二个线性数列相关程度 公式 yx xy S NS xyr ∑=其中:r xy :表示x 和y 两个数列之间的相关系数。

x =x X - y Y y -=y x S S ,:分别为x 、y 两个数列的标准差N:成对量数的次数例1:抽取14名学生的语文、数学的考试成绩如下表,求语文、数学两学科学习的相关程度(表2)解: 甲:796.91450.1343==x S 乙:878.81450.1103==y S 32.0878.8767.91400.387=⨯⨯==∑yx xy S NS xyγ结论:正向相关,属实相关。

2、等级相关:由成对的量数组成两个数列,但每对数量在各自数列的等级不同。

利用量在数列中的等级位置来分析两个数列的相关程度。

公式:)1(6122--=∑N N D pγ其中:p γ表示等级相关系数D :X 与Y 量数等级的差数 N :总对数例2:为测试甲、乙两位教师评分的一致程度,让他们各自评阅相同的10份试卷,所评分数如下表,求相关系数p γ(表3)计算步骤:(1)将x 数列各量数按大小顺序排序,将y 数列各量数按x 排序确定的学生编号排序。

(让同一个学生的二个分数在同一行)(2)将各数列的量数按大小排序,分别给予等级Rx ,Ry 。

遇有相同的量数,则将其应占有的等级位置相加,用次数除得的商数做为等级。

(3)求出 D 、D 2、∑2D(4)代入公式计算:84.099102661)1(6122=⨯⨯-=--=∑N N D p γ结论:正向高度相关 ,两位教师评分基本一致。

3、点双列相关一个变量是点数列(连续变量),另一个变量是二分列(称名变量,如,男与女,好与坏,对与错等),研究二分称名变量与连续变量的相关程度。

公式:Pq S Y Y yqp pbi-=γ其中:P :表示在二分变量中,其中的一项在全变量中所占的比例; q :表示在二分变量中,另一项在全变量中所占的比例q=1-Pp Y :表示P 部分所对应的Y 数列平均值。

q Y :表示部分所对应的Y 数列平均值。

y S :表示全体连续变量y 的标准差。

例3:为了研究电教媒体对男、女学生的作用差异,从一次数学考试试卷中,随机抽出16份,成绩和性别(男:1,女:0)如下表,问成绩与性别的相关程度?(表4)解:562.0169==P q=1-P=0.438 33.829741===∑ppp N YY 14.827575===∑q q q N Y Y59.121616/1316110776/)(222=-=-=∑∑NN y yS yPq S Y Y yqp pbi -=γ=0075.0438.0562.059.1214.8233.82=⨯⨯-结论:近似零相关,成绩与性别无关,媒体的作用与性别无关。

数量资料的统计检验一、为什么要对数量资料进行统计检验?通过实验,我们得到了1x 和2x (或x 和0μ),从数值上看是存在着大与小的差异,但能否说1x 和所代表的总体也存在着同样的差异呢?不能完全肯定。

因为差异可以由实验变量引起,但也可以由非实验变量引起,所以必须要由x ,S 和n 等多方因素综合考虑,鉴别差异的可信程度。

二、检验原理1、检验的两个参数必须是同种类型; 如平均分,1x 和2x ,x 和0μ等。

2、建立虚无假设H 。

设二个参数不存在差异 即:H 0: 21μμ=3、通过统计运算,确定H 0成立的概率(P )4、查表定论三、检验方法:1、大样本(n >30)平均值差异程度的检验-Z 检验步骤: (1)建立虚无假设H 0: 两个平均数之间无显著差异; (2)确定差异显著水平 P=0.01或P=0.05 (3)应用公式计算22212121n S n S X X Z +-=(4)根据Z 值查表例1:实验组和对比组两次检测数据统计如下表,问两组前测成绩是否存在差异?后测成绩是否存在差异?表12658.048165014787622222121211-=+-=+-=n Sn S X X Z|Z 1|=0.658<1.96 P>0.05 结论:两组前测成绩差异不显著。

16.248145088085222=+-=Z Z 2=2.16>1.96, Z 2<2.58,∴P<0.05结论:两组后测成绩差异显著。

2、α样本(n >30)平均值差异程度的检验-t 检验,检验步骤: (1)建立虚无假设H 0: 两个平均数之间无显著差异。

(2)确定差异显著水平: P=0.05或P=0.01 (3)计算t 值(4)根据自由度df (等于n-1)查t 值表(表16)找出理论t 值。

(t(df)0.05或t(df)0.01) (5)用计算出的t 值与理论值t 值比较得出结论。

相关主题