当前位置：文档之家› 第五章数据处理和检验

第五章数据处理和检验

1.Excel（打开excel表第五章） 2.SPSS软件

SPSS结果与excel计算的一样。
三、可疑值的取舍
在实验中得到一组数据，个别数据离群较远，这一数据称为异常值、可疑值或极端值。若是过失造成的，则这一数据必须舍去。否则异常值不能随意取舍，特别是当测量数据较少时。处理方法有4d法、格鲁布斯(Grubbs)法和 Q检验法。
格鲁布斯法优点，引人了正态分布中的两个最重要的样本参数x及s，故方法的准确性较好。缺点是需要计算x和s，手续稍麻烦。
3. Q检验法
设一组数据，从小到大排列为: x1，x2，……，xn-1，xn 设x1、xn为异常值，则统计量Q为：
Q x n x n 1 x n x1
Q
x 2 x1 x n x1
上述分析结果共有11位数字，从运算来讲，并无错误，但实际上用这样多位数的数字来表示上述分析结果是错误的，它没有反映客观事实，因为所用的分析方法和测量仪器不可能准确到这种程度。那么在分析实验中记录和计算时，究竟要准确到什么程度，才符合客观事实呢？这就必须了解“有效数字”的意义。
有效数字的意义及位数
2. 格鲁布斯(Grubbs)法
有一组数据，从小到大排列为: x1，x2，……，xn-1，xn 其中x1或xn可能是异常值。用格鲁布斯法判断时，首先计算出该组数据的平均值及标准偏差，再根据统计量T进行判断。
T x x1 s
T xn x s
若T>Ta,n，则异常值应舍去，否则应保留。
有效数字的运算规则小结
1．根据分析仪器和分析方法的准确度正确读出和记录测定值，且只保留一位可疑数字。 2．在计算结果之前，先根据运算方法确定欲保留的位数，然后按照数字修约规则对各测定值进行修约，先修约，后计算。
二、平均数和标准偏差
1. 平均数 2. 标准偏差

基本术语
1.总体研究对象的全体，总体数目N。 2.样本自总体中随机抽出一部分样品，通过样品推断总体的性质。 3.样本容量样本中所含个体的数目，n
t 检验的类型

1.单一样本t检验（One-Sample T Test）：检验单个变量的均值是否与给定的标准或者常数之间是否存在差异。 2.独立样本t检验（Independent Sample T Test）：用于检验两组来自独立总体的样本，其独立总体的均值是否有差异。 3.配对样本t检验（Paired-Sample T Test）：用于检验两个相关或配对的样本是否来自具有相同均值的总体。
x
x
n
i

20.03 20.04 20.06 5
20.04(%)
S

x
2 i

1 n
(

xi)
2
n 1
S
2008.009
2008.008 5 1
0.016(%)
CV%
S x
100%
0.016 20.04
100% 0.080%
举例

Q检验法符合数理统计原理，但只适合用于一组数据中有一个可疑值的判断。 Grubbs法将正态分布中两个重要参数x及S引进，方法准确度较好。

三种方法以Grubbs法最合理而普遍适用。
四、常用的检验方法

ቤተ መጻሕፍቲ ባይዱ

1.t-检验（T-tests ）：与均值相联系，比较两个样本的均值差异性，要求服从正态分布或者t分布。 2.单因素方差分析：（One-way analysis of variance）单因素方差检验，用于多个样本均数的显著性检验。
1. t检验

由于研究中不可能把总体中所有的样本都进行测定，比如总体有1000个个体，我们可以选择50个组成样本，测定样本的均值来反映总体的均值。但是由于取样的问题，可能抽到一些数值较大或者较小的个体，从而使得样本的均值和总体参数的均值之间有所不同，那么有一个问题：这个样本参数均值是否能代表总体均值？均值不等的样本个体是否能代表总体呢？另外，两组样本参数的均值是来自相同的总体还是不同的总体？它们之间是否有不同？这就需要进行t检验。
1. 4d法

根据正态分布规律，可疑数值的偏差（即|x 可疑-x |）超过4d时，这一测定值出现在测定总体内的概率小于0.3%，故这一测量值通常可以舍去。
检验步骤

用4d法判断异常值的取舍的步骤： 1.去掉异常值，计算其余数据的平均值x。 2.计算各数据偏差d=xi-x 2.计算数据的平均偏差d。d=∑di/n 3.异常值与平均值进行比较： |x 可疑-x |大于4d，则将可疑值舍去，否则保留。 4d中的d是d。当4d法与其他检验法矛盾时，以其他法则为准。
例测定某药物中钴的含量如(μg/g)，得结果如下：1.25，1.27，1.31，1.40。试问1.40这个数据是否应保留? 解首先不计异常值1.40，求得其余数据的平均值x和平均偏差d为
x = 1· 28 d
= 0· 023
异常值与平均值的差的绝对值为 |1.40一1.28|=0.12＞4 d(0.092) 故1.40这一数据应舍去。
有效数字的运算规则

(一)加减法当几个数据相加或相减时、它们的和或差的有效数字的保留，应以小数点后位效最少，即绝对误差最大的的数据为依据。例如 0.0121、25.64及1.05782三数相加，若各数最后一位为可疑数字，则25.64中的4已是可疑数字。因此，三数相加后，第二位小数已属可疑，其余两个数据可按规则进行修约、整理到只保留到小数后2位。

有效数字是指在分析工作中实际上能测量到的数字。记录数据和计算结果时究竟应该保留几位数字，须根据测定方法和使用仪器的准确程度来决定。在记录数据和计算结果时，所保留的有效数字中，只有最后一位是可疑的数字或者不定数字。
例如：坩埚重18.5734克六位有效数字标准溶液体积24.41毫升四位有效数字由于万分之一的分析天平能称准至±0.0001克，滴定管的读数能读准至±0.01毫升，故上述坩埚重应是18.5734±0.0001克，标准溶液的体积应是24.41±0.01毫升，因此这些数值的最后一位都是可疑的，这一位数字称为“不定数字”。在分析工作中应当使测定的数值，只有最后一位是可疑的。
大学生科研论文写作入门
导入新课
科研的前期准备工作结束后，收集了一些有用的实验或调查数据，这些数据哪些是可靠的？哪些是可疑的？数据怎样进行分析处理？怎样进行统计检验？这些是制作图表的依据，是写论文之前必须完成的。那么，有哪些方面的内容呢？
第五章数据处理和检验

一、有效数字二、平均数和标准偏差三、可疑值的舍去四、常用检验方法 1. t检验 2. 方差检验
因此，0.0121应写成0.01； 1.05782应写成1.06；三者之和为： 0.01+25.64+1.06＝26.71 在大量数据的运算中。为使误差不迅速积累，对参加运算的所有数据，可以多保留一位可疑数字 (多保留的这一位数字叫“安全数字”)。如计算5.2727、0.075、3.7及2.12的总和时，根据上述规则，只应保留一位小数。但在运算中可以多保留一位，故5.2727应写成5.27；0.075应写成0.08； 2.12应写成2.12。因此其和为： 5.27+0.08+3.7+2.12＝11.17 然后、再根据修约规则把11.17整化成11.2。
例如: 1.0005 五位有效数字 0.5000；31.05% ；6.023×102 四位有效数字 0.0540；1.86×10-5 三位有效数字 0.0054；0.40% 两位有效数字 0.5 ； 0.002% 一位有效数字在1.0005克中的三个“0”，0.5000克中的后三个“0”，都是有效数字；在0.0054克中的“0”只起定位作用，不是有效数；在0.0540克中，前面的 “0”起定位作用，最后一位“0”是有效数字。同样，这些数值的最后一位数字，都是不定数字。
一、有效数字

在科学实验中，为了得到准确的测量结果，不仅要准确地测定各种数据，而是还要正确地记录和计算。所以，记录实验数据和计算结果应保留几位数字是一件很重要的事，不能随便增加或减少位数。例如用重量法测定硅酸盐中的SiO2时，若称取试样重为0.4538克，经过一系列处理后，灼烧得到SiO2沉淀重0.1374克，则其百分含量为： SiO2 % =(0.1374/0.4538)×100%＝ 30.277655354%
平均值
样本容量为n，其平均值为：
x

n
xi
偏差

偏差d=测定值xi－平均值x 平均偏差=∑（xi-x）n
样本标准偏差

S

i 1 n
(x i x ) n 1
2

f = n-1，自由度：n个测定数据能相互独立比较的是n-1个。引入n-1是为了校正以样本平均值代替总体平均值引起的误差。
相对标准偏差

(relative standard deviation-RSD) 又称变异系数 (coefficient of variation-CV)
CV

S x
100
例1：重铬酸钾法测得中铁的百分含量为： 20.03%, 20.04%, 20.02%, 20.05%和20.06%。计算分析结果的平均值，标准偏差和相对标准偏差。
数字修约规则
“四舍六入五留双”

具体的做法是，当尾数≤4时将其舍去；尾数≥6时就进一位；如果尾数为5而后面的数为0时则看前方：前方为奇数就进位，前方为偶数则舍去；当“5”后面还有不是0的任何数时，都须向前进一位，无论前方是奇还是偶数。“0”则以偶数论。

e商务文档

第五章数据处理和检验

相关文档推荐：

e商务文档

第五章 数据处理和检验

相关文档推荐：

第五章数据处理和检验