第五章 数据处理和检验
1.Excel(打开excel表第五章) 2.SPSS软件
SPSS结果与excel计算的一样。
三、可疑值的取舍
在实验中得到一组数据,个别数据离群 较远,这一数据称为异常值、可疑值或极端 值。若是过失造成的,则这一数据必须舍去。 否则异常值不能随意取舍,特别是当测量数 据较少时。 处理方法有4d法、格鲁布斯(Grubbs)法和 Q检验法。
格鲁布斯法优点,引人了正态分布中的两个 最重要的样本参数x及s,故方法的准确性较好。 缺点是需要计算x和s,手续稍麻烦。
3. Q检验法
设一组数据,从小到大排列为: x1,x2,……,xn-1,xn 设x1、xn为异常值,则统计量Q为:
Q x n x n 1 x n x1
Q
x 2 x1 x n x1
上述分析结果共有11位数字,从运算 来讲,并无错误,但实际上用这样多位 数的数字来表示上述分析结果是错误的, 它没有反映客观事实,因为所用的分析 方法和测量仪器不可能准确到这种程度。 那么在分析实验中记录和计算时,究竟 要准确到什么程度,才符合客观事实呢? 这就必须了解“有效数字”的意义。
有效数字的意义及位数
2. 格鲁布斯(Grubbs)法
有一组数据,从小到大排列为: x1,x2,……,xn-1,xn 其中x1或xn可能是异常值。 用格鲁布斯法判断时,首先计算出该组数据的 平均值及标准偏差,再根据统计量T进行判断。
T x x1 s
T xn x s
若T>Ta,n,则异常值应舍去,否则应保留。
有效数字的运算规则小结
1.根据分析仪器和分析方法的准确度正 确读出和记录测定值,且只保留一位可疑数 字。 2.在计算结果之前,先根据运算方法确 定欲保留的位数,然后按照数字修约规则对 各测定值进行修约,先修约,后计算。
二、平均数和标准偏差
1. 平均数 2. 标准偏差
基本术语
1.总 体 研究对象的全体,总体数目N。 2.样本 自总体中随机抽出一部分样品, 通过样品推断总体的性质。 3.样本容量 样本中所含个体的数目,n
t 检验的类型
1.单一样本t检验(One-Sample T Test): 检验单个变量的均值是否与给定的标准或者 常数之间是否存在差异。 2.独立样本t检验(Independent Sample T Test):用于检验两组来自独立总体的样 本,其独立总体的均值是否有差异。 3.配对样本t检验(Paired-Sample T Test): 用于检验两个相关或配对的样本是 否来自具有相同均值的总体。
x
x
n
i
20.03 20.04 20.06 5
20.04(%)
S
x
2 i
1 n
(
xi)
2
n 1
S
2008.009
2008.008 5 1
0.016(%)
CV%
S x
100%
0.016 20.04
100% 0.080%
举例
Q检验法符合数理统计原理,但只适合用于一 组数据中有一个可疑值的判断。 Grubbs法将正态分布中两个重要参数x及S引进, 方法准确度较好。
三种方法以Grubbs法最合理而普遍适用。
四、常用的检验方法
ቤተ መጻሕፍቲ ባይዱ
1.t-检验(T-tests ):与均值相联系,比 较两个样本的均值差异性,要求服从正态分 布或者t分布。 2.单因素方差分析:(One-way analysis of variance)单因素方差检验,用于多个 样本均数的显著性检验。
1. t检验
由于研究中不可能把总体中所有的样本都进行测 定,比如总体有1000个个体,我们可以选择50个 组成样本,测定样本的均值来反映总体的均值。 但是由于取样的问题,可能抽到一些数值较大或 者较小的个体,从而使得样本的均值和总体参数 的均值之间有所不同,那么有一个问题:这个样 本参数均值是否能代表总体均值?均值不等的样 本个体是否能代表总体呢?另外,两组样本参数 的均值是来自相同的总体还是不同的总体?它们 之间是否有不同?这就需要进行t检验。
1. 4d法
根据正态分布规律,可疑数值的偏差 ( 即|x 可疑-x |)超过4d时,这一测定 值出现在测定总体内的概率小于0.3%, 故这一测量值通常可以舍去。
检验步骤
用4d法判断异常值的取舍的步骤: 1.去掉异常值,计算其余数据的平均值x。 2.计算各数据偏差d=xi-x 2.计算数据的平均偏差d。d=∑di/n 3.异常值与平均值进行比较: |x 可疑-x |大于4d,则将可疑值舍去,否则保留。 4d中的d是d。当4d法与其他检验法矛盾时,以 其他法则为准。
例 测定某药物中钴的含量如(μg/g), 得结果如下:1.25,1.27,1.31,1.40。 试问1.40这个数据是否应保留? 解 首先不计异常值1.40,求得其余数据的平均 值x和平均偏差d为
x = 1· 28 d
= 0· 023
异常值与平均值的差的绝对值为 |1.40一1.28|=0.12>4 d(0.092) 故1.40这一数据应舍去。
有效数字的运算规则
(一)加减法 当几个数据相加或相减时、它们的和或 差的有效数字的保留,应以小数点后位效最少, 即绝对误差最大的的数据为依据。例如 0.0121、25.64及1.05782三数相加,若各 数最后一位为可疑数字,则25.64中的4已是 可疑数字。因此,三数相加后,第二位小数已 属可疑,其余两个数据可按规则进行修约、整 理到只保留到小数后2位。
有效数字是指在分析工作中实际上能测 量到的数字。记录数据和计算结果时究 竟应该保留几位数字,须根据测定方法 和使用仪器的准确程度来决定。在记录 数据和计算结果时,所保留的有效数字 中,只有最后一位是可疑的数字或者不 定数字。
例如: 坩埚重18.5734克 六位有效数字 标准溶液体积24.41毫升 四位有效数字 由于万分之一的分析天平能称准至±0.0001克, 滴定管的读数能读准至±0.01毫升,故上述坩埚 重应是18.5734±0.0001克,标准溶液的体积应 是24.41±0.01毫升,因此这些数值的最后一位 都是可疑的,这一位数字称为“不定数字”。在 分析工作中应当使测定的数值,只有最后一位是 可疑的。
大学生科研论文写作入门
导入新课
科研的前期准备工作结束后,收 集了一些有用的实验或调查数据, 这些数据哪些是可靠的?哪些是可 疑的?数据怎样进行分析处理?怎 样进行统计检验?这些是制作图表 的依据,是写论文之前必须完成的。 那么,有哪些方面的内容呢?
第五章 数据处理和检验
一、有效数字 二、平均数和标准偏差 三、可疑值的舍去 四、常用检验方法 1. t检验 2. 方差检验
因此,0.0121应写成0.01; 1.05782应写成1.06;三者之和为: 0.01+25.64+1.06=26.71 在大量数据的运算中。为使误差不迅速积累, 对参加运算的所有数据,可以多保留一位可疑数字 (多保留的这一位数字叫“安全数字”)。 如计算5.2727、0.075、3.7及2.12的总和时,根据 上述规则,只应保留一位小数。但在运算中可以多 保留一位,故5.2727应写成5.27;0.075应写成0.08; 2.12应写成2.12。因此其和为: 5.27+0.08+3.7+2.12=11.17 然后、再根据修约规则把11.17整化成11.2。
例如: 1.0005 五位有效数字 0.5000;31.05% ;6.023×102 四位有效数字 0.0540;1.86×10-5 三位有效数字 0.0054;0.40% 两位有效数字 0.5 ; 0.002% 一位有效数字 在1.0005克中的三个“0”,0.5000克中的后 三个“0”,都是有效数字;在0.0054克中的“0”只 起定位作用,不是有效数;在0.0540克中,前面的 “0”起定位作用,最后一位“0”是有效数字。同 样,这些数值的最后一位数字,都是不定数字。
一、有效数字
在科学实验中,为了得到准确的测量结果,不仅 要准确地测定各种数据,而是还要正确地记录和 计算。所以,记录实验数据和计算结果应保留几 位数字是一件很重要的事,不能随便增加或减少 位数。例如用重量法测定硅酸盐中的SiO2时,若 称取试样重为0.4538克,经过一系列处理后,灼 烧得到SiO2沉淀重0.1374克,则其百分含量为: SiO2 % =(0.1374/0.4538)×100%= 30.277655354%
平均值
样本容量为n,其平均值为:
x
n
xi
偏差
偏差d=测定值xi-平均值x 平均偏差=∑(xi-x)n
样本标准偏差
S
i 1 n
(x i x ) n 1
2
f = n-1, 自由度:n个测定数据 能相互独立比较的是n-1个。 引入n-1是为了校正以样本平均值 代替总体平均值引起的误差。
相对标准偏差
(relative standard deviation-RSD) 又称变异系数 (coefficient of variation-CV)
CV
S x
100
例1:重铬酸钾法测得中铁的百分含 量为: 20.03%, 20.04%, 20.02%, 20.05%和20.06%。计算分析结果的 平均值,标准偏差和相对标准偏差。
数字修约规则
“四舍六入五留双”
具体的做法是,当尾数≤4时将其舍去; 尾数≥6时就进一位;如果尾数为5而后 面的数为0时则看前方:前方为奇数就进 位,前方为偶数则舍去;当“5”后面还 有不是0的任何数时,都须向前进一位, 无论前方是奇还是偶数。“0”则以偶数 论。