医学中的实验设计与数据处理摘要:实验是一切自然学科的基础。
实验设计与数据处理在医学中更是发挥着不可估量的作用。
正交实验设计中,对实验进行改进,采用极差分析和方差分析法,研究不同改性条件对大豆蛋白乳化性的影响,并找出主要影响因素。
通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使医学中更多的生理机制被探索发现,使更多的药物疗法被发明应用,从而更好地拯救患者,造福人类。
关键词:医学实验,实验设计,数据处理一,引言实验是自然学科的基础,任何自然科学都离不开实验。
科学界中大多数的公式定理都是由实验反复验证而推导出来的,只有经得起实验验证的定理定律才具有普遍实用性。
而科学的实验设计是利用已有的专业学科知识,以大量的实践经验为基础而得出的既能减少实验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法。
这就必然涉及到实验的数据处理,也只有对实验得出的数据作出科学合理的处理,才能使实验结果更具说服力。
实验设计方法最早应用于农业、生物学、遗传学方面。
早在20世纪中期,就有一些欧美国家将实验设计应用于工业生产,以达到减少成本而获取最大利益的目的。
随着时间的推移,实验设计越来越受到人们的重视,也开始在各个领域开始广泛的应用。
医学是一门将科学和生活紧密结合的学科,因此医学中的实验设计显得尤为的重要。
科学的实验设计不仅能起到节约时间,节约成本的作用,还能使分析更具普遍适用性,或减少药物风险,或增强药物疗效,更加福泽患者。
二,. 试验设计与数据分析(一)完全随机试验设计与单因素方差分析完全随机试验设计比较简单,处理数与重复数都不受限制,适用于试验条件,、环境、试验动物差异较小的试验【1】,完全随机试验设计只设置1个试验因素,可采取单因素方差分析,如果有协变量影响,则考虑单因素协方差分析。
方差分析的前提条件是样本独立性、正态性和方差齐性【2-3】,若不满足这 3个条件,则需进行平方根转换#对数转换和反正弦转换( 在Excel中通过插入函数或利用 Spss的数据转换命令进行转换) ,或者选择非参数检验( 如秩和检验、符号检验等) 。
以上条件中,对独立性要求最严格,但一般都可满足,根据试验设计的随机化基本原则在试验设计和试验过程中已被充分考虑。
相互独立的随机样本才能保证变异的可加性( 可分解性) 。
单因素方差分析必须考虑正态性和方差齐性,但无重复数据的方差分析,如正交设计则不考虑这 2 个问题,正态性和方差齐性是以单元格为基本单位的,每个单元格若只有1个数据,则无法分析; 对于有重复数据的多因素方差分析,真正分到每个格子中的样本例数一般都只有 3-5例,很难检验出差别,或者极端情况,因为极个别格子方差不齐而导致检验不能通过,这种情况实际上对分析结果影响并不太严重,只要数据分布不是明显偏态,不存在极端值即可【4】,正态性检验的方法有多种,如图示法( 概率图或分位数图) ,或计算法( 如矩法、 W检验法、D检验法) 等,本文主要采用 Spss中依据矩法原理的单样本K-S法进行正态性检验。
方差齐性是指相互比较的各样本的总体方差相等。
1,例 1. 为了比较5种不同配合饲料对猪的饲喂效果,选取了品种、性别、体重基本相同的仔猪 25头,随机分成5组,投喂不同饲料,经30d试验后,各组的增重结果列于表1【5】,( 1) Spss操作( 部分数据文件见图 1)正态性检验,Analyze—→ Nonparametric Test----→ 1-Sample K-S,净增重---→Test Variable List, Test Distribution中选择 Normal →Ok。
5组饲料的P值分别为0.722、0.967、1.000、0.964、1.000,均服从正态分布。
单因素方差分析。
本题只有1个试验因素,无协变量影响,属于简单的单因素方差分析,选择 Spss中针对单因素单向方差分析的One-way ANOVA命令进行快速分析。
Analyze→Compare Means→One-way ANOVA,组别→Factor,净增重→Dependent List,Post Hoc→Post Hoc Multiple Comparisons( 多重比较) →Duncan→Continue→Options→Descriptive,Homogeneity-of-Variance(方差齐性检验) →Continue→Ok。
输出结果有描述性统计量、方差齐性检验、方差分析、多重比较。
方差齐性检验结果,P=0.579大于0.05即方差齐性。
方差分析结果,P=0.003小于0.01,表明不同配合饲料对猪的饲喂效果有极显著差异,且饲料5 对猪增重效果最佳。
( 2)Excel作图。
选择图表类型并生成初图。
复制 Spss描述性统计结果→编辑(Excel中) →选择性粘贴→Unicode 文本。
插入→图表→柱形图→子图表类型→簇状柱形图( 右侧类型中的第一个) →下一步→数据区域( 选定平均值一列数据区域) →完成。
图形初步编辑。
数据轴主要网格线→右键→清除,绘图区→右键→清除,图例→右键→清除; 数据柱→数据系列格式→图案→边框→自定义→颜色→黑色,内部→颜色选白色; 图表区→右键→图表区格式→图案→边框→无,区域→无→确定,字体→字体先选宋体,再选Times New Romen,字形→常规,字号→8 号。
图表区左上角小正方图变为 45度双向箭头时,向右下角方向拉动,将横坐标轴长度调整为Excel中 3个单元格长度,将纵坐标轴长度调整为Excel中 6个单元格长度( 横、纵坐标轴长度视具体情况而定,图形美观即可) ,纵坐标→右键→坐标轴格式→刻度→主要刻度单位为 4( 视具体情况而定) →确定。
添加误差线。
若样本数相同,误差线既可选择标准偏差( SD) ,又可选择标准误差( SE) ,若样本数不同,则只能选择标准误差,通常都选择标准误差.。
数据柱→右键→数据系列格式→误差线→显示方式→正偏差→自定义: ( C)+ ( 选定标准误那列数据区域) →确定"。
多重比较结果标注。
根据图 2多重比较结果,不在同一列,表示差异显著(P<0.05) ,用不同字母表示,同列用相同字母表示,表示差异不显著(0.05< P) ,点击绘图区→敲入相应的英文字母→Enter→放入对应数据柱上。
变成.JPG图片。
复制Excel 中图形至Word中,编辑→选择性黏帖→图片( 增强型图元文件) 。
(3)Word编辑。
点击图片→右键→显示“图片”工具栏→裁剪→调节图片四边至合适大小→文字环绕→浮于文字上方→点击图片→图表区左上角空心圆变为 45度双向箭头时向右下角方向拉动,调节至合适大小。
图表标题和坐标轴标目填写的通常做法是在Excel中完成: 图表区→右键→图表选项→将图表标题、横、纵坐标标目分别输入图表标题( T) ,分类(X)轴( C) ,数值( Y) 轴(V )中。
但如果论文中图形较多,一旦图表标题和横、纵坐标轴标目出现错误会造成修改不便,或者几个图形组合在一起,为了美观,需使几个图形具有相同的横、纵坐标长度,则要反复调整,势必会增加工作量。
可通过插入文本框实现。
插入→文本框→横排→输入横坐标标目→点击文本框边缘→右键→设置文本框格式→颜色与线条→线条→颜色选为白色→确定。
若为纵坐标标目,点击所写的纵坐标标目→右键→文字方向→方向→选择第二行第 1个.。
最后,按Shift 将横、纵坐标标目与图形进行组合( 见图3) .。
(二)随机区组设计与2因素方差分析随机单位组设计也称为随机区组( 或窝组) 设计。
它是根据局部控制的原则,如将同窝、同性别、体重基本相同的动物划归一个单位组,每一单位组内的动物数等于处理数,并将各单位组的试验动物随机分配各处理组[6]。
随机区组设计的数据分析中将区组作为 1 个因素,再考虑另一试验因素,因此通常采用2因素方差分析中最简单的两因素无交互方差分析。
例2, 4个品种的猪,分别用3种配合料 ( 每种饲料喂 1 头猪) 饲养 3个月的增重结果见表 2。
分别检验不同品种以及不同饲料对猪增重效果是否有显著差异[10]。
数据文件见图4输出结果有方差分析、单因素统计量以及多重比较( 由于本文主要介绍数据分析过程以及作图技巧,在此不将方差分析、单因素统计量作为重点列出) 。
方差分析表明,品种、饲料P值分别为 0.000,0.016,即不同品种及不同配合饲料对猪的饲喂效果均有显著影响,品种 1和饲料 2和 3 对猪增重效果最好。
(1)根据单因素统计量和多重比较结果画出柱状图。
为了节省作图时间,根据单因素统计量和图 5 多重比较结果在 Excel中先做好图 6中左图&复制→粘贴→点击图表区→右键→源数据→在数据区域中插入右图数据,这样 2 个图形大小基本一致,重新添加平均值、误差线和多重比较结果,为了使数据柱对比更加鲜明,将Excel 中纵坐标最大和最小值调节为合适的数值。
调整2个图形横坐标在Excel 同一行单元格上,调整横、纵坐标轴,使 2个图形具有相同长度的横纵、坐标轴,具有相同数量的主要刻度单位。
(2)调整2个图形使数据柱具有相同宽度。
点击数据柱→右键→数据系列格式→选项→分类间距→调整数值使 2 个图形数据柱具有相同宽度.。
(3)组合图形。
Shift→分别点击 2 个图形→右键→组合→复制至 Word 中→编辑→选择性粘帖→图片( 增强型图元文件).。
插入图表标题和坐标轴标目,并与图形组合。
三常见的医学实验设计类型(一)医学实验设计类型有几十种:常见的有:配对设计、成组设计、单因素K水平设计( K≥3)、配伍组设计、拉丁方设计(拉丁方设计中,试验处理数= 横行单位组数= 直列单位组数 =试验处理的重复数【1】)、交叉设计、析因设计、正交设计和具有重复测量的设计。
正交设计是利用正交表来安排与分析多因素试验的一种设计方法,它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这些部分试验结果的分析了解全面试验的情况,找出最优的水平组合【1,7-8】.。
从是否便于考察因素之间交互作用的角度看,前六种设计都不便考察交互作用,后三种设计是可以考察交互作用的。
从同时考察因素的个数多少角度看,前三种设计都属于单因素设计,配伍组设计属于二因素设计,拉丁方设计、交叉设计都属于三因素设计,而后三种设计即可以用于二因素设计,又可以用于多因素设计。
由于配伍组设计、拉丁方设计和交叉设计都不便考察交互作用,故最适合用于安排只含一个处理因素,含一个或二个区组因素的实验研究场合。
如果实验中同时涉及二个或二个以上处理因素,因素之间的交互作用往往又是不可忽视的,此时,就应当选用析因设计或正交设计。