当前位置:
文档之家› 科研设计及统计分析中存在的问题
科研设计及统计分析中存在的问题
x 2 = 59.86
8
P < 0.05
Sc =10.32 S x-x = 5.52 ( 11.6 , 8.8 ) t = 1.32 P > 0.05
(三)、析因设计 (Factorial design ) 是将两个或多个因素的各个水平进行排列组合,交差分组进 行实验,用于分析各因素、各水平的交互作用,寻求最佳组合。 析因设计的优点 : 1, 可用于多因素、多水平实验研究,并能分析它之间有无交 互作用。 2, 析因分析能充分地利用原始数据。 3, 析因分析估计出的效应及交互作用独立于其它效应。
判断:T Tan
S
Grubbs法 T αn 界值表(α=0.05) n 0.05 n 0.05
6
7 8 9
1.82
1.94 2.03 2.11
10
11 12 13
2.18
2.23 2.29 2.33
22
方差齐性和偏态的简单判断
• 1、变异系数 cv % = s / x
• < 10% 表示变量相对集中 • > 30% 变量较为分散,波动大,资料呈偏态资料。 • 2、 S1 / S 2 > 1 以上 为方差不齐
T C C T T T C T C C
C T T C C C T C T T
T T C C T T C T C C
T C T C C T C C T T
T C C T C C C T T T
21
可疑数字的取舍 Grubbs法
T
T
i
X
例0.16、0.17、0.17、0.16、0.18、 0.30 X = 0.19 0 T = 2.00 ( 0.168 S =0.054 , 0.008 )
16
重复的原则( principle of replication)
重复是指实验次数或例数的问题。即例数问题。
重复的目的是:
1, 消除非处理因素的影响。 2, 使实验效应更具代表性,反应其真正的客观规律。
例数多少的确定:
1, 一般估计法 (1)临床试验:每组病例≮30 例 (2)动物实验:大动物至少3~5 只 小动物 每组 10~20 只
例 :将16只小鼠分为 甲、乙、丙、丁 四组 用随机排列表 ,选用第 5 行 1~16排列。 编号 1 2 3 4 5 6 7 8 随机号 16 01 14 07 10 03 02 11 编号 随机号 9 10 11 12 13 14 15 16 06 09 12 05 13 08 15 04
随机号 1 ~ 4 分在 5~8 9 ~ 12 13 ~ 16
效因分效的缺点 :当实验因数多时,所需实验排列组合巨增, 实践起来较麻烦。常用 2 X 2 析因分析。
举例 :四种治疗缺铁性贫血方法的疗效比较
9
四种治疗缺铁性贫血方法的比较 (RBC 增加量) 食疗 0.8 0.9 0.7 ∑X 2.4 0.8 x 食疗+A 药 1.3 1.2 1.1 3.6 1.2 食疗+B 药 0.8 1.1 1.0 3.0 1.0 食疗+A+B 2.1 2.2 2.0 6.3 2.1
11
(四), 拉丁方设计 (Latin square design ) 拉丁方是由拉丁字母组成的方阵。 例:3×3的拉丁方 A B C B C A C B A B C A AB C BAC C A B CAB AC B 若实验过程涉及到三个因素,各个因素间无交互作用且水平 数 相同,可用拉丁方设计。
19
科研设计的基本内容 —— 4 、5
科研设计应包括两类设计:一为专业设计、 一为统计设计。其统计设计的基本内容是: 1, 围绕研究目的,确定统计设计方案。 2,合理安排处理因素,及水平。 3, 确定受试对象的取舍、如何分组及样本例 数的确定。 4, 确定实验方法及观察指标。(主、客观) 5, 如何控制误差;系统误差、抽样误差 6, 如何实施实验;如何收集实验数据; 7, 确定统计分析方法。
17
(3)根据实验中影响因素,确定例数 重复的原则是控制误差的一个重要手段。重复的程度表现 为实验例数的多少,即样本含量。例数太少,不能反映事 物的内部规律,会把偶然现象当成规律,得出错误结论。
影响因素 资料类型 变异程度 指标差异 相关程度 非实验因素 各组例数 设计方案 例数可少 数值变量 S 小 大 密切 控制严 相等 合理 例数可多 分类变量 S 大 小 不密切 控制不严 不相等 不合理
n 15
SE : 88 .0 20 .0 (68.0 108.0)
s 77.5 SE 20.0 SD n 15
24
统计学结论要规范
x 10
1 _
x
1 2
_
2
8
t test
•
t
t
H t t
0
0.05
拒绝 H
接受 H
0
0.05,
ห้องสมุดไป่ตู้0.05,
P 0.05
7
异体配对资料 对子号 1 2 3 4 5 6 7 新药组 36 45 65 55 65 60 42 安慰剂组 45 65 70 65 63 60 51 差值 9 20 5 10 -2 0 9 d
按配对处理
按组间处理
d = 7.29 s = 7.3
Sx = 2.76 t = 2.64
x1 = 52.57
科研设计及统计分析中存在的问题
• • • • 一 、科研三要素与论文题 二 、科研设计中专业设计与统计学设计 三 、统计方法选择及流程图 四 、统计图表中的问题
1
一 、科研三要素与论文题 处理因素 受试对象 实验效应
1、不同剂量喷他佐辛对老年患者脊麻效果的临床 观 察 2、Lak细胞治疗慢性活动性乙肝病人的疗效观察 3、65例小儿急性偏瘫临床与CT分析 4、吸入C02对心脏活动的影响 5、吸入3% C02过程中人体ECG的变化 6、腹腔镜治疗新生儿腹股沟斜疝可行性研究
20
Richard Doll 病人随机分配表
十位数
0 1 2 3
个
4 5
位
6 7
数 8 C T T C C C T C T T
9
0 1 2 3 4 5 6 7 8 9
T C T C T T T C C C
C C C T T C T T T C
C T T T T C C T C C
C T C T C T T C C T
3
科 研设计内容
专业设计 要求:运用专业理论、技术设计 统计设计 运用统计学知识和方法设计
内容:确定实验对象、观察指标、
材料、方法等。
确定设计方案,资料的收集,
分析指标及分析方法。
目的:完成科研课题,验证假设, 减小误差,提高效率,保证样 保证课题的先进性
本的代表性、可靠性、可重复性
Goto 1
4
方差分析结果: A药 F= 169 B药 F= 91 A+B药 F= 36
P< 0.01 P<0.01 P<0.01
10
A ,B 药交互作用表 B 不 用 药
合
用
计
A
药
不用
用
0.8
1.2 2.0
1.0
2.1 3.1
1.8
3.3 5.1
合 计 分 析: A A B A
+ B 疗 效 = 2.1 – 0.8 = 1.3 药 疗 效 = 1.2 – 0.8 = 0.4 药 疗 效 = 1.0 – 0.8 = 0.2 + B 协 同 疗 效 = 1.3 – 0.4 – 0.2 = 0.7
P 0.05
0
差异有统计学意义
差异无统计学意义
不规范表述: 1、P<0.05 差异有显著性,P<0.01 差异非常显著(旧的提法) 2、差异相同 没有差异
拉丁方设计的优点 : 1, 安排三个因素,实际进行二个因数实验,另一个因数 化整为零,检验效率高。 2, 本设计可看成是纵横为配伍设计,因而均衡性好。 3, 节省大量实验对象 。 拉丁方设计的缺点 : 1, 每个实验条件下(即每个格子)只做一次实验,因而重复 性差,可用增加拉丁方的个数耒弥补。 2, 要求三个因素相互独立,无交互作用,并且各因数的水平 12 数相同。
18
各组例数相等,检验效率高 ,例: 一, 对照组 :N = 40 治愈率 5 % ( 2 / 40 ) 实验组 : N = 40 治愈率 25% ( 10 / 40)
X2 = 6.27
P < 0.05
( 1 / 20 ) ( 15 / 60 )
二, 对照组 : N = 20 治愈率 5 % 实验组 : N = 60 治愈率 25% X2 = 3.75 P > 0.05
• • •
• •
S / S > 3 为方差不齐。 说明 :S 大者为 分子,小者为分母。 3、 数据中有不确定数字 如 < 5或 > 20 等,为偏态资料 。
4、 当样本例数在 100及以上 可不进行齐性检验。
2
2
x SD与 x SE的意义与区别
PO
a 2
_
SD ( 10 . 5 165.5) SD : 88 .0 77 .5
科研设计的基本内容 —— 2 、3
科研设计应包括两类设计:一为专业设计、 一为统计设计。其统计设计的基本内容是: 1, 围绕研究目的,确定统计设计方案。 2,合理安排处理因素,及水平。 3, 确定受试对象的取舍、如何分组及样本例 数的确定。(重复原则) 4, 确定实验方法及观察指标。 5, 如何控制误差; 6, 如何实施实验;如何收集实验数据; 7, 确定统计分析方法。
2
二、科研设计的基本内容
科研设计应包括两类设计:一为专业设计、 一为统计设计。其统计设计的基本内容是: 1, 围绕研究目的,确定统计设计方案。 2,合理安排处理因素,及水平。 3, 确定受试对象的取舍、如何分组及样本例数的 确定。(重复原则) 4, 确定实验方法及观察指标。(主、客观指标) 5, 如何控制误差;(系统误差、抽样误差) 6, 如何实施实验;如何收集实验数据; 7, 确定统计分析方法。(见统计方法流程图)