当前位置：文档之家› 回归分析与实验设计之一

回归分析与实验设计之一

回归分析与实验设计
辛涛心理学院发展心理研究所
讲授提纲
• 研究方法概述与回归分析的基本原理 • 预测变量为连续变量的回归分析 • 极端值与预测变量之间的交互作用问题 • 预测变量为分类变量的回归分析 • 任意类型预测变量的回归分析 • 重复测量条件下的回归分析 • 几种常见的实验设计的类型
– 单因素设计 – 两因素完全随机设计 – 两因素重复测量设计 – 三因素实验设计的问题 – 嵌套设计
作业
– 地址：ftp://202.112.83.138 用户名：tongji 密码：tongji
数据分析概述
• 数据分析的一般思路是： DATA = MODEL + ERROR 因此，数据分析的基本目标就是尽可能
减少误差，增加模型的代表性。 • 简单模型与扩展模型
– Model C (compact model) vs. Model A (Augmented model)
两模型比较的图示
关于β1的统计推断
• 等价的假设:
H0: 保留模型 C HA: 接受模型A
H0: η²=0 HA: η²>0
H0: β1 =0 HA: β1 ≠ 0
SSE与PRE
– SSR = SSE(C) – SSE(A) – SSR = 1023.6 - 897.2 = 126.4
• 见网页
– 对应于独立样本的t检验
– 我们用X表示一个观测到的数值里属于哪个组别：
• Xi = -1 if in group A, Xi = +1 if in group B
– 这种情况我们将在以后的课程中进行讨论
• 简单回归分析（其中X 是连续变量）
– 例如垒球中的入场人数于平均击球次数
模型
关于误差的假设
1. 误差正态分布 2. 误差独立 3. 误差变异齐性 4. 误差无偏
例1：
• 某年级学生历年来平均数学成绩为65，某教师采用新的教学方法，结果他班上15名学生的平均成绩为78。校长想知道这个班所代表的群体的平均成绩是否显著的不同于65。
• 具体成绩如下： Y=72, 52, 93, 86, 96, 46, 55, 74, 129, 61, 57, 115, 79, 89, 68
• 误差减少率（PRE）
模型与误差
• 一个最简单的模型:
• 从误差的角度思考, 我们可以说如果没有误差，Y所有的取值将等于模型（β）
• 误差中间包括除了模型之外的所有可能影响到Y的取值的因素。
误差
• 可能的误差的代表性度量
– CE ‘Count of Errors’: mode – SAE ‘Sum of Absolute Errors’: median – SSE ‘Sum of Square Errors’: mean
单组t检验的方法
H0: μ = 65 HA: μ≠ 65
从模型比较的角度思考
• 最简单的模型，没有参数：
– Yi = B0 + εi – 其中B0是一个未经估计的任意常数
• 新的较为简单的模型, 有一个参数
– Yi = β0 + εi – 其中β0 是一个可以从数据中估计产生的参数. – b0 (样本均值) 是我们对 β0的估计值, 因此： – Yi = b0 +ei
• SSR = SSE(C) – SSE(A) • SSR = 10,403 - 7,815.7 = 2,587.3
PRE的显著性检验
• 途经1：直接查表 • 途经2：PRE与F*之间的转化
• PA：模型A中所包含的要估计的参数 • PC：模型C中所包含的要估计的参数
• 我们的例子
– 查F表，其中df1=(PA-PC), df2=(N-PA) 获得 Fcritical=4.60, F*=4.66,
• 联系方式：
– 我的办公电话：58805278 – Email: xintao@ – 答疑时间：周五下午2:00-3:30
• 助教
– 罗良地点：英东楼201 时间：星期三上午9：30到11：00
– 李中权地点：英东楼549 时间：星期二上午9：30到11：00
• 课件下载
– 所以拒绝 H0.
• 途经3：直接计算F值
– 我们已经有SSR, SSE(A)和SSE(C).
• dfSSR = PA – PC • dfSSE(A) = N – PA • dfSSE(C) = N – PC
– 因此：
• MSR = SSR / dfSSR • MSE = SSE(A) / dfSSE(A)
• 问题：如何选择?
一个参数估计值的性质
1. 无偏性（Unbiasedness） 2.有效性（Efficiency） 3. 一致性（Consistency）
• 平均值抽样分布的标准误： • 中为数抽样分布的标准误：
比较：均值和中数作为模型参数
• 两者都是模型参数的无偏估计
• 都是一致的估计
• 均值的标准误小于中数的标准误，因此相对于中数，均值是一个更为有效的估计
– 2. If you think PRE will be of medium size, then estimate η²=.13
– 3. If you think PRE will be large, then estimate η²=.26
• 方法3：涉及对B0与β0之间差异大小以及 Y的方差的预估.
假设
• 检验假设 (双侧)
– H0: β0 = B0 其中 β0 = μ 且 B0 = 65 – HA: β0 ≠ B0
• or
– H0: μ = 65 – HA: μ≠ 65
模型
• MODEL C: (简单模型)
– Ŷi = B0 – Ŷi = 65 + εi
• MODEL A: (扩展模型)
– F = MSR / MSE
回归模型的检验力问题
• Power = 正确拒绝H0的概率
• Power = 正确拒绝简单模型（接受扩展模型）的概率。
• 估计检验力的大小对于试验设计而言非常重要。
如何估计检验力的大小
• 方法1：如果可以估计出PRE的真值η2，我们就可以估计出检验力的大小。
PRE和检验力转换表
• 方法2：Cohen的标准
– (Cohen, J. 1977. Statistical Power Analysis for the Behavioral Sciences, rev. ed. New York: Academic Press).
– 1. If you think PRE will be small but still present, then estimate η²=.02
– 假设你认为采用新方法后学生的成绩上升为 75，过去历年数学考试成绩的方差为400，那么，
如何提高检验力？
• 减少误差
– 方法学上的考虑 – 增加模型A的参数
• 增大样本容量
– 成本问题
模型进一步复杂化
• 增加第二个限制性的参数
• 两种可能遇到的情况
– 两组实验设计 – 简单回归分析
• 两组设计
– 3. Judd, C.M., & McClelland, G.H. (1989). Data analysis: a model-comparison approach. Harcourt Inc.: New York.
• 作业与考试
– 没有集体的上机的机房和时间 – 包括6个作业 – 一个期末考试（or final paper?）
• 所估计参数的代数解释
– b0是当X为0是Y的预测值； – b1是当X改变一个单位时，我们所预测到的Y的
变化。
• 所估计参数的几何解释
– 截距与斜率
回归线
• b0和b1的计算（MSE） • 预测的标准误
模型比较
• 两参数模型
• 单参数模型
– Ŷi = β0, or using the estimate of β0 – Ŷi = b0 – b0 = est. of μ = sample mean = 78.13 – Ŷi = 78.13
• 采用模型A能显著地降低误差吗？类似于检验 H0：β0 = B0
SSE(C) = 10,403 SSE(A) = 7,815.7
• 实验设计中的分类数据的处理（对数线性模型）
• 教材与教参：
– 1. 舒华：《心理与教育研究中的多因素实验设计》，北京师范大学出版社，2004。
– 2. Harris, P. (2002). Designing and Reporting Experiments in Psychology. McGraw-Hill Companies, Inc. （人民邮电出版社，2004翻印）。

e商务文档

回归分析与实验设计之一

相关文档推荐：