当前位置:
文档之家› 心理学统计 第一部分 描述性统计
心理学统计 第一部分 描述性统计
变量与常量
• 在上个例子中,同学的智商是不同的,学习成绩也是不同, 也就是说智商和成绩都是变化,因此称之为变量。 • 有些量是不变化的,称之为常量,比如光速 • 人的心理指标往往都是变量,比如你聪明他笨,你高他矮, 大千世界人与人各不相同 • 变量的各个水平是连续的称为连续变量,如身高、体重, 不连续的称为离散变量,比如考试分数 • 我们对心理变量进行描述,就需要对其进行测量
等距量尺
• 如果一个变量个相邻水平之间的间隔是总是相等 的,这是等距量尺的特征。那些具有相等间距但 没有绝对零点的量尺被称为等距量尺。
摄氏温度、电压、智商
20度是10度的2倍? 我智商150是阿甘的两倍?双重弱智?
等比量尺
• 如果一个等距量尺同时也具有一个绝对零 点,那么两个测量值之比是有意义的。同 时具有等距和等比特征的量尺称为等比量 尺。
B基本统计过程
• • • • 下标变量 求和符号 求和符号的特征 四舍五入
下表变量
• 班内同学的年龄:
张三20,李四21,王五23,。。。 这样的表示方式非常繁琐,我们可以采用一 种简单的表示方法,下表变量:Xi,其中i可以定 义为学号,这样Xi就表示学号为i的同学的年龄。 • 下标变量用于公式计算,简单明了。
• 最常见的集中趋势量是算数平均数:测量值的总 和除以总体个数或者样本数。 • 除此之外,还有调和平均数(倒数的平均再取倒 数)和几何平均数(连乘开方)。 • 总体平均值μ,样本平均数 X
• 众数:频率最高的数
• 缺点:测量集中趋势时有时不稳定。 X f 10 1 20 1 30 2 40 0 50 6 60 5 70 4 80 6 90 1
(2)该数值的频数与所有比其高的分数的总频数 之和(不比我分低的学生有多少) X 95 94 93 92 91 90 89 88 87 86 85 84 83 f 1 1 1 2 3 6 9 14 17 17 20 21 22
• 更多的情况下,我们不关心具体有多少人分数比 我高,而在乎一个比例 • 相对频数和累积相对频数,即频数和累积频数与 总数之比 • 累积百分比分布,也就是把累积相对频数用百分 数来表示 • 百分位数,某一给定的百分位所对应的分数,常 见的25%,50%,75%
图
• 频数分布表中的有关信息可以用图的形式表现出来更直观 • 条状图:离散变量 • 直方图:连续变量 • 频数折线图:注意最末端和最始端分别要通过一条直线连 到X轴 • 累积频数折线图:单调变化 • 实际分布和理论分布:较少的测量次数和不精确的测量导 致实际测得的分布不光滑
B基本统计过程
• 分组频数分布
• 选择最低组距的极限:
一个指导原则是确保最低组距的下表观极限 或上表观极限是组距的倍数。
• 绘制频数分布图的指导原则:
1、图的高度为宽度的三分之二; 2、数值或测量值分布在X轴上,频数在Y轴上; 3、数据单位在X轴和Y轴上均必须是等距的; 4、X轴和Y轴的交点为0,且向上或向右数值增大; 5、选择合适的测量单位和标尺; 6、XY轴必须清楚地标定出来。
自变量与因变量
• 实验法是心理学研究的一种重要方法。
• 问题:课前预习是否有助于学习成绩的提高? • 实验:随机选两组人,一组课前预习,一组不预 习,课后对其进行测验,给出分数 • 预习与否是我们操控的变量,称为自变量;测验 分数会受到预习与否的影响,称为因变量。自变 量与因变量之间有因果关系。
• 在这个例子中,因变量用等比量尺测量, 自变量是用称名量尺来测量,那么其统计 方法是用参数统计还是非参数统计呢?
第一章
心理统计概论
A基本概念
• • • • • • • • 什么是统计? 统计与研究 变量与常量 测量量尺 心理量尺与变量 参数统计与非参数统计 自变量和因变量 总体和样本
什么是统计
• 统计是以数字形式来表达的观察结果
我们班有几名同学,平均年龄是多少?
• 统计是一个数学分支,是一些理解和概括数字集 合的方法
顺序量尺
• 如果一个量尺的各个水平可以排序,但各相邻水平之间的 间隔又不一定相等时,这种量尺就是顺序量尺。 某个人的相貌:很差、差、一般、好、很好
• 当被试或项目沿着某一维度被排序时,各水平可以赋数字, 但不能做数学运算。 1很差,2差,3一般,4好,很好 • 实际的研究中研究者经常会对类似手段(5点评分)的分 数进行数学运算,此时他们把这些分数看做是等距数据了
• 中数:第50百分位数 • 若数值个数为奇数,中数则为排序数列的中间那 个数字; • 如数值个数为偶数,中数则为排序数列中间两个 数字的平均(等距/等比数列)。 • 中数无法描述称名数据 • 顺序量尺测量的数据,中间的数为两个时不能做 平均;太多相同的数值会降低运用顺序量尺来测 量数据的意义。 • 当一个数列存在过大或过小值的时候,中数不受 其影响,要好于平均数。
• 注意:即使某一特定数值没有出现也要列出,如93,94的频数 为0 • 众数:在一个分布中发生频率最高的那个分数,88;在某些 分布中众数可能不止一个。
• 累积频数分布: (1)该数值的频数与所有比其低的分数的总频数 之和(多少学生分数没比我高)
X 95 94 93 92 91 90 89 88 87 86 85 84 83 f 22 21 21 21 20 19 16 13 8 5 5 2 1
练 习
•
1. 2. 3. 4.
哪种心理量尺类型适合于解决下列问题:
回答正确的算数题目 心率 恐惧症类型 通过自评问卷测量自尊
•
下列哪些研究是实验研究,哪些是相关研究
1. 比较养宠物者与不养宠物者的同情心 2. 比较男性和女性在极品飞车游戏中的成绩 3. 比较被试在男性主试和女性主试的研究中1小时 完成的任务情况
• 如果可能尽量用5的倍数; • 间距最好是等距的。
求与某一组距宽度对应的组数: • 求全距:最大数值的真实上限减去最小数值的真 实下限; • 把全局与一个方便的组距宽度相除; • 如果全局小于20,可以使用简单频数分布; • 为了避免太多组的频数为0或者很小的情况,组的 个数最好不要超过样本大小的平方根。
• 表观极限和真实极限
• 建构组距
• 选择组距宽度
• 选择最低组距的极限
• 绘制频数分布图的指导原则
• 61-70,71-80,81-90,91-100
• 其间距有表观极限来定义:71下极限,80上极限 • 如果变量为连续的,那么表观极限就不是组距的 真实极限。70.5为真实下极限,80.5为真实上极 限。 • 真实极限比表观极限低出或高出半个单位,组距 由真实极限算出。
总体和样本
• 人们所关心的某一群体的集合称为总体。总体可以是一个 人,一个家庭或一个城市。总体的子集被称为样本。 调查华师学生的男女比例: 华师所有的学生就是总体,要得到总体的特征,我们 可以蹲在一个路口,数100个学生,记录其性别。这100 个学生就是样本。通过计算100个学生的男女比例来推测 总的比例。 • 从样本中获得的、对样本特征进行总结的数值被称为统计 量,而用来描述总体特征的数值被称为参数。
• 某人要研究失眠是否会引起焦虑,他选取了两组 被试,一组为失眠者,另一组为睡眠正常者,测 量其焦虑水平,并进行比较。
这个研究中自变量是什么? 因变量是什么?
• 上例中我们确定是失眠引起焦虑还是焦虑引发失 眠,因此并非实验研究,没有自变量和因变量。 • 这样的研究应该采用相关法,及计算两个变量的 相关性。
双下标变量
• 1个班级学生的年龄可以用Xi 表示,那么10 个班级学生的年龄呢? • 可以用Xki,k代表班级号,i代表学号,这样 Xki表示的就是第k个班级的学号为i的同学的 年龄。 如X1,12
求和符号
• 计算1个班级内30名同学平均年龄,我们可以写成 (X1+X2+X3+X4+….+X30)/30 • 这样的表达比较繁琐,因此需要引入求和符号∑ • 上边的表达式就变成了
k 1 i 1
m
n
ki
求和符号的特征
(X
i
Yi ) X i Yi
C nC
CX
i i
i
C X i
i i
( X Y ) ( X )( Y )
四舍五入
• 中国的四舍五入:见四舍,见五进 3.4441~3.44 3.4450~3.45 3.4550~3.46 3.4551~3.46 • 美国的四舍五入: 3.4441~3.44 3.4450~3.44 3.4550~3.46 3.4551~3.46
X
i 1
30
i
/ 30
求和符号下方i=1表示从第一个开始叠加,上方的30 表示叠加到第30个数据为止。 问:求学号为5-21的同学的平均年龄怎样表达
• 对于双下标变量Xki
X 表示第k个班级的学生的年龄总和, •
i 1 ki
n
其中n随着不同班级同学数目的不同而变化
X • 所有同学年龄的总和表示为
• 如何描述?
• 排序:95, 92, 91, 90, 90, 90, 89, 89, 89, 88, 88, 88, 88, 88, 87, 87, 87, 85, 85, 85, 84, 83
• 简单频数分布:
X f
95 94 93 92 91 90 89 88 87 86 85 84 83 1 0 0 1 1 3 3 5 3 0 3 1 1
建构组距的原则:
• 一个数据不可能同时出现在两个组距中; • 两个组距之间没有间隔。
表观极限80-84,85-89,真实极限79.584.5,84.5-89.5
选择组距宽度:
• 有外在标准:考试成绩61-70,71-80,81-90,91-100, 可以分为ABCD等级; • 无外在标准:最好至少能有10个组距才能保证得 到一个关于分布的详细描述;最好不要超过20个 组距;