当前位置：文档之家› 心理学统计第一部分描述性统计

心理学统计第一部分描述性统计

变量与常量
• 在上个例子中，同学的智商是不同的，学习成绩也是不同，也就是说智商和成绩都是变化，因此称之为变量。 • 有些量是不变化的，称之为常量，比如光速 • 人的心理指标往往都是变量，比如你聪明他笨，你高他矮，大千世界人与人各不相同 • 变量的各个水平是连续的称为连续变量，如身高、体重，不连续的称为离散变量，比如考试分数 • 我们对心理变量进行描述，就需要对其进行测量
等距量尺
• 如果一个变量个相邻水平之间的间隔是总是相等的，这是等距量尺的特征。那些具有相等间距但没有绝对零点的量尺被称为等距量尺。
摄氏温度、电压、智商
20度是10度的2倍？我智商150是阿甘的两倍？双重弱智？
等比量尺
• 如果一个等距量尺同时也具有一个绝对零点，那么两个测量值之比是有意义的。同时具有等距和等比特征的量尺称为等比量尺。
B基本统计过程
• • • • 下标变量求和符号求和符号的特征四舍五入
下表变量
• 班内同学的年龄：
张三20，李四21，王五23，。。。这样的表示方式非常繁琐，我们可以采用一种简单的表示方法，下表变量：Xi，其中i可以定义为学号，这样Xi就表示学号为i的同学的年龄。 • 下标变量用于公式计算，简单明了。
• 最常见的集中趋势量是算数平均数：测量值的总和除以总体个数或者样本数。 • 除此之外，还有调和平均数（倒数的平均再取倒数）和几何平均数（连乘开方）。 • 总体平均值μ，样本平均数 X
• 众数：频率最高的数
• 缺点：测量集中趋势时有时不稳定。 X f 10 1 20 1 30 2 40 0 50 6 60 5 70 4 80 6 90 1
（2）该数值的频数与所有比其高的分数的总频数之和（不比我分低的学生有多少） X 95 94 93 92 91 90 89 88 87 86 85 84 83 f 1 1 1 2 3 6 9 14 17 17 20 21 22
• 更多的情况下，我们不关心具体有多少人分数比我高，而在乎一个比例 • 相对频数和累积相对频数，即频数和累积频数与总数之比 • 累积百分比分布，也就是把累积相对频数用百分数来表示 • 百分位数，某一给定的百分位所对应的分数，常见的25%，50%，75%
图
• 频数分布表中的有关信息可以用图的形式表现出来更直观 • 条状图：离散变量 • 直方图：连续变量 • 频数折线图：注意最末端和最始端分别要通过一条直线连到X轴 • 累积频数折线图：单调变化 • 实际分布和理论分布：较少的测量次数和不精确的测量导致实际测得的分布不光滑
B基本统计过程
• 分组频数分布
• 选择最低组距的极限：
一个指导原则是确保最低组距的下表观极限或上表观极限是组距的倍数。
• 绘制频数分布图的指导原则：
1、图的高度为宽度的三分之二； 2、数值或测量值分布在X轴上，频数在Y轴上； 3、数据单位在X轴和Y轴上均必须是等距的； 4、X轴和Y轴的交点为0，且向上或向右数值增大； 5、选择合适的测量单位和标尺； 6、XY轴必须清楚地标定出来。
自变量与因变量
• 实验法是心理学研究的一种重要方法。
• 问题：课前预习是否有助于学习成绩的提高？ • 实验：随机选两组人，一组课前预习，一组不预习，课后对其进行测验，给出分数 • 预习与否是我们操控的变量，称为自变量；测验分数会受到预习与否的影响，称为因变量。自变量与因变量之间有因果关系。
• 在这个例子中，因变量用等比量尺测量，自变量是用称名量尺来测量，那么其统计方法是用参数统计还是非参数统计呢？
第一章
心理统计概论
A基本概念
• • • • • • • • 什么是统计？统计与研究变量与常量测量量尺心理量尺与变量参数统计与非参数统计自变量和因变量总体和样本
什么是统计
• 统计是以数字形式来表达的观察结果
我们班有几名同学，平均年龄是多少？
• 统计是一个数学分支，是一些理解和概括数字集合的方法
顺序量尺
• 如果一个量尺的各个水平可以排序，但各相邻水平之间的间隔又不一定相等时，这种量尺就是顺序量尺。某个人的相貌：很差、差、一般、好、很好
• 当被试或项目沿着某一维度被排序时，各水平可以赋数字，但不能做数学运算。 1很差，2差，3一般，4好，很好 • 实际的研究中研究者经常会对类似手段（5点评分）的分数进行数学运算，此时他们把这些分数看做是等距数据了
• 中数：第50百分位数 • 若数值个数为奇数，中数则为排序数列的中间那个数字； • 如数值个数为偶数，中数则为排序数列中间两个数字的平均（等距/等比数列）。 • 中数无法描述称名数据 • 顺序量尺测量的数据，中间的数为两个时不能做平均；太多相同的数值会降低运用顺序量尺来测量数据的意义。 • 当一个数列存在过大或过小值的时候，中数不受其影响，要好于平均数。
• 注意：即使某一特定数值没有出现也要列出，如93,94的频数为0 • 众数：在一个分布中发生频率最高的那个分数，88；在某些分布中众数可能不止一个。
• 累积频数分布：（1）该数值的频数与所有比其低的分数的总频数之和（多少学生分数没比我高）
X 95 94 93 92 91 90 89 88 87 86 85 84 83 f 22 21 21 21 20 19 16 13 8 5 5 2 1
练习
•
1. 2. 3. 4.
哪种心理量尺类型适合于解决下列问题：
回答正确的算数题目心率恐惧症类型通过自评问卷测量自尊
•
下列哪些研究是实验研究，哪些是相关研究
1. 比较养宠物者与不养宠物者的同情心 2. 比较男性和女性在极品飞车游戏中的成绩 3. 比较被试在男性主试和女性主试的研究中1小时完成的任务情况
• 如果可能尽量用5的倍数； • 间距最好是等距的。
求与某一组距宽度对应的组数： • 求全距：最大数值的真实上限减去最小数值的真实下限； • 把全局与一个方便的组距宽度相除； • 如果全局小于20，可以使用简单频数分布； • 为了避免太多组的频数为0或者很小的情况，组的个数最好不要超过样本大小的平方根。
• 表观极限和真实极限
• 建构组距
• 选择组距宽度
• 选择最低组距的极限
• 绘制频数分布图的指导原则
• 61-70,71-80,81-90,91-100
• 其间距有表观极限来定义：71下极限，80上极限 • 如果变量为连续的，那么表观极限就不是组距的真实极限。70.5为真实下极限，80.5为真实上极限。 • 真实极限比表观极限低出或高出半个单位，组距由真实极限算出。
总体和样本
• 人们所关心的某一群体的集合称为总体。总体可以是一个人，一个家庭或一个城市。总体的子集被称为样本。调查华师学生的男女比例：华师所有的学生就是总体，要得到总体的特征，我们可以蹲在一个路口，数100个学生，记录其性别。这100 个学生就是样本。通过计算100个学生的男女比例来推测总的比例。 • 从样本中获得的、对样本特征进行总结的数值被称为统计量，而用来描述总体特征的数值被称为参数。
• 某人要研究失眠是否会引起焦虑，他选取了两组被试，一组为失眠者，另一组为睡眠正常者，测量其焦虑水平，并进行比较。
这个研究中自变量是什么？因变量是什么？
• 上例中我们确定是失眠引起焦虑还是焦虑引发失眠，因此并非实验研究，没有自变量和因变量。 • 这样的研究应该采用相关法，及计算两个变量的相关性。
双下标变量
• 1个班级学生的年龄可以用Xi 表示，那么10 个班级学生的年龄呢？ • 可以用Xki，k代表班级号，i代表学号，这样 Xki表示的就是第k个班级的学号为i的同学的年龄。如X1,12
求和符号
• 计算1个班级内30名同学平均年龄，我们可以写成 (X1+X2+X3+X4+….+X30)/30 • 这样的表达比较繁琐，因此需要引入求和符号∑ • 上边的表达式就变成了
k 1 i 1
m
n
ki
求和符号的特征
(X
i
Yi ) X i Yi
C nC
CX
i i
i
C X i
i i
( X Y ) ( X )( Y )
四舍五入
• 中国的四舍五入：见四舍，见五进 3.4441~3.44 3.4450~3.45 3.4550~3.46 3.4551~3.46 • 美国的四舍五入： 3.4441~3.44 3.4450~3.44 3.4550~3.46 3.4551~3.46
X
i 1
30
i
/ 30
求和符号下方i=1表示从第一个开始叠加，上方的30 表示叠加到第30个数据为止。问：求学号为5-21的同学的平均年龄怎样表达
• 对于双下标变量Xki
X 表示第k个班级的学生的年龄总和， •
i 1 ki
n
其中n随着不同班级同学数目的不同而变化
X • 所有同学年龄的总和表示为
• 如何描述？
• 排序：95, 92, 91, 90, 90, 90, 89, 89, 89, 88, 88, 88, 88, 88, 87, 87, 87, 85, 85, 85, 84, 83
• 简单频数分布：
X f
95 94 93 92 91 90 89 88 87 86 85 84 83 1 0 0 1 1 3 3 5 3 0 3 1 1
建构组距的原则：
• 一个数据不可能同时出现在两个组距中； • 两个组距之间没有间隔。
表观极限80-84,85-89，真实极限79.584.5,84.5-89.5
选择组距宽度：
• 有外在标准：考试成绩61-70,71-80,81-90,91-100，可以分为ABCD等级； • 无外在标准：最好至少能有10个组距才能保证得到一个关于分布的详细描述；最好不要超过20个组距；

e商务文档

心理学统计第一部分描述性统计

相关文档推荐：

e商务文档

心理学统计 第一部分 描述性统计

相关文档推荐：

心理学统计第一部分描述性统计