统计学的基本概念与描述统计
X
(一)算术平均数
1 何谓算术平均数
算术平均数、几何平均数、调和平均数、加权平均数与 平均数(均数、均值)。
符号表示:M
2 平均数的计算
1)未分组数据 a)一般计算公式;b)用估计平均数的计算公式
2)分组数据 a)一般计算公式;b)用估计平均数的计算公式
(一)算术平均数
3 平均数的基本性质(特点)
六、相关与多变量之间的关系
从单变量 到双变量 再到多变量
从数据分布描述 到数据关系描述
(一)相关与相关系数
1、何谓相关 因果、共变、相关 正相关、负相关、零相关
2、相关系数 是两列变量间相关程度的数字表示形式,
是用来表示相关关系强度的指标。 符号表示: 含义:
3、散点图
(二)积差相关
1、何谓积差相关
是表示一组数据离散程度的最好指标,是常用的 差异量数。
(三)位置量数与标准分数
1 何谓标准分数
以标准差为单位,表示一个原始分数在团体中所处位置 的相对位置量数。也称为基分数或z分数。(计算公式)
理解:a)需使用平均和标准差,是一种商数,无实际 单位。b)平均数的z分数为0,其他分数的z分数可能为正, 也可能为负,表示该分数大于或小于平均数;z分数的绝 对值表示该分数离平均数的距离大小。c)z分数可以表示 某一分数与平均数之差是标准差的几倍,即以标准差为单 位,该分数在平均数之上或之下几个单位之处。d)z分数 使原始分数具有了参照点和相等单位,即以0为参照点, 以1个标准差为单位。e)z分数的转化是一种线性转化, 即不改变原始分数中各个分数的固有关系。
(一)全距与百分位差
1 全距
又称两极差,用R表示。 计算过程中仅利用数据中的极端值,明显受取样变动的 影响。一种低效的差异量数,统计中不常用。
2 百分位差
1)何谓百分位差 百分位数(又称百分位点,指量尺上的一个点,在此点
以下数据分布中全部数据个数的一定百分比。)——百分 位差(指第10百分位数和第90百分位数之间的距离。)
平均数的距离大小。——平均差,是次数分布中 所有原始数据与平均数绝对离差的平均值。 2)公式表达 3)平均差的意义
能较好地反应次数分布的离散趋势;但绝对值的 求取不利于进一步统计分析,因此为低效差异量 数,实践中不常用。
(二)平均差、方差、标准差
2 方差与标准差
1)何谓方差、标准差 方差,也称变异数、均方,是每个数据与该组数
2)合并的方法
Z-r转换法(相关系数不是等距变量,不能直接相加 求平均数)
(三)等级相关
1、何谓等级相关 表示两列或多列等级变量的相关。 适用资料:a)计算相关的变量为等级变量;b)
总体不是正态分布的等距或等比变量;c)各变量 之间的关系一般为线性。 2、斯ห้องสมุดไป่ตู้尔曼等级相关 1)含义
表示两列变量的相关,积差相关的一种延伸和 变式(符合积差相关的基本概念),计算精度弱 于积差相关。
据平均数之差乘方后的均值,即离均差平房后的均 值。
标准差,是方差的平方根。 2)方差、标准差的计算
(二)平均差、方差、标准差
3)方差和标准差的性质 方差具有可加性和可分解性的特点,方差分析的
基本依据。 标准差和方差的基本特性:a)每一个观测值都
加上一个常数C,所得数据的标准差或方差等于原 标准差或方差;b)每一个观测值都乘上一个常数C, 所得数据的标准差等于原标准差乘以这个常数C, 所得数据的方差等于原方差乘以这个常数C的平方。 4)方差和标准差的意义
1)每个数与平均数之差的总和等于0; 2)每个数都加上一个常数C,所得平均数为原 平均数加上常数C; 3)每个数都乘以一个常数C,所得平均数为原 平均数乘以常数C。
4 平均数的意义
当观测次数无限增加时,其算术平均数趋进于 真值——因此,算术平均数是真值最好的估计 值;
(一)算术平均数
5 平均数的优缺点
• 1. 数据搜集:例如,调查与试验 • 2. 数据整理:例如,分组 • 3. 数据展示:例如, 图和表 • 4. 数据分析:例如,回归分析 • 统计的陷阱
二、统计方法的分类
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
1. 内容
¥
– 搜集数据
50
– 整理数据
– 展示数据
25
2. 目的
0
– 描述数据特征
1)优点 反应灵敏、计算严密、计算简单、简明易结、
可以进行进一步代数演算、受抽样变动影响小 2)缺点
易受极端数据影响、出现模糊数据时无法计算 平均数
(一)算术平均数
6 计算和应用平均数的原则 1)同质性原则 2)与个体数值相结合的原则 3)与标准差、方差相结合的原则
(二)中数和众数
1 中数
又称中位数、中点数、中值,表示为Md或 Mdn 注意:中数可能是一组数据中的某一个, 也可能不是。
• 比例量表 (ratio scale) 是具有绝对零点的等 距量表. 在比例量表中,乘除运算反映数量间的 比例关系。
3.据数据都是否具有连续性来划分
离散型数据(discrete variable) 由分离 的,不可分割的范畴组成。在邻近范畴之 间没有值存在。
连续型数据(continuous variable) 在任何 两个观测值之间都存在无限多个可能值。 连续型变量可以分割成无限多个组成部分。
课程名称:教育实验设计与数据分析
统计基本概念与描述统计
一、统计与统计学
• 1. 统计工作
– 收集数据的活动
• 2. 统计数据
▪ 对现象计量的结果
• 3. 统计学
– 分析数据的方法与技术
统计学是一门收集、整理和分析数据的方法科学 ,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识
a)可比性;b)可加性;c)明确性;d)稳定性。
(三)位置量数与标准分数
4 标准分数的应用
1)比较几个不同质的观测值在各自数据分布中的相 对位置
相对位置的两层含义
2)计算不几个同质的观测值的总和或平均数,表示 其在团体中的相对位置
3)表示标准测验分数
进一步的线性转化与非线性转化
4)异常值的取舍
三个标准差的原则
变量层次
名义变量 顺序变量 等距变量 比率变量
= or
数学关系
> or < + or -
or
• 命名量表(nominal scale) 由一系列具不同名 称的范畴所组成。命名量表的度量将观察所得标 定并分类, 但不会对观察所得作任何数量化的区 分(无大小之分) 。
--总体(population) :根据研究目的确定的 同质研究对象的全体(集合)。分有限总体与无 限总体
--样本(sample) : 从总体中随机抽取
的部分观察单位 --个体(individual ):观察总体的每个 基本单元
(四)次数、比率、频率与概率
--次数:某一事件在某一类别中出现的数 目
抽样造成的样本统计量和总体参数间的差异。 (不可避免,但有一定的分布规律,可估计)
(六)参数与统计量(parameter and statistic)
--参数:总体的统计指标,如总体平均 数、标准差,是固定的常数。 --统计量:样本的统计指标,如样本平 均数、标准差,是参数附近波动的随机变 量。
总体
• 顺序量表(ordinal scale)由一系列按顺序排 列的范畴所组成。顺序量表的度量将观察所得按 其大小或数量排定秩次(rank)。
• 等距量表 (interval scale)由一系列按顺序排 列的范畴所组成,且每两个邻近范畴之间的距离 都是相等的。在等距量表中,加减运算反映数目 的大小差距. 但是,乘除运算没有任何意义。
推断统计
(利用样本信息和概率 论对总体的数量特征进
行估计和检验等)
总体内在的 数量规律性
统计学探索现象数量规律性的过程
三、心理教育统计的基础概念
(一)数据(data)类型 1、据观测方法与来源分 计数数据:计算个数的数据。 测量数据:借助与一定的测量工具或一定 的测量标准获得的数据。
2.据数据反映的测量水平划分
(二)中数和众数
2 众数 又称范数、密集数、通常数,表示为Mo
注意:众数可能是一组数据中某一个具体 的值,也可能不是。
(二)中数和众数
3 平均数、中数、众数的关系
1)基本关系: Mo=3Md2M
2)“最小平方”原理: 一组数据中,各个数与平均数之差的平方和最
小——平均数是运用最广泛的集中量数 3)总结
--比率:两个数值的比
--频率:某一时间发生的次数被总事件的 数目除
--概率:随机事件发生的可能性大小
(五)误差
误差(error):实际观察值与客观真实值 之差。
--系统误差( systematic error):在实际观测过程 中,由受试对象、研究者、仪器设备、研究方法、非 实验因素影响等原因造成的有一定倾向性或规律性的 误差。
又称积矩相关。 计算积差相关系数的条件:
2、计算公式
1)定义公式 2)协方差公式 3)运算公式 4)差法公式 5)相关表法
(二)积差相关
3、相关系数的合并 1)相关系数合并的条件
样本具有同质性(各样本接近,研究的两变量相同, 使用的测量工具相同),如一个研究者先后多次调研结 果,源于不同研究者的研究结果,合成科研协作时不同 地区的取样信息,测验中效度或信度的估计等。
– 找出数据的基本规律
Q1 Q2 Q3 Q4
x = 30 s2 = 105
推断统计
1. 内容
总体
▪ 参数估计
▪ 假设检验
2. 目的