统计学名词解释超级大全第一章导论统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。
描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。
推断统计:又称抽样统计。
它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。
换言之,就是根据已知的情况推测未知情况。
实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。
统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。
这种样本特性保持着总体特性的现象叫做统计常态法则。
小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。
此处“小数”是指小数量的意思。
大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。
有效数字:指能影响测量准确性的数字。
变量:又称随机变量。
具有变异性的数据。
三个特性,离散型,变异性,规律性。
数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。
即数据。
总体:性质相同的一类事物的全体。
个体:构成总体的每一基本单位或单元。
样本:总体抽出的部分个体。
参数:表示总体特征的量数。
统计量:直接从样本计算出的量数,代表样本的特征。
名称变量:指一事物与其他事物在属性、类别上不同。
顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。
既无相等的单位又无绝对的零点的变量。
等距变量:只具有相等的单位,而没有绝对的零点的变量。
比率变量:既有相等的单位,又有绝对的零点的变量。
连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。
离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。
计数数据:计算人或物的个数所获得的数据。
度量数据:用一定的测量工具或测量标准测量时所获得的数据。
指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。
标志:指统计总体中各个个体共同具有的属性和特征,它是说明个体属性和特征的名称。
绝对数:用来表明在一定时间、地点条件下某种教育、心理现象的总体规模和发展水平的统计指标,又称总量指标。
相对数:指教育与心理现象中两个单位相同的相互联系的指标数值的比率。
品质标志:是表明个体属性特征的,不能用数量说明,只能用文字说明。
数量标志:是表明个体数量特征的标志,是用数值表示的。
第二章数据的搜集、整理与表达次数:某一事件在某一类别中出现的数目,又叫频数,用f表示。
频率:指每一组的数据个数除以数据的总和,又称相对次数。
用符号p表示。
百分频率:频率与百分数的乘积。
组中值:每一组的中点值,常用m或X c表示。
全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。
组距:指每一组所包含的间隔或数据单位,用i表示。
组限:指每一组的起止点或每一组的界限。
统计表:以表格的形式表达统计资料数量关系的方式或工具。
统计图:以几何图形和形象图形表示统计资料数量关系的工具。
次数分布累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最高组开始逐级累加直至最低组,用符号cum﹒f或F表示。
累积百分频率:各组累计次数与总次数的比值。
一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。
来源三个方面,教育与心理调查,教育与心理测量和教育与心理实验。
经常性资料:主要是日常工作中的记录和统计报表等。
直条图:用直条(或矩形)的长短表示统计数据多少的图形。
直方图:以矩形面积表示连续变量的统计图。
折线图:以纵轴的高度表示次数,并将各点用线段连接的统计图形。
散点图:表示事物相互关系的图形。
圆形图:用圆的面积表示一组数据的整体,用扇形表示各组成部分所占比重或百分比的统计图。
枝叶图:把首位数字或首几位数字定位枝,其他位数定为叶的一种数字图。
第三章集中量数集中量数:一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。
集中趋势:在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势。
平均数:所有观测值(或变量值)的总和除以总个数所得的商。
中数:按一定顺序排列的一组数的中央位置的数值。
众数:一群数据中出现次数最多的那个数值,又称范数。
几何平均数:几个变量值乘积的n次方根。
调和平均数:指一群数据倒数的算术平均数的倒数,又称倒数平均数。
百分位数:任意百分位上的数值。
四分位数:1/4位置上的数值和3/4位置上的数值。
第四章差异量数离中趋势:差异量数:描述一组数据离中趋势的量数。
方差(S2/V/MS):一列数据离差平方的算术平均数。
一列数据平均差距地平方。
标准差(S/SD):方差的算术平方根。
一列数据的平均差距。
平均差(AD):离差绝对值的平均数。
全距(R g):最大值与最小值的差。
偏态量(SK/α3):三级中心动差。
峰态量(α4):四级中心动差。
百分位差:表示某两个百分位数之间差异程度的指标。
四分位差:是百分位差的特例。
用于分析P75与P25之差的一半。
统计动差:在统计学上,借用物理学中的动势(或动差)概念而称为统计动差。
中心动差:以平均数所在的位置为原点,以各组观测值与均数的差(X-X)为力臂,各组次数为作用力来计算动差。
这种以均数为原点计算的统计动差叫做中心动差。
第五章相对量数相对地位量数:就某一特质来描述个体在团体中所占的地位的量数。
相对差异量数:指差异量数与集中量数的百分比,又叫差异系数。
用符号CV表示。
标准差系数:标准差与平均数的百分比,用符号CV S表示。
百分等级:指把一组观测值先按高低次序排列起来,然后计算出某个个体的分数在百分位上超出多少人,或是在此分数下占多少百分比的一种量数,用符号P R表示标准分数:它有许多变形,其中最典型的标准分数为Z分数。
以标准差为单位所表示的“原始分数”与平均数的偏差,亦即原始分数与其平均数之差除以标准差所得的商。
第六章相关量数相关量数:分析或研究两个或两个以上变量之间相互关系的量数。
正相关:指一列变量由大到小或由小而大变化时,另一列变量亦由大而小或由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。
负相关:指一列变量由小到大或由大而小变化时,另一列变量却由小而大或由大而小的变化,即两列变量是反方向变化的,属“此增彼减”的关系。
零相关:又称无相关,指两列变量的变化看不出一定的趋势。
相关系数:表示相关方向和大小的一种数值。
用符号r表示。
直线相关:指两列变量中的一列变量在增加时,另一列变量随之而增加;或一列变量在增加,另一列变量却相应的减少,形成一种直线关系。
曲线相关:指两列相伴随变化的变量,未能形成直线关系。
简相关:指只有两个变量的相关。
复相关:指有三个或三个以上变量的相关。
积差相关:直线相关中最基本的方法。
利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积,再转换为标准积差后所求得的标准积差的平均数。
用符号r XY表示斯皮尔曼等级相关:根据两列变量的成对等级差数计算的相关系数,又称“等级差数法”,用符号r p或r s表示。
肯德尔W系数:用于描述多列等级变量相关程度或一致性程度的相关方法。
点二列相关:研究一列等距或比率变量与一列“二分”名称变量之间相关的统计方法。
r pb二列相关:研究一列正态的比率或等距变量和一列人为“二分”名称变量之间相互关系的统计方法。
用符号r b或r bis表示phi系数:专门研究两列“二分”变量之间相关的统计方法,衡量两个分类变量均分为两类时其关联程度的指标。
即Φ相关。
用符号rΦ或Φ表示。
第七章概率分布及其应用二项分布:二项试验结果的概率分布。
正态分布:就是中间量数次数分布多,两端量数次数分布少,呈对称型的概率分布。
又叫高斯分布。
t分布:由小样本统计量形成的概率分布。
频率:一种随机事件发生的次数与总试验次数的比值。
概率:随机事件在试验中发生可能的程度或可能性的大小,用P表示。
概率的统计定义是指通过频率来计算的概率;又称经验概率。
概率的古典定义是根据问题本身所具有的“对称性”特点直接计算事件的概率;又称先验概率。
中心极限定理:推断统计中最基本的理论与方法,用极限的方法所求得随机变量分布的一系列定理。
随机抽样:随机样本:指按照概率的规律抽取的样本,即随机样本所包含的研究对象不是由某个人或集体的意向所决定的,只能凭各研究对象相互独立的机会而定。
抽样误差:由于抽样的随机性所引起的样本统计量与总体参数之间的不同。
标准误:样本统计量分布的标准差或某统计量在抽样分布上的标准差。
用符号SE或σx表示。
自由度:在推断统计中,把一群数据或观测值可以独立自由变动的数目称为自由度。
df /n’确定性事件:指在一定条件下必然会发生或必然不会发生的事件。
分为必然事件和不可能事件。
必然事件:指在一定条件下必然会发生的事件。
不可能事件:指在一定条件下必然不会发生的事件。
随机事件:在一定条件下,可能发生,也可能不发生的事件。
模糊事件:指对象类属边界和性态不确定的事件。
第八章参数估计参数估计:根据样本统计量去估计相应总体的参数。
总体平均数估计:用样本的均数去估计总体的均数。
点估计:在参数估计中直接以样本的统计量作为总体参数的估计值。
区间估计:以统计量的区间值来估计相应总体。
置信系数:指被估计的总体参数落在置信区间内的概率D,或以1-α表示,又叫置信水平,置信度,可靠性系数,置信概率。
置信区间:指在特定的可靠性(即置信系数)要求下,估计总体参数所落得区间范围,亦即进行估计的全距。
置信限:被估计的总体参数所落区间的上、下界限。
推断统计:指由样本资料区推测相应总体情况的理论与方法,也就是部分推全体,由已知推未知的过程。
无偏估计量:用统计量估计总体参数必然存在一定误差,恰好相等的情形是极少见的,当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值,其偏差为0。
即∑(X-μ)=0。
这时的统计量被称为无偏估计量。
第九章参数检验假设检验:由于在进行差异检验时需要先对事物是否存在差异作出假设,然后再作统计检验,因此称为假设检验,又称差异的显著性检验。
α错误:指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使做出了拒绝虚无假设的结论,又称Ⅰ型错误。