当前位置:文档之家› 统计学名词解释

统计学名词解释

一、名词解释总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团。

样本:从总体中取出来用作分析、研究的个体称样本。

随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本。

(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。

)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。

复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。

样本容量:样本中包含的单位数称为样本容量。

(样本中变量的个数。

)观察值:每一个体的某一性状测定值叫做观察值。

变数:若干有变异的观察值叫随机变数,简称变数。

连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数。

间断性变数:只能取整数的一类变数。

参数:由总体获得的代表总体的特征数。

(描述总体的特征数,如μσ 。

)统计数:由样本获得的代表样本的特征数。

(描述样本的特征数。

)数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。

计量资料、质量性状资料次数资料:凡是试验结果以次数表示的资料称为次数资料。

算术平均数、众数 几何平均数:变量对数的算术平均数的反对数,(lg )lg Y G n=∑ 调和平均数:变量倒数的算术平均数的反倒数,1()n H Y =∑中位数:将变量顺序排列,处在中间的变量称中位数,计作M d 。

极差:一组资料中最大值与最小值的差值为极差。

方差:变数变异程度的度量,对于总体()22i Y N μσ-=∑,对于样本22()1Y y s n -=-∑。

(描述变量平均变异程度的统计量。

定义为212()1n j j Y y s n =-=-∑。

) EMS :期望均方,是对均方MS 的期望值。

标准差:变数变异程度的度量,总体标准差:()N Y ∑-=2μσ,样本标准差:()12--=∑n y Y s 。

(变数的平均变异量。

)标准误:统计数变异度的度量,12y y y s s -==。

(统计数的标准差。

)乘积和:X 变数的离均差与Y 变数的离均差的乘积之和,()()SP X x Y y =--∑。

(1()()n i i X Y SP X x Y y XY n =--=-∑∑∑∑。

)平方和:离均差的平方和简称为平方和,定义为21()n j j SS Y y ==-∑。

(22()y Y y =-∑∑) 变异系数:变数的相对变异量。

100s CV y =⨯ 次数分布:由不同区间内变量出现的次数组成的分布。

次数分布图:根据变量的次数分布而绘制的图称为次数分布图,该图能直接的反应变量次数分布的情况。

样本单位:供作调查并从中得到一个观察值的由一个或多个个体组成的集团,它是一个统计单位。

样本配置:样本单位在调查区内的分布,是抽样方法研究的主要内容。

事件:把一次试验所有可能的结果称为事件。

互斥事件:如果事件A 1和A 2不能同时发生,即A 1A 2为不可能事件,则称事件A 1和A 2互斥。

对立事件:如果事件A 和事件A 1必发生其一,但不能同时发生,则称A 1为A 的对立事件。

(如果事件A 1和A 2必发生其一,但不能同时发生。

)随机事件:一次试验中可能发生也可能不发生的结果称为随机事件。

(在一定条件下,可能发生也可能不发生,可能这样发生,也可能那样发生的事件。

)随机抽样:保证总体中的每一个体,在每一次抽样中都有同等的概率被取为样本。

试验误差(Error ):试验中环境因素这样或那样的不一致而对处理产生的使观察值偏离真值的偶然效应,简称为误差。

(因非处理因素的偶然干扰和影响而造成的试验结果与真值的偏差。

)随机误差:在试验过程中,某些人所难以控制的偶然因素的影响造成的,由这类原因引起的误差为随机误差。

系统误差:是由于可以察觉或可以鉴别的原因造成的偏差,这类误差叫系统误差。

无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计。

如:y 是μ的无偏估计。

标准误:样本平均数分布的标准差,y σ=概率的统计定义小概率事件实际不可能性原理:若事件A 发生的概率较小,如小于0.05或0.01,则认为事件A 在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。

正态分布、标准正态分布t 分布、2χ分布、F 分布二项分布:每次独立抽取二项总体的n 个个体,则所得变量Y 将可能有01n ,,,,共n+1种。

这n+1种变量有它各自的概率而组成一个分布。

这个分布就叫二项分布。

两尾概率、一尾概率统计假设测验:根据某种实际需要,对未知或不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,作出在概率的意义上应当接受或否定哪种假设的测验。

统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。

显著性检验β错误(Ⅱ型错误,第二类错误):如果0H 是不真实的,我们通过测验却接受了它,即犯了一个接受不真实的0H 的错误。

这种错误就叫β错误。

(接受一个不真实假设时所犯的错误。

接受一个错误0H 时所犯的错误。

)α错误(Ⅰ型错误,第一类错误):否定真实假设的错误。

(否定正确的H 0所犯的错误。

) 无效假设:是对研究总体提出一个假想目标,所谓“无效”是指处理效应与假设值之间没有真实差异,试验结果所得的差异乃误差所致。

备择假设(Alternative hypothesis ):与无效假设相反,记作H A ;认为试验结果所得的差异是由总体参数不同引起的。

统计假设测验中,接受H 0,就否定H A ;接受H A ,就否定H 0。

参数估计:由样本统计数对总体参数做出点估计和区间估计。

两尾测验(Two-tailed test ):有两个否定区,分别位于分布的两尾的测验。

(否定区在两尾的测验。

)单尾测验(一尾检验,One-tailed test ):否定区位于分布的一尾的测验。

(只有一个否定区的假设测验。

)显著水平:否定无效假设H 0的概率标准。

Very significant :极显著。

若试验结果由误差造成的概率0.01ρ=<,则称样本统计数的差异为极显著。

否定区:否定无效假设H 0的区间。

接受区:接受无效假设H 0的区间。

置信区间:在一定概率保证下,估计总体平均数可能存在的范围。

(若使参数θ在[]12,L L 中的概率为1α-,即:{}121P L L θα≤≤=-,则区间[]12,L L 叫做参数θ的1α-的置信区间。

)置信度:总体平均数出现于置信区间的概率称为置信度。

(若使总体参数θ在区间[]12,L L 中的概率为1α-,即:{}121P L L θα≤≤=-,则称1α-为参数θ在区间[]12,L L 的置信概率和置信度。

)(保证一定区间能覆盖参数的概率。

)(06B )成对比较:如果两组样本的观察值可以根据某种联系而一一配对,则以之进行的两个样本平均数的比较称为成对比较。

非配对设计、配对设计、点估计、区间估计合并均方:将具有同质的均方合并。

21212kkSS SS SSsdf df df+++=+++。

适合性检验适合性测验:是测验中观察的实际次数和根据于某种理论或需要预期的理论次数是否相符合。

所作的假设是H0:相符;H A:不相符。

独立性检验次数资料的独立性测验:这是测验两个因素的列联次数彼此独立还是相关的一种测验试验因素(因素):将作为试验研究对象的因素称试验因素。

精确度:指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。

(重复同一试验各次试验结果之间相接近的程度;观察值之间的接近程度。

)边际效应:因边际环境条件引起的作物生长发育上的差异称边际效应。

因素水平(水平):将一个因素从质量方面和数量方面划分成的不同等级或状态。

水平:某一因素的不同数量或质量等级。

单因素试验:只研究一个因素的试验。

多因素试验:在一个试验中同时研究二个或两个以上的因素的试验叫多因素试验。

准确度:指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。

(是指试验结果与真值相接近的程度。

)真值:试验处理的真实效果。

试验方案:根据试验目的与要求所拟订的要进行比较的一组试验处理的总称。

试验小区(小区):一个处理在田间所占有的地段或地块。

全面试验:对所有可能的处理组合都进行试验的多因素试验,称全面试验。

部分试验:根据生物统计原理选取一部分处理组合进行的多因素试验,称部分试验。

综合试验:根据试验目的和以往经验只对少数特定处理组合进行试验的多因素试验,称综合试验。

田间试验:就是在田间进行的试验。

交互作用效应:不同因素的不同水平搭配组合在一起时还将产生一些额外的效应,这种效应称交互作用效应,简称互作。

唯一差异原则:在试验中进行比较的各个处理,除了被研究的因素(处理因素)具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上,即环境一致的条件下研究处理的效应。

(试验)处理:水平和水平的组合。

(在试验小区上所实施的试验措施。

)处理效应:试验处理对所研究的性状所起到的增进或减少的作用称为处理效应。

重复:试验中同一处理种植的小区数或种植次数称为重复。

局部控制:是分范围分地段地控制非处理因素,使非处理因素对各处理的影响趋向最大程度的一致。

生长竞争:不同处理的相邻小区之间的影响。

随机排列:在一个重复内,试验方案所规定的每个处理安排在哪一个小区上要排除主观因素的影响,采取随机的方式来确定。

小区技术:一个试验处理所占据小区的面积、形状和提供试验处理较为均匀的环境的一些措施。

统计控制:利用统计方法对试验因素进行控制。

试验指标、样本容量方差分析、多重比较交叉分组、系统分组主效应、简单效应、交互作用自由度:在统计上指独立变量的个数。

PLSD 0.05:显著水平达到0.05的最小显著差数。

同质性假定:方差分析的基本假定之一,k 个样本所估计的总体方差相等的假定。

正态性假定:方差分析的基本假定之一。

是要求观察值Y 的误差项e ~2(0,)e N σ。

)(x X i y =:矫正处理平均数,()()i X x i i y y be x x ==--矫正处理平均数:把各处理的i x 矫正为x 时的i y ,即消除X 对Y 影响后的个处理的i y 。

()()i X x i e i y y b x x ==--。

均积:两个变数的互变异数,11()()1n i i cov X x Y y n =---∑ 偏回归系数:在其它自变数皆保持在一定数量水平时,任一自变数对依变数的效应。

拉丁方试验:将k 个不同的处理排成k 行k 列,使得每个处理在每一行、列都仅出现一次的方阵,这种试验方法就叫拉丁方试验。

相关主题