当前位置:文档之家› 高教院统计学期末考试题(2014-6-26)

高教院统计学期末考试题(2014-6-26)

统计学期末考试卷
考试时间:2014年6月25日
姓名:学号:专业:年级:
一、名词解释(每题2分)
1、统计学统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象
的本质,甚至预测对象未来的一门综合性科学。

其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。

2、误差测量值与真实值之间的差异称为误差,物理实验离不开对物理量的测量,
测量有直接的,也有间接的。

由于仪器、实验条件、环境等因素的限制,测量不可能无限精确,物理量的测量值与客观存在的真实值之间总会存在着一定的差异,这种差异就是测量误差。

误差是不可避免的,只能减小。

3、变量变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概
念。

变量可以通过变量名访问。

在指令式语言中,变量通常是可变的;但在纯函数式语言(如Haskell)中,变量可能是不可变(immutable)的。

在一些语言中,变量可能被明确为是能表示可变状态、具有存储空间的抽象(如在Java和Visual Basic中);
但另外一些语言可能使用其它概念(如C的对象)来指称这种抽象,而不严格地定义“变量”的准确外延。

4、标准差标准差(Standard Deviation),中文环境中又常称均方差,但不同
于均方误差(mean squared error,均方误差是各数据偏离真实值的距离平方的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示。

标准差是方差的算术平方根。

标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。

标准差能反映一个数据集的离散程度。

平均数相同的,标准差未必相同。

5、方差方差是总体所有变量值与其算术平均数偏差平方的平均值,它
表示了一组数据分布的离散程度的平均值。

方差(variance)是在概率论和统计方差衡量随机变量或一组数据是离散程度的度量。

概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。

统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。

在许多实际问题中,研究方差即偏离程度有着
重要意义。

6、t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如
n<30),总体标准差σ未知的正态分布资料。

是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。

t检验分为单总体检验和双总体检验。

t检验是戈斯特为了观测酿酒质量而发明的。

7、F检验(方差分析)
F检验又叫方差齐性检验。

在两样本t检验中要用到F检验。

从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。

若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。

其中要判断两总体方差是否相等,就可以用F检验。

简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。

F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S^2,以确定他们的精密度是否有显著性差异。

至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t检验。

8、X2检验x2检验亦称卡方检验。

统计学中假设检验的方式之一。

x是一个希腊字母,x2可读音为卡方,所以译为卡方检验。

卡方检验主要用于定类或定序变量的假设检验,在社会统计中应用非常广泛。

x2检验对于定类与定类或定类与定序变量之间的相关检验应用较多。

9、相关系数相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。

于是,著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation coefficient)。

相关系数是用以反映变量之间相关关系密切程度的统计指标。

相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。

依据相关现象之间的不同特征,其统计指标的名称有所不同。

如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。

10、概率概率,又称或然率、机会率、机率(几率)或可能性,是概率论的基本概念。

概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。

越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。

如某人有百分之多少的把握能通过这次考试,某件事发生的可能性是多少,这些都是概率的实例。

二、简答题(每题4分)
1、统计数据通常可以分成几类(举例说明)?
统计数据按不同的分类规则可分为不同的类型,这里主要按三种分类规则分类。

(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

分类数据是指只能归于某一类别的非数字型数据,比如性别中的男女就是分类数据。

顺序数据是只能归于某一有序类别的非数字型数据,比如产品的等级。

数值型数据是按数字尺度测量的观察值,它是自然或度量衡单位对事物进行测量的结果。

(2)按照统计数据的收集方法,可以将其分为观测数据(observational data)和实验数据(experimental data)。

观测数据是通过调查或观测而收集到的数据,它是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。

在实验中控制实验对象而收集到的数据则称为实验数据。

(3)按照被描述的对象与时间的关系,可以将统计数据分为截面数据和时间序列数据。

在相同或近似相同的时间点上收集到的数据称为截面数据(cross-sectional data)。

在不同时间上收集到的数据,称为时间序列数据(time series data)。

2、常用统计方法有那些?各自有什么特点?
t检验方差分析卡方检验回归
3、常用统计表格和统计图形有那些?
散点图、条形图、折线图、饼图
4、统计检验时得到的“P<0.05”或“P<0.01”反映了什么?
5、什么是标准分,如何计算标准分,其有何作用?
标准分是指通过原始分转化而得到的一种地位量数,它反映考生成绩在全体考生成绩中的位置。

因此,无论试题难或易,无论整体原始分偏高或偏低,整体标准分都没有什么变化。

根据教育统计学的原理,标准分Z是原始分与平均分的离差以标准差为单位的分数,用公式表示为:Z=(X-A)/S 其中:X为该次考试中考生个人所得的原始分;A为该次考试中全体考生的平均分;S为该次考试分数的标准差。

根据教育统计学的原理,原始分转换成标准分的意义可以从下面的比较中反映出来:
⑴单个标准分能够反映考生成绩在全体考生成绩中的位置,而单个原始分则不能。

⑵不同学科的原始分不可比,而不同学科的标准分是可比的。

⑶不同学科的原始分不可加,而不同学科的标准分之间具有可加性。

既然不同学科的原始分不可比,那么也就不可加。

多学科成绩,只有在各科成绩的平均值相同、标准差也相同的条件
下,才能相加,否则是不科学的。

各学科原始分的平均值以及标准差一般都不相同,而各学科的标准分的平均值以及
标准差都基本相同,因此,各科的标准分是可加的。

6、多元线性回归分析有什么作用?通常可以得到那些结果?这些结果的意
义何在?
在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。

事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。

因此多元线性回归比一元线性回归的实用意义更大。

多元线性回归分析
1、多元线性回归分析的基本思想及目的
多元线性回归分析:研究一个因变量与一组自变量的依存关系,
即,研究一组自变量是如何直接影响一个因变量
的。

其目的:
1分析原因变量对结局变量的作用大小;
2用已知的原因变量预测结果变量的变化;
3控制混杂因素,评价研究因素的独立效应
三、应用题(40分)
试对以下科研数据进行统计分析设计(计划)。

提出能够对那些指标进行那些统计分析,预期得到那些结果(在适合的情况下用表格或图表示结果)及结果的意义(解释或理解)。

四、论述题(16分)
试述你对统计方法意义和作用的认识以及在学习和应用统计方法过程中的体会和经验。

相关主题