统计学基础复习提纲复习内容:第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。
重点内容:第一章统计和数据(1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。
(3)统计中的基本概念:总体与样本;参数与统计量;变量。
第二章数据搜集(1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计(3)统计数据质量第四章数据分布特征的测度(1)集中趋势的测度:平均数;中位数和分位数;众数(2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数(3)偏态与峰态度量:偏态系数;峰态系数第五、六章参数估计与假设检验(1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。
(5)总体均值的检验:大样本检验方法;小样本检验方法。
第七章相关与回归分析(1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。
(2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。
(3)利用回归房产进行估计和预测第八章时间序列分析与预测(1)时间序列的分解和描述:图形描述;增长率分析(2)预测方法的选择和估计(3)平稳序列的预测:移动平均法;指数平滑法(4)趋势序列的预测:线性趋势预测;非线性趋势预测附:部分复习题 一、简答题1、封闭式问题答案的设计有哪些主要方法?2、设计问卷调查的提问项目时需要注意哪些问题3、什么是显著性水平?它对于假设检验决策的意义是什么?4、简述第Ⅰ类错误和第Ⅱ类错误及它们发生概率的大小关系5、简述判定系数的含义和作用6、简述相关关系的含义和特点。
二、计算题1、一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序如下:2 4 7 10 10 10 12 12 14 15(1)计算汽车销售量的众数、中位数和平均数 (2)计算销售量的标准差 解:(1)众数:010M = 中位数的位置=12n += 1012+=5.5,1010102e M +== 平均数:124101415969.61010nii xx n-=+++++====∑(2) 4.2s ====2、一家公司在招收职员时,首先要进行两项能力测试。
在A 测试中,其平均分数是100分,标准差是15分;在B 项测试中,其平均数是400分,标准分数是50分。
一位应试者在A 项测试中得了115分,在B 项测试中得了425分。
与平均分数相比,试判断该位应试者哪一项测试更为理想解:通过计算标准分数进行判断:_115100115A A A A x x z s --=== _1154000.550B B B B x x z s --=== 测试这在A 项测试中比平均分数高出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准分数高于B 项测试,所以A 项测试较理想。
3、 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间内选取了49名顾客组成一个简单随机样本(1)假定总体标准差是15元,求样本均值的抽样标准误差 (2)在95%的置信水平下求估计误差(注:0.052 1.96z =) .解:(1)已知15,49n σ==2.14xσ-=== (2)估计误差4.20E z α=== 4、从一个标准差为5的总体中采用重复抽样方式抽取一个样本量为40的样本,样本均值是25。
(1)样本均值的抽样误差xσ-等于多少?(2)在95%的置信水平下,估计误差是多少?(注:0.052 1.96z =)解:(1)已知5,40,n σ== 样本均值的抽样标准差为0.79xσ-=== (2)估计误差:1.55E z α===5.某一小麦品种的平均产量是5200kg/hm 2.一家研究机构对小麦的品种进行改良以提高产量。
为检验改良后的新品种产量是否显著提供,随机抽取了36个地块进行试种,得到了样本平均产量是5275 kg/hm 2,标准差为120 kg/hm 2。
取α=0.05,试检验改良后的新品种产量是否有明显提高。
(注0.05 1.645z =).解:属于单侧检验,而且属于右侧检验,提出假设如下01:5200:5200H H μμ≤> 计算统计量: 3.75z ==由于0.05 1.645z z >=,所以拒绝原假设,检验结构表明,改良后的新品种产量有显著提高。
6、一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差是5ml 。
为检验每罐容量是否符合要求,质检人员在每天生产的饮料中随机抽取了40罐进行检验,测得每罐的平均容量是255.8ml 。
取显著性水平α=0.05,检验该天生产的饮料容量是否符合标准要求。
(注:0.052 1.96z =)解:属于双侧检验,提出原假设和备择假设01:255:255H H μμ=≠ 计算统计量: 1.01z ==在显著性水平α=0.05的情况下:1.96z z α<=,所以不能拒绝原假设,即是没有证据表明该天生产的饮料不符合标准。
、7.一家大型银行欲了解贷款余额x 对不良贷款y 的影响,搜集了25家分行贷款余额和不良打款额的数据。
通过计算得到下面的有关结果方差分析表参数估计表(1) 完成上面的方差分析表格(2)写出估计的回归方程,并解释系数的实际意义 (3)检验线性关系的显著性(0.05α=)(2)^y0.829510.037895x=-+。
回归系数^1β=0.037895表示贷款余额每增加1个单位,不良贷款额平均增加0.037895个单位。
(3)Significant F=1.18349E-07<0.05α=,表明线性关系显著。
三、选择题1、统计学的研究方法有很多,其特有的方法是()。
A 统计推断法B 统计分组法C 大量观察法D 综合指标法2、对一批小麦种子进行发芽率试验,这时总体是()。
A 该批小麦种子B 该批小麦的发芽率C 该批小麦中发芽的种子D 该批小麦的发芽率3、抽样调查的主要目的是()。
A 了解总体的全面情况B 掌握总体的基本情况C 由样本指标推断总体指标D 由个别推断总体4、抽样调查所抽出的调查单位是()。
A 按随机原则抽选的B 按随意原则抽选的C 有意识抽选的D 典型单位5、社会经济统计中最常用、最重要的分布是()。
A 连续型变量分布B 离散型变量分布C 正态分布D 其他类型分布6、按变量的性质和数据的多少划分,变量数列可以分为()。
A 等距数列与异距数列B 单项数列和组距数列C 开口组数列和闭口组数列D 等差数列和等比数列7、下列平均数中不受资料中极端数值影响的是()。
A 算术平均数B 调和平均数C 几何平均数D 中位数和众数8、某企业在基期老职工占60%,在报告期准备招收一批青年工人,估计新职工所占比重将比基期增加20%,假定老职工和新职工工资水平不变,则全厂职工总平均工资将如何变化()。
A 降低B 不变C 提高D无法决断9、假定被研究现象基本上按不变的发展速度发展,为描述现象变动的趋势,借以进行预测,应拟合的方程是()A直线趋势方程 B曲线趋势方程C指数趋势方程 D二次曲线方程10、若动态数列的二级增长量大体相等,宜拟合( )A 直线趋势方程B 曲线趋势方程C 指数趋势方程D 二次曲线方程 11、直线相关即( )A 线性相关B 非线性相关C 曲线相关D 正相关 12、多元相关关系即( )A 复杂相关关系B 三个或三个以上变量的相关关系C 三个变量的相关D 两个变量之间的相关关系 13、根据回归方程i ix y 10ˆˆˆββ+=( ) A 只能由变量i x 去预测变量i y B 只能由变量i y 去预测变量i x C 可以由变量i x 去预测变量i y ,也可以由变量i y 去预测变量i xD 能否相互预测,取决于变量i x 和变量i y 之间的因果关系14、下列现象的相关密切程度高的是( )。
A 某商店的职工人数与商品销售额之间的相关系数为0.87B 流通费用率与商业利润率之间的相关系数为-0.94C 商品销售额与商业利润率之间的相关系数为0.51D 商品销售额与流通费用率之间的相关系数为-0.81 15、计算估计标准误差的依据是( )。
A 因变量的数列B 因变量的总变差C 因变量的回归变差D 因变量的剩余变差 16、统计认识对象是( )。
A 社会经济现象的数量方面B 社会经济现象的质量方面C 社会经济现象的数量方面和质量方面D 社会经济现象的所有方面 17、统计所研究的是( )。
A 社会经济的总体现象B 社会经济的个体现象C 社会经济的总体现象或个体现象D 非社会经济的总体现象 18、对某地工业企业职工进行调查,调查对象是( )。
A 各工业企业B 每一个工业企业C 各工业企业全体职工D 每位工业企业职工 19、在统计调查中,报告单位是( )。
A 调查项目的承担者B 构成调查对象的每一个单位C 提交调查资料的单位D 构成总体的每一个单位 20、对某班学生进行以下分组,这是( )。
A 简单分组B 平行分组体系C 复合分组D 复合分组体系 21、分布数列是说明( )A 总体单位总数在各组的分配情况B 总体标志总量在各组的分配情况C 分组的组限D 各组的分配规律 22、若以我国工业企业为研究对象,则单位总量指标为( )。
A 工业企业总数B 工业职工总人数C 工业设备台数D 工业增加值 23、下列表述正确的是( )。
A 单位总量与标志总量无关B 单位总量和标志总量是相对的C 某一总量指标在某一总体中是单位总量指标,则在另一总体中也一定是单位总量指标D 某一总量指标在某一总体中是标志总量指标,则在另一总体中也一定是标志总量指标24、直线趋势方程bx a y+=ˆ中,b a 和的意义是( ) A a 表示直线的截距,b 表示0=x 时的趋势值 B a 表示最初发展水平的趋势值,b 表示平均发展速度 C a 表示最初发展水平的趋势值,b 表示平均发展水平D a 是直线的截距,表示最初发展水平的趋势值;b 是直线的斜率,表示平均增长量 25、若动态数列的逐期增长量大体相等,宜拟合( )A 直线趋势方程B 曲线趋势方程C 指数趋势方程D 二次曲线方程26、自然界和人类社会中的诸多关系基本上可归纳为两种类型,这就是( )A 函数关系和相关关系B 因果关系和非因果关系C 随机关系和非随机关系D 简单关系和复杂关系 27、相关关系是指变量间的( )A 严格的函数关系B 简单关系和复杂关系C 严格的依存关系D 不严格的依存关系28、在因变量的总变差中,若回归变差所占比重大,而相应剩余变差所占比重小,则自变量与因变量( )。