当前位置:文档之家› 多元统计分析方法与应用练习册

多元统计分析方法与应用练习册

练习册多元统计分析方法与应用南京财经大学第一章绪论一、填空题1.多元分析研究的是______________的统计总体。

2.多元统计中常用的统计量有:________、_________、__________和__________。

3.协方差和相关系数仅仅是变量间__________的一种度量,并不能刻画变量间可能存在的_____________。

二、简答题1.简述多元统计分析的作用。

2.简述矩阵A的特征根与特征向量的求法。

第二章多元线性回归一、填空题1.人们通过各种实践,发现变量之间的相互关系可以分成______________和____________两种类型。

2.总离差平方和可以分解为___________和__________两个部分,各自的自由度为________和________,其中_________在总离差平方和中所占比重越大,则线性回归效果越显著。

3.回归方程显著性检验时通常采用的统计量是_____________。

4.偏相关系数是指多元回归分析中,_______________________的相关系数。

5.最优回归方程是__________________________的回归方程。

6.偏回归平方和是指__________________________数值。

7.Spss中回归方程的建模方法有_________、__________、____________、_____________等。

二、简答题1.简述复相关系数与偏相关系数。

2.简述逐步回归分析方法的具体实施步骤。

三、计算题1.现收集了92组合金钢中的碳含量x 及强度y ,且求得:03.29415126.263019.07989.45,1255.0=====yy xy xx L L L y x(1)求y 关于x 的一元线性回归方程; (2)求y 与x 的相关系数;(3)列出对方程作显著性检验的方差分析表(4)在x=0.1时,求yˆ的点估计及置信度为0.95的置信区间 (5)在x=0.1时,求y 的概率为0.95的精确预测区间与近似预测区间。

四、SPSS 操作题1.下面列出在不同重量下弹簧的长度:(1)在直角坐标系下作散点图,并判断Y 关于X 的相关关系是否线性;(2)求出Y 关于X 的一元线性回归方程;(3)对所求得的回归方程作显著性检验,列出方差分析表; (4)求出Y 与X 间的相关系数;(5)在X=16时,求Y 的概率为0.95的预测区间。

2.在某化工产品的生产中,影响产品收率y 主要变量是反应时间x1的反应温度x2,为提高收率希望找出y 关于x1,x2的回归方程,现通过试验获得如下数据:(1)求Y关于X1、X2的线性回归方程;(2)对所求得的方程作显著性检验,在α=0.05时你的结论是什么?(3)对各回归系数作显著性检验。

(α=0.05)(4)对回归方程的残差进行正态性、独立性、随机性及奇异值检验。

(5)回归方程的回归平方和、残差平方和各为多少。

(6)求回归方程的复相关系数,并对拟合优度进行检验,若消除自变量个数及样本个数对回归方程的影响,拟合优度宜采用哪个指标,其值为多少。

(7)在排除其它因素的影响后,自变量X1与因变量Y之间的相关程度是多少。

(8)当排除其它因素对X2的影响后,X2进入回归方程,R2增加了多少?(9)X1、X2与Y的简单相关系数分别是多少?3.某服装厂发现本厂的服装销售额与该厂所在城市的服装销售总额及人均衣着用品的支出额关系密切。

现有26期的原始数据如下:(1)以服装厂所在城市服装销售总额为自变量X1,以人均衣着用品支出额为自变量X2,该厂服装销售额为因变量Y建立二元线性回归方程。

(2)若了解到明年本城市服装销售总额X1为2700万元,X2将是128元,试求明年该厂服装销售额的预测值及预测区间(α=0.05)(3)对回归方程的显著性作检验;(4)对每一个回归系数的显著性作检验;(5)求出回归方程的复相关系数;(6)对回归方程的残差作奇异值检验4.在经济流通领域中,某公司的年销售额Y与个人可支配收入X1,价格X2,研究与发展费X3,广告费X4等项有关。

(数据见光盘中“习题数据库”中204.sav文件)(1)试根据资料用逐步回归的方法建立线性回归方程。

(引入变量、剔除变量的临界值为1.5)(2)变量进入回归模型的顺序是什么,哪些变量未进入方程。

(3)最终方程的拟合优度如何,请评价之。

5.某地区大春粮食产量y和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据见光盘中“习题库数据”205.sav文件,试用逐步回归分析,寻求大春粮食产量的预报模型(选取引入和剔除检验临界值为2.5)。

6.某种水泥在凝固时放出的热量y(卡/克)与水泥中四中化学成分有关,现测得13组数据,见光盘中“习题库数据”206.sav文件,(1)用逐步回归法建立线性回归方程(检验临界值为4)(2)对自变量X4的状态进行说明。

第三章主成分分析一、填空题1.主成分分析是通过适当的变量替换,使新变量成为原变量的___________,并寻求_________的一种方法。

2.主成分分析的基本思想是______________。

3.主成分的协方差矩阵为_________矩阵。

4.主成分表达式的系数向量是_______________的特征向量。

5.原始变量协方差矩阵的特征根的统计含义是________________。

6.原始数据经过标准化处理,转化为均值为____,方差为____的标准值,且其________矩阵与相关系数矩阵相等。

7.因子载荷量的统计含义是_____________________________。

8.样本主成分的总方差等于_____________。

9.变量按相关程度为,在__________程度下,主成分分析的效果较好。

10.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________________。

11.SPSS中主成分分析采用______________命令过程。

二、 简答题1.简述主成分的概念及几何意义。

2.简述量纲对主成分分析的影响及消除方法。

3.列举样本主成分的性质。

4.提取样本主成分的原则。

5.简述主成分分析的适用范围及基本步骤。

6.思考主成分分析法的应用。

三、 计算题1.设三个变量(x1,x2,x3)的样本协方差矩阵为:2121002222222<<-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡r s rs r s s rs r s s试求主成分及每个主成分的方差贡献率。

2.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:(1) 解释6个主成分的实际意义。

(2) 计算前三个主成分各自的贡献率和累积贡献率。

(3) 对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。

3.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4)。

这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:)7930.0,5513.0,2519.0,0612.0(007.0)1624.0,5589.0,7733.0,2516.0(049.0)0824.0,2695.0,0984.0,9544.0(024.1)5814.0,5577.0,5735.0,1485.0(920.244332211--='=--='=-='=---='=U U U U λλλλ(1) 写出四个主成分,计算它们的贡献率。

(2) 计算四个变量在前两个主成分上的载荷,由因子载荷矩阵,你认为这两个主成分应该如何解释?你能给它们分别起个名字吗? (3) 根据原始数据和(1)中的结果,可以计算出20株杨树叶的第一、二主成分得分,试以这两个主成分y1和y2为坐标,在(y1,y2)平面上按因子得分为坐标描出这20个样本点。

4.对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率,x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:)582.0,526.0,260.0,509.0,240.0(809.0)421.0,421.0,470.0,457.0,464.0(857.22211--='=='=U U λλ(1) 计算这两个主成分的方差贡献率。

(2) 能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。

四、SPSS操作题1.下面是8个学生两门课程的成绩表:(1)求出两个特征根及其对应的单位特征向量;(2)求出主成分,并写出表达式;(3)求出主成分的贡献率,并解释主成分的实际意义;(4)求出两个主成分的样本协方差矩阵;(5)第1个样本主成分与第2个变量样本之间的相关系数为多少(6)求出8个学生第一主成分得分并进行排序2.某中学十二名女生的身高x1,体重x2的数据如下:(1)两个变量的协方差矩阵与相关系数阵;(2)两个特征根及其对应的单位特征向量;(3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;(5)画出全部样本的主成分散点图。

3.根据下列某地区11年数据(1)计算地区总产值、存储量和总消费的相关系数矩阵。

(2)求特征根及其对应的特征向量。

(3)求出主成分及每个主成分的方差贡献率;(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。

第四章 因子分析一、填空题1.因子分析是把每个原始变量分解为两部分因素,一部分是______________,另一部分为_______________。

2.变量共同度是指因子载荷矩阵中_______________________。

3.公共因子方差与特殊因子方差之和为_______。

二、简答题1.比较因子分析和主成分分析模型的关系,说明它们的相似和不同之处。

2.能否将因子旋转的技术用于主成分分析,使主成分有更鲜明的实际背景。

三、计算题1.已知x=(x1,x2,x3,x4,x5)`的样本相关系数矩阵R 为⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=1934.0882.0522.0725.01720.0886.0902.01642.0451.01810.01R 试用主对角线外每一行的最大值来估计约化相关系数矩阵R*的主对角线上的相应元素,并近似地计算出因子载荷矩阵A 的第一列元素。

2.设变量x1,x2和x3已标准化,其样本相关系数矩阵为:⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=135.045.035.0163.045.063.01R (1) 对变量进行因子分析。

相关主题