当前位置:文档之家› 多元统计试题及答案

多元统计试题及答案

(1)对考察的河流和湖泊的水质情况做出定量的综合评价;
(2)根据观测数据对湖泊进行分类;
(3)确定各个地区的工业、矿业生产和农业生产对水质污染的影响程度。某湖区是著名旅游风景区,考察长假期间的水质污染程度是否与平常不同?
假设你是该考察团研究人员,你将如何利用统计方法研究以上几个问题?(16分)
解答:
⑹残差分析
残差分析的思想以及意义?残差分析的用途?残差分析要解决的问题?基本步骤是什么?
2判别分析:判别分析的优良性两方面考虑:(1)组与组之间的差别是否显著有无必要作判别分析(2)误判率
2.2因子分析
⑴.因子分析的基本思想?
因子分析是主成分分析的推广,它也是利用降维的思想,从研究原始变量相关矩阵内部结构出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多元统计分析方法,因子分析的基本思想是根据相关性大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低.每一组变量代表一个基本结构,用一个不可观测的综合变量表示,这个基本结构称为公共因子.对于所研究的问题就可用最少个数的不可观测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量.
解答:
⑴ 是 与 的协方差,也是两者的相关系数,它表示 依赖 的程度,反映了第i个变量 对第j个公共因子 的相对重要性。也就是变量与公共因子间的密切程度。
⑵变量共同度 ,它反映了全部公共因子对变量 的影响,是全部公共因子对 的方差贡献。若全部公共因子对 的方差贡献接近于1,则表明该变量的几乎全部原始信息都被选取的公共因子说明了。
从这个矩阵可以看出,G3,G8的相关性最大,因此将G3,G8在水平0.86上合成一个新类G9={3,5,6},计算G9与G7,G4,之间的最长距离,得到:
在第三个相关矩阵中将划去{3},{8}所对应的行和列,并加上新类G9={3,5,6}到其他类的距离作为新的一行一列,得到:
从这个矩阵可以看出,G9,G7的相关性最大,因此将G9,G7在水平0.84上合成一个新类G10={1,2,3,5,6},计算G10与G4之间的最长距离,得到:
基本步骤:
①对于每个自变量 ,拟合 个一元线性回归模型,若 ,则所选择含自变量 的回归模型为当前模型,否则,没有变量引入模型,选择过程结束,即认为所有自变量对y的影响均不显著
②在第一步的基础上,再将其余的 个自变量分别加入到此模型中,得到 二元回归方程,若 则将自变量 引入模型,进一步考察 引入模型后, 对y的影响是否仍然显著, ,则剔除 。
(1)综合考虑各方面的情况,确定两到三个投资地点(城市);
(2)利用公司以往的销售记录以及各销售地区的社会经济情况,对未来的产品生产和销售量做出预测;
(3)确定最佳广告策略。
假设你是该公司决策人员,你将如何利用统计方法研究以上几个问题?(16分)
解答:
因子得分
回归分析
因子得分
十、保护环境和水资源是可持续发展的基本前提。某研究院组成考察团,对我国主要河流和湖泊水环境进行了一次为期近三年的全面考察,收集了大量数据,接下来他们要做的部分工作是:
③从极大似然估计的角度考虑,可以采用赤池信息量准则(AIC准则)
准则4:赤池信息量达到最小
选择AIC值最小的回归方程为最优回归方程。
自变量的选择问题可以看成是应该采用全模型预还是选模型的问题
全模型正确误用选模型:全模型相应参数 为有偏估计,选模型预测也是有偏的。选模型的参数估计和预测残差以及均方差都有较小的方差。
如果 被接受,则表明y与 之间不存在线性关系,为了说明如何进行检验,我们要首先建立方差分析表.
在进行显著性的检验中,我们可以用F统计量来检验回归方程的显著性,也可以用P值法做检验.F统计量是:
当 为真时, ,给定显著性水平α,查F分布表得临界值 ,计算F的观测值,若 ,则接受 ,即认为在显著性水平α之下,认为y与 之间线性关系不显著.
解决的问题:
①研究的问题当中,随机变量的个数比较大,将增大计算量和分析问题的复杂性:
②随机变量之间存在着一定的相关性,它们的观测样本所反映的信息在一定的程度是存在着重叠的.
一般地,在约束条件 之下,使得 达到最大,由此 确定的 称为 的第i个主成分.
2.5主成分分析与因子分析的区别和联系???
1区别:
③在第二步的基础上,再将其余的 个自变量分别加入到此模型中,拟合各个模型并计算偏F统计量值,与 比较决定是否又新变量引入,如果有新的变量引入,还需要检验原模型中的老变量是否因为这个新变量的引入而不再显著,那样就应该被删除。
重复以上的步骤,直到没有新的变量能进入模型,同时在模型中的老变量都不能被剔除,则结束选择过程,最后,一个模型即为所求的最优回归模型。
⑶公共因子 的方差贡献 为因子载荷矩阵的第j列的各元素的平方和。,它是衡量公共因子相对重要性的指标, 越大,表明公共因子 对x的贡献越大。
选取方法:
⑴根据具体问题的专业知识来确定
⑵采用主成分分析中选取主成分个数的方法。
这个证明题目要考!!!!!!!!!!是原题考试啊!!!!
3.对变量 和 , ,…, 进行了 次观测,得数据为: ; ,
⑴主成分分析仅仅是一种数据变换,不假定数据阵有什么样的结构形式而因子分析假定数据阵有特定的模型,是其中的因子,满足特定的条件,当这些条件不满足时,因子分析就可能是虚假的.
1从拟合角度考虑,可以采用修正的复相关系数达到最大的准则。
准则1:修正的复相关系数 达到最大。因为:
从这个关系式容易看出, 达到最大时, 达到最小。
2从预测的角度考虑,可以采用预测平方和达到最小的准则以及 准则
准则2:预测平方和 达到最小
准则3:( 准则):定义 统计量为 要求选择 小,且 小的回归方程。
从而得到
最后在0.82的水平上,将G10,G4合为一个包含所有样品的大类.
最长距离的聚类谱系图为:
1
2
3
5
6
4
1 0.92 0.89 0.86 0.84 0.82
二、已知判别类 和 的Fisher线性判别函数为: ,
并且已知 , , , 。
用下列公式计算临界值: ,
并判别新样品 属于哪一类?(6分)
选模型正确误用全模型:全模型的参数估计和预测是有偏估计,而全模型预测值的方差和均方差大于选模型的相应方差。上述结论说明丢掉那些对因变量影响不大的,或虽有影响,但难于观测的自变量是有利的。
(6)逐步回归方法的基本思想与步骤
逐步回归的基本思想是有进有出,具体做法是将变量一个一个引入,引入变量的条件是通过了偏F统计量的检验,同时,每引入一个新变量后,对已入选方程的老变量进行检验,将经检验认为不显著的变量剔除,此过程经过若干步,直到既不能引入新变量,又不能剔出老变量为止。
多元统计试题(A卷)
一、设对六个样品 测试了六项指标,计算出样品间的相关系数
见下表: x1 x2 x3 x4 x5 x6
x2 0.92 1
x3 0.84 0.68 1
x4 0.79 0.77 0.81 1
x5 0.69 0.76 0.71 0.82 1
x6 0.65 0.78 0.86 0.74 0.89 1
试用最长距离法对这六个样品进行聚类,并画出谱系图。(10分)
解答:首先将6个样品的各自看成一类,即:
Gi=(i),i=1,2,3,4,5,6
将相关系数矩阵记为R0,则:
从这个矩阵可以看出,G1,G2的相关性最大,因此将G1,G2在水平0.92上合成一个新类G7={1,2},计算G7与G3,G4,G5,G6之间的最长距离,得到:
回归方程通过了显著性检验并不意味着每一个自变量 都对应变量 有显著的影响,可能其中的某个或某些自变量对应变量的影响并不显著,我们自然希望从回归方程中剔除那些对应变量影响并不显著的自变量,从而建立一个较为简单有效的回归方程,这就需要对每一个自变量进行考察.显然,若某个自变量对应变量无影响,那么在线性回归模型中,它的系数为零.那么我们就检验选取的自变量的影响是否显著等价于
⑵模糊聚类的基本步骤:
①选定一种计算距离或相似系数的公式距离矩阵或者相似系数矩阵(不一定是模糊矩阵)
②由观测数据矩阵计算样品间的距离 或者变量间的相似系数 ,形成距离矩阵 或者相似系数矩阵
③将距离矩阵或相似系数矩阵中的元素压缩到0与1之间,形成模糊矩阵
2.4主成分分析的基本思想可以做什么应用及在应用中要选几个主成分?
聚类分析制定评价标准
判别分析
聚类分析
因子得分
202简答题
2.1回归分析模型:
⑴回归方程的基本假定?
①回归函数的线性假设;②误差项的等方差假设;
③误差项的独立性假设;④误差项的正态分布的假设;⑤假定自变量之间线形无关.
⑵涉及到回归分析方程系数为何作显著性检验?
在进行显著性的检验中,我们可以用F统计量来检验回归方程的显著性,也可以用P值法做检验.
检验假设
根据 分布的定义,有 ,这里 ,对于给定的显著性水平,当 时,我们拒绝 ,反之就接受 ,在SPSS软件的输出结果中,可以直接从P值看出检验结果,那么我们拒绝的P值区间是多少呢?
⑶统计性的依据是什么?给出一个回归分析方程如何作显著性检验?
统计性的依据方差分析
对于多元线性回归作显著性检验就是要看自变量 从整体上对随机变量y是否有明显的影响,即检验假设
。对以上变量采用普通最小二乘法作线性回归,回归方程为 ,令 ; , ; ; ; ;
如果 , , ,
试证: 及 。
证明: 也就是:
下面只需要证明
由于 ,则第二项等于0
因为 ,则
2,证明
证明:
现在我们只需要证明:
即:
而,
所以, 原题目得到证明.
九、某实力雄厚的跨国公司日前在沪设立了办事处,经销该公司的产品。由于看好在华发展前景,该公司打算进一步扩大在华业务,在华直接生产和销售产品;并进行软件和高新技术产品的研发。为此,他们急需解决如下问题:
相关主题