遵义师范学院课程教学大纲应用多元统计分析教学大纲(试行)课程编号:280020 适用专业:统计学学时数:64 学分数: 2.5执笔人:黄建文审核人:系别:数学教研室:应用数学教研室编印日期:二〇一五年七月课程名称:应用多元统计分析课程编码:学分:2.5总学时:64课堂教学学时:16实践学时:48适用专业:统计学先修课程:高等数学、线性代数、概率论、数理统计一、课程的性质与目标:(一)该课程的性质应用多元统计分析是进行科学研究的一项重要工具,在自然科学,社会科学等领域方面有广泛的应用。
多元统计研究的是多个变量的统计总体,这使它能够一次性处理多个变量的庞杂数据,而不需要考虑异度量的问题,即它是处理多个变量的综合分析方法。
它可以把多个变量对一个或多个变量的作用程度大小线性地表示出来,反映事物多变量间的相互关系;可以消除多个变量的共线性,将高维空间的问题降至低维空间中,在尽量保存原始信息的前提下,消除重叠信息,简化变量间的关系;可以通过事物的表象,挖掘事物深层次的、不可直接观测到的属性即引起事物变化的本质;也可以透过繁杂事物的某些性质,将事物进行识别、归类。
(二)该课程的教学目标本课程的教学目的在于让学生熟练掌握多种多元统计方法的基本思想,数学原理的基础上,能够把大量的数据简化到人们能够处理的范围之内,能够构造一个综合指标代替原来的变量,能够进行判别和分类,能够对数学计算结果进行科学合理的解释,并从专业背景上给予分析;能将统计分析方法应用至实际中去,为避免繁冗的数学计算,本课程要求学生学会使用SPSS、Excel和SAS软件相关功能。
二、教学进程安排课外学习时数原则上按课堂教学时数1:1安排。
三、教学内容与要求第一章矩阵代数【教学目标】教学重点:矩阵的秩、特征值及特征向量、正定矩阵及非负定矩阵教学难点:矩阵的秩、正定矩阵及非负定矩阵、特征值的极值问题【教学内容和要求】教学内容:定义;矩阵的运算;行列式;矩阵的逆、秩;特征值、特征向量和矩阵的迹;特征值的极值问题。
教学要求:了解矩阵、向量的定义;掌握矩阵的运算;行列式;矩阵的逆;特征值及特征向量、正定矩阵及非负定矩阵;理解矩阵的秩以及特征值的极值问题。
【课外阅读资料】[1]张尧庭,方开泰著.多元统计分析引论. 科学出版社.1999.[2] Richard A.Johnson,Dean W.Wichern著;陆璇译. 实用多元统计分析.清华大学出版社. 2001【作业】 计算题1.设矩阵 ⎥⎦⎤⎢⎣⎡-=021201A ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=200010212B ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=242216C ,计算C BA +T . 2.已知矩阵⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=301111010A ,求1)(--A I 。
3.解矩阵方程⎥⎦⎤⎢⎣⎡-=⎥⎦⎤⎢⎣⎡02115321X . 4.解线性方程组 x x x x x x x x x x x 1234123413431242451-+-=--+=-+=-⎧⎨⎪⎩⎪证明题1.设B A ,均为对称矩阵,且BA AB =,试证:AB 是对称矩阵.2.设A ,B 是两个同阶矩阵,且A 是对称矩阵, T B B =-1,证明AB B 1-是对称矩阵.完成方式:独立 第二章 随机向量 【教学目标】教学重点:随机向量的分布函数、密度函数、独立性、数学期望、协方差矩阵、相关矩阵及其性质、欧氏距离和马氏距离教学难点:随机向量的期望向量、协方差矩阵、相关矩阵及其性质、欧氏距离和马氏距离【教学内容和要求】 教学内容:多元分布;数字特征;欧氏距离和马氏距离;随机向量的变换;特征函数。
教学要求:掌握多元分布的定义、欧氏距离的定义和计算。
【课外阅读资料】[1]张尧庭,方开泰著.多元统计分析引论. 科学出版社.1999.[2] Richard A.Johnson ,Dean W.Wichern 著;陆璇译. 实用多元统计分析.清华大学出版社. 2001【作业】1.试叙述多元联合分布和边际分布之间的关系。
2.设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
3.已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
完成方式:独立 第三章 多元正态分布 【教学目标】教学重点:非退化的多元正态分布;多元正态分布的性质;多元正态分布中一些参数的极大似然估计;估计量优劣性的评价准则;样本均值的抽样分布及Wishart 分布教学难点:复相关系数和偏相关系数;估计量优劣性的评价准则;样本均值的抽样分布及Wishart 分布【教学内容和要求】 内容:1.复习常见的一元随机变量的概论分布及其矩的计算和特征,给出P 维随机变量的定义,及其概率分布的统计特性的描述。
2.多元正态分布的定义和基本性质和参数估计 3.常用统计量:均值向量、协差阵、相关系数阵的计算 要求:学生搜集现象的多指标数据,简单验证大样本情况下绝大部分问题是可用多元正态分布来描述现象的特征的。
【课外阅读资料】[1]张尧庭,方开泰著.多元统计分析引论. 科学出版社.1999. [2] Richard A.Johnson ,Dean W.Wichern 著;陆璇译. 实用多元统计分析.清华大学出版社. 2001【作业】1.由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为 1ˆnii n ===∑μX X1ˆ()()ni ii n ='=--∑ΣX X X X 35650.0012.33ˆ17325.00152.50⎛⎫⎪ ⎪== ⎪ ⎪ ⎪⎝⎭μX 201588000.0038900.0083722500.00-736800.0038900.0013.06716710.00-35.80ˆ83722500.0016710.0036573750.00-199875.00-736800.00-35.800-199875.0016695.10⎛⎫⎪⎪= ⎪ ⎪⎪⎝⎭Σ2. 设(1)(2)()n X ,X ,...,X 是从多元正态分布~(,)p N X μΣ抽出的一个简单随机样本,试求S 的分布。
3.设()i i X n p ⨯是来自(,)p i i N μΣ的简单随机样本,1,2,3,,i k =,(1)已知2...k ====1μμμμ且2...k ====1ΣΣΣΣ,求μ和Σ的估计。
(2)已知2...k ====1ΣΣΣΣ求2,,...,,k 1μμμ和Σ的估计。
完成方式:独立第四章 多元正态总体的统计推断 【教学目标】教学难点:联合置信区间;WilksΛ统计量;简单、复及偏相关系数的推断 教学要求:了解Hotelling T 2统计量;理解并熟练掌握置信区域、联合置信区间;两个独立样本的情形、成对试验的情形;理解简单、复及偏相关系数的推断。
【教学内容和要求】内容:1.一元和多元假设检验的基本步骤2.Hostelling T2分布及均值向量一般检验,两正态总体和多正态总体均值向量的检验。
3.一个正态总体协差阵检验和多正态总体协差阵相等检验要求:1.了解几个常见的统计检验量服从的概率分布2.深刻理解样本统计量和根据显著性水平查表所得值之间的比较与最终接受或拒绝原假设之间的关系。
3.学生必需举例说明均值向量检验在实际经济研究中的应用和其已知与未知的意义和存在性分析,理解两总体及多总体均值向量检验的应用意义。
4.理解协方差阵检验的应用意义,特别要学会两个检验结合运用。
【课外阅读资料】[1]张尧庭,方开泰著.多元统计分析引论. 科学出版社.1999.[2] Richard A.Johnson,Dean W.Wichern著;陆璇译. 实用多元统计分析.清华大学出版社. 2001【作业】1.试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。
2.试述多元统计中霍特林分布和威尔克斯分布分别与一元统计中t分布和F分布的关系。
3.试述威尔克斯统计量在多元方差分析中的重要意义。
完成方式:独立第五章判别分析【教学目标】教学重点:两组和多组的距离判别、误判概率及估计;后验概率、广义平方距离、误判代价、两组和多组的Bayes判别;Fisher判别的基本思想、判别式;案例分析教学难点:两组和多组的距离判别、误判概率及估计;误判代价【教学内容和要求】内容:1.什么是判别分析,列举经济现象需要判别的问题2.距离判别法,距离判别法与假设检验的联系3.Fisher判别法,Fisher判别法与距离判别法的区别与联系,单总体和多总体的Fisher判别法判别函数的建立。
4.Bayes判别法,判别函数的建立5.逐步判别法,逐步判别法的基本步骤要求:1.理解判别分析的基本思想,以及探讨与假设检验,聚类分析的结合途径。
2.理解Fisher判别法,Bayes判别法相对距离判别法的特点。
3.弄清逐步判别法对指标和样本的处理,对指标是引入与删除还是转换与抽象综合?4.对原聚类分析小论文的结论用假设检验和判别分析再进行深入分析,修改论文。
【课外阅读资料】[1]张尧庭,方开泰著.多元统计分析引论. 科学出版社.1999.[2] Richard A.Johnson,Dean W.Wichern著;陆璇译. 实用多元统计分析.清华大学出版社. 2001【作业】1.简述欧几里得距离与马氏距离的区别和联系。
2. 试述判别分析的实质。
3. 简述距离判别法的基本思想和方法。
4.简述贝叶斯判别法的基本思想和方法。
、5. 简述费希尔判别法的基本思想和方法。
6. 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。
7.设有两个二元总体和,从中分别抽取样本计算得到,,假设,试用距离判别法建立判别函数和判别规则。
样品X=(6,0)’应属于哪个总体?8. 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。
下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。
⑴根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。
⑵现有一新品牌的饮料在该超市试销,其销售价格为 3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。
完成方式:独立第六章聚类分析【教学目标】教学重点:变量的测量尺度、Minkowski距离、相似系数;各种系统聚类法、系统聚类法的统一及性质、类的个数;动态聚类法的基本思想、k均值法;案例分析教学难点:相似系数;类的个数;k均值法【教学内容和要求】内容:1.分组和分类与聚类分析方法比较2.聚类标志的选择:距离和相似系数3.八种系统聚类方法4.谱系图的作法5.系统聚类法的基本性质,各方法之间的相互关系6.方法的选择与结论的分析7.聚类分析与假设检验的结合运用8.简介动态聚类法9.有序样本聚类法推荐要求:1.理解各种距离和相似系数的意义和其各种定义计算方法下表现出来的数量特征2.理解R型和Q型聚类的区别和联系3.深刻理解样本间距离计算与聚类时类间距离的规定之间的关系;掌握八种系统聚类法在实际应用中各自的特点和适应范围。