当前位置:
文档之家› 多元统计分析及R语言建模(第五版)课件第一二章
多元统计分析及R语言建模(第五版)课件第一二章
注意: apply(B,2,function(x,a) x*a,a=2)与B*2效果相 同,此处旨在说明如何 应用 apply函数。
2 多元数据的数学表达及R使用
数据框(data frame)是一种矩阵形式的数据,但数据框中各列可以是不同类型的数据。 数据框录入限制条件
数 据 框
在数据框中 以变量形式 出现的向量 长度必须一 致,矩阵结 构必须有一 样的行数。
2 多元数据的数学表达及R使用
#矩阵按列求和 apply(A,2,sum)
#矩阵按列求均值 aplly(A,2,mean)
#矩阵按列求方差 A=matrix(rnorm(100),20,5) aplly(A,2,var)
#矩阵按列求函数结果 B=matrix(1:12,3,4) apply(B,2,function(x,a) x*a, a=2)
#矩阵按行求和 rowSums(A)
#矩阵按行求均值 colSums(A)
#矩阵按列求和 colSums(A)
#矩阵按列求均值 colSums(A)
apply()函数
apply(X, MARGIN, FUN, ...)
#矩阵按行求和 apply(A,1,sum)
#矩阵按行求均值 apply(A,1,mean)
命令结果窗口
R里面有什么?
Packages (每个都有大量数据和可以读写修 改的函数/程序)
base boot class cluster ctest eda foreign grid KernSmooth lattice lqs MASS methods mgcv
The R base package Bootstrap R (S-Plus) Functions (Canty) Functions for classification Functions for clustering (by Rousseeuw et al.) Classical Tests Exploratory Data Analysis Read data stored by Minitab, SAS, SPSS, ... The Grid Graphics Package Functions for kernel smoothing for Wand & Jones (1995) Lattice Graphics Resistant Regression and Covariance Estimation Main Library of Venables and Ripley's MASS Formal Methods and Classes Multiple smoothing parameter estimation and GAMs by GCV
#本例性别、风险、专兼职、职业、教育和结果 为定性变量,年龄是定量变量,有时为了分析问 题方便,也可将其定量化,例如
年龄(age):19岁以下(1);20至29岁(2); 30 至39岁(3);40至49岁(4);50至59岁 (5);60岁 及以上(6);缺失(*)。
性别(sex): 男(1),女(2)。 风险(risk):有(1);无(2)。 专兼职(post):专职(1);业余(2)。 职业(career):干部(1);管理(2);3科教
内 数学表达、数据矩阵及R表示、数据的R语言表示、R调用多元的数据和
容 多元的数据的简单R语言分析。 与
要
求
要求学生熟练如何收集和整理多元统计分析资料、数据的数学表
达、掌握多元数据的数字特征的解析表达式、数字特征的基本性质。数据下,求样本均值、样本离差阵、样本协差阵等。
板
read.table("clipbo ard",header=T)
S-PLUS
■操作简单 ■无须编程 ■方便的数据接口 ■灵活的功能模块组合
■操作界面简单 ■全面的统计模型和分析手段 ■很强的图形处理能力 ■兼容性极好
3 多元数据直观表示及R使用
2
完整的 数值计 算软件
MATLAB
■数值分析 ■数值和符号计算 ■工程与科学绘图 ■控制系统的设计与仿真 ■数字图像处理技术 ■数字信号处理技术 ■通讯系统设计与仿 ■财务与金融工程
Survival analysis, including penalised likelihood. Interface to Tcl/Tk
Tools for Package Development and Administration Time series functions
所有这些Packages都是在base package上添加的
modreg mva nlme nls nnet rpart spatial splines
survival tcltk tools ts
Packages (继续)
Modern Regression: Smoothing and Local Methods
Classical Multivariate Analysis Linear and nonlinear mixed effects models Nonlinear regression Feed-forward neural networks and multinomial log-linear models Recursive partitioning functions for kriging and point pattern analysis Regression Spline Functions and Classes stepfun Step Functions, including Empirical Distributions
• Base包含所有固有的应用和数据 • 而其他的packages包含各统计学家自己发展
的方法和数据。 • 希望你是下一个加盟这些packages的作者之
一。☺
多元统计分析及R语言建模
第2章 多元数据的数学表达及R使用
多元统计分析及R语言建模
多元统计分析及R语言建模
多元数据的基本格式,如何收集和整理多元统计分析资料、数据的
1 多元统计分析概述
多
元 统
4 简化系统结构,探讨 系统内核
3 进行数值分类,构 造分类模式
计 分
2 构造预测模型,进 行预报控制
析
1 变量之间相依性 分析
的
用
途
综决
合 考 虑 。
实 际 问 题 , 需 要 对 问 题 进 行
如
何 选 择 适 当 的 方 法 来 解
1 多元统计分析概述
多1
元2 统
多元统计分析及R语言建模
第1章 多元统计分析概述
- 1-
课程安排
1、在基本统计方法学习的基础上,深入学习 多元统计分析模型及模型实现、分析方法。
2、该门课程每周2.5课时,理论与上机结合。
• 期末考核: 总成绩=平时(20%)+上机(20%)+期末考试(60%)
• 考试方式 平时(20):课堂(40%)+出勤(60%) 上机(20):两次实验报告,一次50% 期末考试:闭卷
2
学习资料
教学教材: 王斌会编著《多元统计分析及R语言建模》
2016.1(第4版)暨南大学出版社
扩充资料: [1]王斌会编著《数据统计分析及R语言编程》
2017.6(第2版) 北京大学出版社,暨南大学出版社
3
多元统计分析及R语言建模
多元统计分析及R语言建模
多元分析基本内容,以及本课程的主要安排。相关的补充
计3
分 析
4
的5
内6 容
7
多元数据的数学表示 多元数据的直观分析 多元线性相关分析 多元线性回归分析 广义和一般线性模型 判别分析 聚类分析
8
主成分分析
9
因子分析
10
对应分析
11
典型相关分析
12
多维标度法
13
综合评价法
1 多元统计分析概述
SAS
SPSS
1
强大的 统计分 析软件
■著名统计分析软件 ■组合软件系统 ■入门比较困难
内 容
知识和将要涉及的计算软件程序。
与
要
求
要求学生了解多元分析的基本内容及应用领域,并掌握
一些基本概念。对统计分析软件有一个基本认识。
1 多元统计分析概述
多 现实生活中,受多种指标共同作用和影响的现象大 元 量存在。 统 计 在经济生活中,受多种指标(随机变量)共同作用 分 和影响的现象大量存在。 析 的 多元统计分析是运用数理统计方法来研究解决多指 历 标问题的理论和方法。 史
2 多元数据的数学表达及R使用
2 多元数据的数学表达及R使用
【例2.1】为了了解股民的投资状况,研 究股民的股票投资特征,我们在2002年组 织统计系本科生进行小范围的“股民投资 状况抽样调查”。本次调查的抽样框主要 涉及广东省的6个城市(广州、深圳、珠 海、中山、佛山和东莞,其中,广州、深 圳各100份,其他城市各80份),共发放 问卷520份,回收有效问卷514份。问卷中 设计了18个问题。为了简化分析,本例只 考虑:年龄、性别、风险意识、是否专兼 职、职业状况、教育程度和投资结果共7 个变量进行分析。
#创建按照行排列的矩阵 matrix(x1,nrow=3,ncol=4,byrow=T)
2 多元数据的数学表达及R使用
#创建两个相同的矩阵 A=B=matrix(1:12,nrow=3,ncol=4)
#矩阵加法 A+B
#矩阵转置 t(A)
#矩阵加法 A+B
2 多元数据的数学表达及R使用
#矩阵相乘 A=matrix(1:12,nrow=3,ncol=4) B=matrix(1:12,nrow=4,ncol=3) A%in%B