当前位置:
文档之家› 用R软件做聚类分析的例子.ppt
用R软件做聚类分析的例子.ppt
练才可以进入。
应用统计分析—— R软件实现
R软件:免费的,志愿者管理的软件。
编程方便,语言灵活,图形功能强大
有不断加入的各个方向统计学家编写的统计软件包。 也可以自己加入自己算法的软件包.
这是发展最快的软件,受到世界上统计师生的欢迎。 是用户量增加最快的统计软件。
对于一般非统计工作者来说,主要问题是它没有 “傻瓜化”。
5. 查看帮助 help(round) ?abs
应用统计分析—— R软件实现
向量
1. 向量的赋值(一维数组, 下标从1开始) a=c(d1,d2,d3,…)
间隔为1的等差序列: a:b
指定间隔的等差序列: seq(from,to,by)
seq(length, from, by)
重复序列:
rep(vec, times)
c=1:12; a=matrix(c, nrow=2,ncol=6) dim(c)=c(3,4)
b=as.vector(c)
A=diag(c(1,4,5)) #以向量为对角元生成对角矩阵
MATLAB:这也是应用于各个领域的以编程为主的 软件,在工程上应用广泛。但是统计方法不多。
应用统计分析—— R软件实现
R的历史
S语言在1980年代后期在AT&T实验室开发.
R 项目由Auckland 大学统计系的Robert Gentleman和Ross Ihaka于1995年开始的.
它很快得到广泛用户的欢迎. 目前它是由R核心发展 团队维持;它是一个由志愿者组成的工作努力的国际 团队
应用统计分析—— R软件实现
Minitab:这个软件是很方便的功能强大而又齐全的 软件,也已经“傻瓜化”,在我国用的不如SPSS 与SAS那么普遍。
Eviews:这是一个主要处理回归和时间序列的软件。
GAUSS:这是一个很好用的统计软件,许多搞经 济的喜欢它。主要也是编程功能强大。目前在我国 使用的人不多。
应用统计分析—— R软件实现
应用统计分析实验 —— R软件
应用统计分析—— R软件实现
SPSS:这是一个很受欢迎的统计软件
容易操作, 输出漂亮, 功能齐全, 价格合理。 对于非统计工作者是很好的选择。
应用统计分析—— R软件实现
SAS:这是功能非常齐全的软件;
美国政府政策倾斜(“权威性”) 许多美国公司使用。 价格不菲,每年交费.即使赠送,条件苛刻 尽管现在已经尽量“傻瓜化”,仍然需要一定的训
应用统计分析—— R软件实现
下载R软件
学习网站 /pages/newhtm/r/schtml/
应用统计分析—— R软件实现
1 R软件的使用 2 数据描述性统计 3 回归分析 4 判别分析 5 聚类分析 6 主成分分析 7 因子分析
rep(vec,times,len,each)
随机向量 rnorm(10) #10个服从标准正态分布的随机数
a=c(3,5,8,10); b=1:10; c=seq(1,10,2); d=seq(-pi,pi, 0.2) e=rep(a,3); f=rep(a, 2, each=3)
应用统计分析—— R软件实现
A=matrix(1:10, 2,5) B=matrix(1:10,2,5,byrow=TRUE) #按行放置元素
[,1] [,2] [,3] [,4] [,5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10
[,1] [,2] [,3] [,4] [,5] [1,] 1 3 5 7 9 [2,] 2 4 6 8 10
#没有第2行、第1、3列的x.
应用统计分析—— R软件实现
2. 矩阵的维数问题
dim(A)
#获得维数,返回向量
nrow(A) ,ncol(A) #获得行数和列数
rownames(A), colnames(A) #访问各维名称
应用统计分析—— R软件实现
3. 向量和数组/矩阵的转化: 只要定义向量的维数即可 实现向量和数组转化
应用统计分析—— R软件实现
1.矩阵的元素访问
x=matrix(rnorm(24),4,6)
x[2,1]
#第[2,1]元素
x[c(2,1),]
#第2和第1行
x[,c(1,3)]
#第1和第3列
x[x[,1]>0,1]
#第1列大于0的元素
x[,-c(1,3)]
#没有第1、3列的x
x[-2,-c(1,3)]
应用统计分析—— R软件实现
一. R软件的使用
基本语法 向量 矩阵 list与data.frame 读写数据文件 控制语句与自定义函数
应用统计分析—— R软件实现
基本语法
1. 变量使用即定义: 变量名区分大小写, 也可用中文命名 变量赋值可采用4种形式:=,<-, ->, assign() 变量类型自动由变量赋值确定。
# 取出a中小于3的元素
a[6]=12
a=a[-c(1,3,5)] #去掉第1、3、5元素.
应用统计分析—— R软件实现
3.向量的长度 length(a)
应用统计分析—— R软件实现
矩阵(二维数组)
matrix(data=NA, nrow=1, ncol=1, byro的下标运算
a=1:5 (b=1:5) a[2]
a[c(2,4)]=c(4,8)
a[-5]
#同上,只不过显示出来 #取出a中第二个元素 #修改a中第2、4个元素分别为4、8 #扣除第5个元素取出来
a<3
#判断a中元素是否小于3
[1] TRUE TRUE FALSE FALSE FALSE
a[a<3]
2.注释符号 #
语句连接符 ;
a=10; b<-20; 30->c ; assign(“d”,40) 中国=“中华人民共和国” #生成字符串变量
应用统计分析—— R软件实现
3. 算术运算符: +,-,*,/,^(乘方),%% (模), %/% (整除)
4.常用的数学函数有:abs , sign , log , log2, log10 , sqrt , exp , sin , cos , tan , acos , asin, atan , cosh , sinh, tanh