使用R进行数据分析和绘图
实践环节 Practice
• 数据分析(data analysis) • 计算均值和标准误 • 字母法标记差异显著性 • 计算相关系数,检验显著性并生成列表 • 主成分分析
实践环节 Practice
• 绘图(plot) • 二因子条形图 • 单因子条形图 • 箱线图 • 折线图 • 热图+聚类图 • 复合图
常用高级操作 as.factor( ) 将数据类型转化为因子型 if(条件) {执行运算} if条件句 if(条件1){ } else if(不满足条件1满足条件2){ } for (i in 1:n) { } 循环语句 function (参数) {执行运算} 自定义函数
读取和导出数据 Load and export data
下载和安装 Download and installation
• 官网链接 • R: https:// • R Studio: https:// • Rstudio是一个友好的R操作平台。
了解RStudio操作界面Understanding RStudio operation interface
一般将外部文件转换成.txt文件或者.csv文件写入:
AB <- read.table(file = "~/Desktop/R/data1.txt", header = TRUE)
对象 函数名称 object function name
文件路径 filameters
常用基本操作符 = or <- 赋值 == 等于 != 不等于 <= 小于等于 >= 大于等于 + - * / 加减乘除 |或 &且 NA 缺失值
常见数据类型 num 数值型 int 整数型 str 字符型 factor 因子型 logi 逻辑型 vector 向量 matrix 矩阵 data.frame 数据框 list 列表 array 数组
代码编辑区
变量显示区
RStudio
代码运行与结果展示区
操 作 界 面
文件管理、绘图、package,帮助查询等
R中常见的概念 Common concepts in R
• 赋值和对象 • 数据类型 • 函数和参数 • 注释 • 脚本(script) • package
R常用基本函数 Common basic functions of R
自学和进一步了解R Self study and further understanding of R
• 《R语言初学者指南》
• 《R数据可视化手册CRAN网站下载package的参考手册 • 以ggplot2 package 为例
用R语言进行数据分析和绘图 Data analysis and plot using R
Liu Ce
Content
1
基本R语言操作 Basic R language operation
2
R数据分析实例 Data analysis using R for practice
3
R绘图实例 Plot using R for practice
点进去下载
如何自学R package? • 使用? Function_name来快速获得函数参数讲解:
在帮助一栏中可以获得函数用法,函数参数,使用细节 以及实例演示等信息(与r package参考手册中的内容 基本相同)。
THANK YOU
查看数据 View data
AB 查看数据AB的全部内容 head(AB) 查看数据AB的前几行 tail(AB) 查看数据AB的后几行 str(AB) 查看数据AB的属性 ncol(AB) 查看数据AB有几行 nrow(AB) 查看数据AB有几列 AB$r1 查看数据AB的r1列($符号后面跟的是列名) AB[,1] 查看数据集AB的第一列 AB[,-1] 查看数据集除了第一列之外的列 colnames(AB) 查看数据AB的所有列名
计算均值和标准误 Mean and standard error calculation
library(stringr)#加载package mean_se <- vector()#创建向量,用于存储数据 #自定义函数:计算标准误 func.se <- function(data){
n.t <- length(data)#data中有几个元素 n.na <- length(which(is.na(data)))#data中有几个缺失元素 n <- n.t - n.na#非缺失元素 sd <- sd(data,na.rm = TRUE)#计算标准差,忽略缺失值 se <- sd/sqrt(n)#标准误计算 return(se)#返回最终值 } #利用循环计算均值和标准误并使用±符号拼接 for (i in 1:nrow(AB)) { data.i <- as.numeric(AB[i,2:4])#将第2-4列的第i行转化为数值型 mean.i <- round(mean(data.i,na.rm = TRUE),3)#取均值,3位小数 se.i <- round(func.se(data.i),3)#计算标准误保留3位小数 mean_se[i] <- str_c(mean.i,se.i,sep = “±”) #将标准误用±拼接并赋值给mean_se }
AB2 <- read.csv(file = "~/Desktop/R/data1.csv",header = TRUE) write.csv <- (AB, file = “filename”, quote = FALSE)#导出文件
注意事项: 1. 数据文件中不能有空格; 2. 行与行或列与列之间的数据数量必须相等; 3. 区分大小写; 4. 文件路径最好写绝对路径; 5. 对象名内不能有空格,如有需要分隔用”_”代替。 6. 不同次运算最好赋值不同的变量名,避免之前的结果被覆盖。
常用基本操作函数
mean( );sd( ) 均值;标准差 [ ] [ , ] 取子集 head( ); tail( ) 取数据集的前几行和最后几行 str( ) 查看数据类型 cbind( ); rbind( ) 按列合并;按行合并 length( ) 查看向量中元素的个数 install.packages( ) 下载相关的packages library( ) 加载对应的packages which( ) 找出满足条件的元素所在位置 table( ) 统计每种元素个数 write.csv( )导出数据内容