当前位置:文档之家› R语言学习入门

R语言学习入门


R语言的应用
来源:Maftools,教程
11 / 27
准备好了吗?
掌握这个可能会影响你一生的技能
12 / 27
预备知识
了解学习的过程
学习的定义: 如果一个系统(机器、人等)能够通过执行某个过程改进它的性能,这 就是学习。 人的学习路径: 学习-实践-忘记-回顾。 通用的学习技巧和原理: 了解基本的概念是学习的第一步 基于你掌握的基本概念去比较、理解和学习有助于学习和理解新的概念 构建属于自己的知识框架来将零散的知识点进行整合将减少你的遗忘率 经过你深度思考和实践之后的知识印象最为深刻 如果你已经很久没有深度的思考过,请在这里停留一下:上面所列内容是否正确?是 否还有其他技巧和原理可以帮助你学习一项新事物?对于R语言的学习,这些技巧和 原理怎么应用? 扩展阅读: 娱乐至死,简单的逻辑学 13 / 27
R语言学习入门
Getting started with R language learning
李剑峰 2018/9/25
1 / 27
R语言
/R Language/
2 / 27
R语言的起源
R语言主要受S语言( 1976年John Chambers在贝尔实验室创建)和Scheme语言(20 世纪70年代在麻省理工学院AI实验室的Guy L. Steele和Gerald Jay Sussman创建)影 响发展而来,主要用户为统计学家和数据分析人员,常用于统计分析和图形可视化。 早期R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语 言编写的代码都可以不作任何修改的在R环境下运行。
预备知识
什么是知识库?
通俗一点的讲,知识库(knowledge base)是一种可以让你在短时间内找到解决某些 问题的工具和资源的集合。不管是个人,商业公司、政治团体或者国家主体都可以构 建属于他们自己的知识库。 比如,基于计算机技术和网络的互联网就是目前最大的一种知识库。基于历史的原 因,英语作为全世界使用范围最广的语言,其目前在互联网上的内容产出仍然占据主 导地位。典型的就是科学论文的发表大多以英语为载体第一时间发表(知名的如Web of science数据库,又常被人叫做SCI数据库)。 当然,随着中国互联网的迅猛发展,中文资料目前也在变得丰富。据统计,2017年中 国的网民人数已经达到7.5亿。有越来越多的以中文为载体的知识(包括R语言)在知 乎,简书、微信公众号以及个人博客和论坛(如,个人博客:Yihui,生信菜鸟团,我 的博客,论坛:统计之都,生信技能树)等知识共享平台上被发布。 你现在就可以试着去搜索互联网上与R语言相关的知识。 14 / 27
Ross Ihaka和Robert Gentleman
3 / 27
R语言的起源
版本号 alpha 0.49 .60 0.65.1 1.0 1.4 2.0 2.1 日期 1997.04 主要事件 由Ihaka和Gentleman主要开发的最后ቤተ መጻሕፍቲ ባይዱ个alpha版本的邮件列表 于1997年4月1日开始。
1997.04 发布目前CRAN上最早的源版本0.49。 1997.12 R成为GNU项目的官方部分。代码在CVS上托管和维护。 1999.10 update.packages和install.packages的第一个版本用于从CRAN下 载和安装软件包。
2000.02 其开发人员认为其稳定性足以供生产使用。 2001.12 引入了S4方法,Mac OS X的第一个版本很快就可以使用了。 2004-10 引入了延迟加载,可以以最小的系统内存开销快速加载数据。 2005-04 支持UTF-8编码,以及不同语言的国际化和本地化的开始。
R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发.[因两人名字 都是以R 开头 所以也因此形象称为R。] 4 / 27
R语言的应用
7 / 27
R语言的应用
来源:R : Graphics Tutorial Series ( Part 1 )
8 / 27
R语言的应用
来源:clusterProfiler,PDF
9 / 27
R语言的应用
来源:ECharts, ECharts2Shiny 扩展阅读: Tippmann S. Programming tools: Adventures with R[J]. Nature, 2015, 517(7532):109. 10 / 27
来源:Wiki百科
5 / 27
R语言的应用
R语言的主要应用方向:统计分析(如统计检验)和数学建模、数据可视化以及其他 (如数据收集与清洗、网页等交互式应用开发等)。 就统计分析和数学建模来看,R可与流行的商业统计软件包(如SAS,SPSS和Stata) 相媲美,而且是完全免费的。 特别地,因用户贡献的第三方软件包的增长,R的应用范围得到了极大的扩展,R语言 的用户数在近年来迅速增长。截至2018年8月,R在TIOBE指数中排名第18位。 CRAN:13095(2018.09.25) Bioconductor:2846(2018.09.25) GitHub、GitLab、Bitbucket等基于Git的软件仓库:未统计 其中Bioconductor主要存放与生命科学数据分析相关的R包,包括1562(Software)+ 921 (AnnotationData)+ 342 (ExperimentData)+ 21(Workflow) 如果你是统计学家、数学家、数据分析师、或者是科研人员,掌握R语言对你来说真 的是非常有价值的一件事情。 注:TIOBE指数用来衡量编程语言的流行程度。 6 / 27
R语言的起源
版本号 2.11 2.13 2.14 2.15 3.0 3.4 3.5 日期 2010-04 支持Windows 64位系统。 2011-04 添加一个新的编译器函数,允许通过将函数转换为字节代码来加 速函数。 主要事件
2011.10 为包添加了强制名称空间。添加了一个新的并行包。 2012.03 新的负载均衡功能。改进了长向量的序列化速度。 2013.04 支持64位系统上的数字索引值2的31次方或更大。 2017.04 函数的即时编译(JIT)和默认启用的字节码循环。 2018.04 默认情况下,包在安装时进行字节编译。紧凑的整数序列的内部 表示。添加了新的序列化格式以支持紧凑的内部表示。
相关主题