当前位置:文档之家› R语言编程基础-第二讲 数据类型

R语言编程基础-第二讲 数据类型

第二章 R中的数据
2.1 变量与常量 2.2 数据结构 2.3 标量的输入 2.4 向量的输入 习题
2 . 12 新数手据上结路构
第二章 R数语据言输入入门
2 . 12 新数手据上结路构
第二章 R数语据言输入入门
大数据应用人才培养系列教材
第二章 R中的数据
2.1 变量与常量 2.2 数据结构 2.3 标量的输入 2.4 向量的输入 习题
2 . 13 新标手量上的路输 入 (2)标量的计算 通过新变量保存计算结果。
第二章 R数语据言输入入门
R语言中变量名区分大小写,“.”号可以是变量名的一部分,命名规范 一般习惯性的令首字母大写,包含字母、数字、点“.”、下划线”_”等。
2 . 13 新标手量上的路输 入 (2)标量的计算 通过新变量保存计算结果。
R将实例标识符称为rownames(行名),将名义型和有序型 变量称为因子(响应变量、决策变量、类别变量)。
2 . 1 新变 手量 上与 路常 量
常量
R中定义了一些常量类型: NA:表示不可用 Inf: 无穷 -Inf: 负无穷 TRUE:真 FALSE:假
第二章 R数语据言输入入门
大数据应用人才培养系列教材
第二章 R数语据言输入入门
大数据应用人才培养系列教材
第二章 R中的数据
2.1 变量与常量 2.2 数据结构 2.3 标量的输入 2.4 向量的输入 习题
2 . 14 新向手量上的路输 入 (1)应用C函数连接数据
第二章 R数语据言输入入门
对于表2.1的数据,如果仅用标量 存储,需要32个变量名,显然这太过 于繁琐。
(2)类。一个object都应该能找到它所归属的某个类(class)。“类” 是抽象的概念,一个类至少有一个特征是这类数据所共有的。根据应 用需求、目的等不同可以定义不同的类。比如,做生物信息的可以定 义出DNA类、RNA类,为了高效处理这类数据,定义这些类是非常必 要的。所以,R里面有很多的“类”。
1
10/15/2009
2
11/01/2009
3
10/21/2009
4
10/28/2009
年龄 (Age)
25 34 28 52
糖尿病类型 (Diabetes)
Type1 Type2 Type1 Type1
病情 (Status)
Poor Improved Excellent Poor
2 . 1 新变 手量 上与 路常 量
第二章 R数语据言输入入门
(1)应用C函数连接数据 NA值的处理:运用一些函数初步计算向量的有关值
向量中如果有一个缺失值的话,默认选项 na.rm=FALSE会导致R函数sum返回NA(rm表 示移出) 采用sum(Head,na.rm = TRUE)即可计算出和。 na.rm=TRUE也可以应用到mean,min,max, median等函数中,一般可以用na.T替换 a.TRUE选项。 但是不推荐。另外有些内置函数的选项可是是 na.action而不是na.rm。
(3)类型。 类型是类的实例,我们不可能也没必要去了解所有的“类”,但R语 言定义的一些基本数据类型得需要我们了解,而且得较详细地了解。 这包括向量、因子、矩阵、列表、数据框和一些特殊的数据类型。

2 . 1 新变 手量 上与 路常 量
第二章 R数语据言输入入门
不同的行业对于下表1给出的数据(数据集)的行和列叫法不同。
大数据应用人才培养系列教材
第二章 R中的数据
2.1 变量与常量 2.2 数据结构 2.3 标量的输入 2.4 向量的输入 习题
2.1变量与常量
第二章 数据输入
R语言是面向对象的。面向对象的理论一两句话说不清楚,但对于 数据至少应该了解三个方面。
(1)R能处理的一切(包括数据、函数、公式、图表、包等)都称为 。
可以把对应的属性作为一个变量, 直接存储,如翼弦、踝骨、头、体重 分别用一个变量存储,由于一个变量 存储了多个数值,因此在这里我们称 之为向量。
2 . 14 新向手量上的路输 入
(1)应用C函数连接数据 向量的读取:
第二章 R数语据言输入入门
2 . 14 新向手量上的路输 入
第二章 R数语据言输入入门
第二章 R数语据言输入入门
从表中可以清楚地看到该数据中包含的元素的数据类型。其中, PatientID是行/实例标识符,AdmDate是日期型变量,Age是整 型变量,Diabetes是名义型变量,Status是有序型变量。
变量的类型包括数值型、字符型、逻辑型、复数型(虚数) 和字节。
在 表 中 , PatientID 、 AdmDate 和 Age 为 数 值 型 变 量 , 而 Diabetes和Status为字符型变量。Diabetes和Status分别是名义 型和有序型变量。
第二章 R数语据言输入入门
R语言中变量名区分大小写,“.”号可以是变量名的一部分,命名规范 一般习惯性的令首字母大写,包含字母、数字、点“.”、下划线”_”等。
2 . 13 新标手量上的路输 入 (2)标量的显示 变量值的显示: (1)直接输入变量的名称、回车
(2)在赋值时命令用圆括号括起来
(3)print()函数
2 . 13 新标手量上的路输 入 (1)简单的标量输入 标量,一个变量仅存一个值。
第二章 R数语据言输入入门
标量输入
标量输出
2 . 13 新标手量上的路输 入 (2)标量的计算 一个变量进行赋值后就可以对其进行计算。
第二章 R数语据言输入入门
运算过后的结果还能不能重复利 用?
不行,最好定义新的变量保存相 应的计算结果。
(1)应用C函数连接数据 向量的运算:运用一些函数初步计算向量的有关值
输入其他的数据:
2 . 14 新向手量上的路输 入
第二章 R数语据言输入入门
(1)应用C函数连接数据 NA值的处理:运用一些函数初步计算向量的有关值
因为NA参与了运算,因此造成计算错误。 ?sum
2 . 14 新向手量上的路输 入
统计学家称它们为观测(observation)和变量(variable),
数据库分析师则称其为记录(record)和字段(field),
数据挖掘/机器学习学科的研究者则把它们叫作示例(example)和
属性(attribute)。
在这里我们使用:

病编号
入院时间
(PatientID) (AdmDate)
相关主题