当前位置:文档之家› SAS培训班讲义经典版

SAS培训班讲义经典版

38
SAS函数二(部分)




SAS系统存贮日期值为1960年1月1日到 指定日期之间的天数 SAS存贮时间值为从午夜开始到指定时间 的秒数 日期时间值存贮为1960年1月1日午夜到 指定日期时间之间的秒数 日期时间函数:weekday ( )、day()、 month()、qtr()、year()
27
SAS的变量及格式

变量属性(名称、类型、长度、输入格式、 输出格式、标签) 类型:数字型、字符串型 输入格式:数据被SAS读取的格式 输出格式:数据呈现给人们的格式
28
SAS程序第二例

SAS/orange.sas 输入数据-形成数据集-排序-打印显示
29
SAS文件及命名

1、SAS数据集文件(后缀为sas7bdat) 2、SAS程序文件(后缀为sas) 3、SAS日志文件(后缀为log) 4、SAS输出文件(后缀为list)
SAS的发展历程一



1966年由美国北卡罗来纳州(North Carolina)州立大学开始研制 1976年成立美国SAS软件研究所,并开 始对SAS系统进行维护、开发、销售和培 训等工作 1985年推出了SAS/PC(6.02)版本
12
SAS发展历程二


1989年推出SAS/PC(6.04)版本 1997年下半年推出适用于多种操作系统 的6.12版本 2000年2月又正式推出SAS系统8版本 2002年推出全新的SAS9版本
23
Insight模块

其他功能: 1、分布(输出大多数常用的统计量) 2、拟合(回归分析) 3、多元(方差分析)
24
SAS程序的书写格式



1、SAS程序由语句组成,语句用分号结 束。 2、 SAS语句可以从某一行的任意位置开 始; 3、几个SAS语句可以写在同一行上,但 每句要使用分号
25

20
SAS工作空间

程序窗口(PROGRAM EDITOR) 运行记录窗口(LOG) 输出窗口(OUTPUT)
21
SAS程序第一例

SAS/HelloWorld.sas

注:以后程序文件省略后缀,直接简记 为文件名称,如此例简记为HelloWorld, 需要说明文件类型时才标明后缀。
22

>< < >
36
运算次序二


对于相同优先级的算符,左边的运算先 做。但有两个例外: 1.对最高优先级,右边的运算先做 2.当两个比较算符围着一个量时,这个 表达式看成是有一个and 出现一样被计 算。 如:12<age< 20, 等价于:12<age & age<20
37
SAS函数一(部分)
17




SAS/EIS 面向对象编程的开发工具,用于开发 企业信息系统 SAS/ACCESS 数据访问 SAS/TOOLKIT 扩充工具,把用其他软件编写 的程序转化成SAS的组成部分 SAS/Warehouse Administrator 数据仓库管理 SAS/Enterprise Miner 数据挖掘 SAS/Text Miner 文本挖掘 SAS/SHARE 数据库的并发式控制专门软件 SAS/CONNECT 使各平台SAS系统进行分布式 处理,从而有效利用各平台机器资源
13
SAS在中国的发展


SAS公司于1989年在北京成立了办事处 1997年,SAS软件研究所正式宣布成立 大中国区 1999年3月在国内设立独资公司——赛仕 软件(上海)有限公司。
14
SAS的成绩



全球十大独立软件开发商之一 世界六大洲近50个国家或地区设有分公 司及分支机构 应用遍及120多个国家和地区(包括中国) 的31000多个机构中 全球100家最大公司中的90多家都在应用 SAS系统。
SAS程序的书写格式



4、一个语句也可以写成几行,只要语句 中的单词不被断开就可以。在一个语句 中各个单词之间至少要有一个空格。 5、SAS程序中一般不区分大小写(字符 串中要区分大小写) 6、用 /*注释的内容*/ 来对程序进行 注释
26
SAS程序的结构



SAS数据集 样本(观测、记录)、变量(字段、 域)、表(数据集)、 数据库 许多SAS语句都是以关键词开始并用它识 别语句的类型(如data、input、proc) 绝大部分的SAS语句都可分为两步: DATA步和PROC步
SAS/Insight模块
1、界面介绍 2、Fill values 功能 3、Extract 功能 4、Edit/windows/tool菜单使数据探索色 彩缤纷(注意选项设置) 5、打开分布、拟合、多元等的窗口之后 主菜单Tables、Graphs、Curves菜单才 被开放。
Fly,insurance数据集示例
8
数据处理的应用



天文学(skicat系统处理天文数据发现类 星体) 生物学(人类基因组计划处理人体数据 研究基因) 市场营销(货篮分析) 公司财务的处理(记流水帐) 经济论文写作中的实证部分
9
数据处理的应用


“今天,我们不得不生存在全球化和信息革 命影响下的世界,我们只有两个选择:适应它, 或者被它抛弃。” ——英特尔公司主席 安德鲁· 格鲁夫 1995年尼葛洛庞帝的《数字化生存》一书指明 了即将到来的数字时代,而在未来一长段时间, 数字化生存仍将是人类的主要生存方式,在经 济学领域也不外如是。
10
第二部分 SAS系统入门 SAS系统概况


大型集成、跨平台软件系统 完备的数据访问(Access)、管理 (manage)、分析(analyze)和呈现 (present)及应用开发(develop)的功能 在数据处理、统计分析和IT应用领域, SAS系统已经成为国际上的标准软件系统。
11
32
Analyst分析家模块

1、界面介绍 2、浏览与编辑模式 3、生成示例数据与抽样 4、程序清单 5、假设检验
33
SAS运算符(operator例)




算术运算符: + - * / ** 比较算符: =(EQ) ^=(NE) >(GT) <(LT) >=(GE) <=(LE) in 逻辑算符: &(AND) |(!)(OR) ^(~)(Not) 其它:><(最小值) < >(最大值) ||(!)(连接)
18





SAS/GIS 地理信息系统与空间数据的显 示分析 SAS/SPECTRAVIEW 数据可视化分析工 具,用几何成像的方式来分析多维数据 SAS/Intrnet 提供构建基于SAS的企业内 部网络支持 SAS/FSP 快速数据处理的交互式菜单系 统 SAS/CALC 功能完善的多维电子表格软件 SAS/ENGLISH 提供利用自然英语获取信 息的能力



数学函数: abs()、max ()、min ()、mod (x, y)、sign (x)、 sqrt (x)、 sum ()、 mean ()、exp (x) 、log (x)、log10 (x)、log2(x) 、sin (x)、arsin (x) 截取函数: ceil (x)、floor (x)、int (x)、round (x,n) 字符函数: index (S, S1)、substr (S , p, n)、scan(S2,n)、 upcase(S)、compress(S,S1)
34
字符的比较(operator_char例)



1、按机器使用的字符排列次序(ASCⅡ或 Unicode)从左到右被比较。 2、两个不等长的字符串被比较时,系统 在较短的字符串后自动添上空格 3、在比较符后加冒号,则只比较首字母
35
运算次序一



在括弧里的表达式先计算 第一级:** (+ -)前缀 第二级:* / 第三级:+ - 第四级:|| 第五级:其余比较算符 第六级:& 第七级:|
39
SAS函数三(部分)



概率统计函数: probnorm (x) n (of X1-Xn)、nmiss (of X1-Xn), var (of x1-xn)、std (of x1-xn) 随机数函数: rannor (seed)、ranuni (seed) Functions例
19





SAS/SECURE 网络传输加密 SAS/OLAP SERVER 多维数据存储及汇总结果 呈现 SAS/GENETICS: SAS公司的第一个科学研究 应用软件,应用于遗传学,有5个分析过程 SAS/High-Performance Forecasting:提供快速 高效的预测结果 SAS/C, SAS/C++ 针对IBM大型机的开发工具 SAS/LAB 向导式的数据分析软件,特别针对 day-to-day类型数据
3
数据类型


a. 横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、 国家或一系列其他单位采集的样本所构 成的数据集(应该忽略细小的时间差别) 名词术语 1、数据集:数据的集合,由样本(行) 和变量(列)组成
4
数据类型


b.时间序列数据集(time series data set): 是由一个或几个变量在不同时间的观测 值所构成的。 c.混合横截面数据集(pooled cross section data set): 有些数据既有横截面数据的特点又有时 间序列的特点,但每一时点的样本不同。
相关主题