当前位置:文档之家› SAS编程语言基础

SAS编程语言基础

第二章 SAS编程语言基础
卫生统计教研室 彭斌
Slide 1
从原始数据到最终报告
卫生统计教研室 彭斌
Slide 2
§1、 SAS语句
SAS编程语言同其它计算机语言一样,也有自己的语法: 关键词和连结关键词与其它辅助信息的规则。
由SAS语句组成的序列称为SAS程序。
一.SAS语句的含义 我们先来看一个实例:
现在,我们给出SAS语句的定义:SAS语句是由关键词、 SAS名、特殊字符或运算符组成并以分号结尾的字符串。
卫生统计教研室 彭斌
Slide 6
二.几个概念 1.SAS关键词
位于句首的用以说明语句类型和功能的单词称为SAS语句的关键 词。它是SAS语句的主要成份。如:PROC、DATA、VAR、RUN等。 2.SAS名
68 71 65 良好 74 61 68 良好 73 75 46 良好 79 80 79 优秀 75 71 68 良好 85 85 87 优秀 78 79 75 优秀 80 76 79 优秀 85 80 82 良好 77 71 75 良好 67 73 71 优秀 75 81 70 良好 70 54 75 及格 70 66 84 及格 62 73 65 及格 82 70 79 优秀
(更多其它语句)
CARDS语句:用来指示数据行的开始;
数据行
;语句:表示数据行的结束。 RUN;
卫生统计教研室 彭斌 Slide 11
DATA关键词告诉系 统,要创建一个SAS 数据集,命名为score
INPUT关键词告诉系 统,数据在程序流中, 并且指明数据所对应 的变量名及类型。$符 号说明它前面的一个 变量为字符型。
x3 16 73.0000000 9.7911525 46.0000000 87.0000000
------------------------------------------------------------------------------
在这个例子中: DATA, INPUT, CARDS, PROC, VAR, RUN是关键词; score是数据集名; no, x1, x2, x3,x4是变量名;$是特殊字符; MEANS是过程名; Data=是MEANS语句中的选项。
;
RUN;
68 71 65 良好 74 61 68 良好 73 75 46 良好 79 80 79 优秀 75 71 68 良好 85 85 87 优秀 78 79 75 优秀 80 76 79 优秀 85 80 82 良好 77 71 75 良好 67 73 71 优秀 75 81 70 良好 70 54 75 及格 70 66 84 及格 62 73 65 及格 82 70 79 优秀
Minimum
Maximum
------------------------------------------------------------------------------
x2
16
72.8750000
7.8729495
54.0000000
85.0000000
x3
16
73.0000000
9.7911525
Variable N
Mean Std Dev Minimum Maximum
------------------------------------------------------------------------------
x2 16 72.8750000 7.8729495 54.0000000 85.0000000
12 20010890 75 81 70 良好
13 20011118 70 54 75 及格
14 20010893 70 66 84 及格
15 20010894 62 73 65 及格
16 20010909 82 70 79 优秀
The MEANS Procedure
Variable N
Mean
Std Dev
/*打印数据*/ PROC PRINT Data= score; VAR no x1 x2 x3 x4; RUN;
/*计算均数及标准差*/ PROC MEANS Data= score; VAR x2 x3; RUN;
; RUN;
利用这段程序就可以完成上面的要求
卫生统计教研室 彭斌
Slide 5
The MEANS Procedure
卫生统计教研室 彭斌 Slide 10
1.DATA步(数据步)
DATA步包括:创建一个或几个新的SAS数据集的语句和创建数据 集所必须的运算操作语句。
DATA步以DATA语句开头,可以包含任意多个SAS程 序语句。
一个DATA步的基本语句有:
DATA语句:表示创建SAS数据集; INPUT语句:对SAS数据集中的变量进行描述;
;
RUN;
68 71 65 良好 74 61 68 良好 73 75 46 良好 79 80 79 优秀 75 71 68 良好 85 85 87 优秀 78 79 75 优秀 80 76 79 优秀 85 80 82 良好 77 71 75 良好 67 73 71 优秀 75 81 70 良好 70 54 75 及格 70 66 84 及格 62 73 65 及格 82 70 79 优秀
The SAS System
09:22 Monday, August 16, 2004 10
Obs
no
x1 x2 x3 x4
1 20010873 68 71 65 良好
2 20010874 74 61 68 良好
3 20010875 73 75 46 良好
4 20010876 79 80 79 优秀
三.语句格式 SAS语句的基本格式是: 关键词 参数 [选项1|选项2|选项3] 选择值;
关键词:用以说明语句类型和功能的单词; 参数:要求用户提供的信息。不用括号,不是任选项。
卫生统计教研室 彭斌
Slide 8
例如:INPUT x y z; 其中:INPUT是关键词,它说明要把数据提供给哪些 变量。后面跟的变量名x、y、z 都是参数,即要求用户 提供的信息。
5 20010877 75 71 68 良好
6 20010884 85 85 87 优秀
7 20010885 78 79 75 优秀
8 20010886 80 76 79 优秀
9 20010887 85 80 82 良好
10 20010888 77 71 75 良好
11 20010889 67 73 71 优秀
高数 68 74 73 79 75 85 78 80 85 77 67 75 70 70 62 82
英语 71 61 75 80 71 85 79 76 80 71 73 81 54 66 73 70
生理 65 68 46 79 68 87 75 79 82 75 71 70 75 84 65 79
CARDS关键词告诉系统, 其后紧随着的便是数据。
数据行,数据源中不能 有分号(;)。
表示该数据步 结束
卫生统计教研室 彭斌 Slide 12
2.PROC步(过程步)
➢ PROC步要求SAS系统从过程库中调出一个过程模块并执行它。
➢ PROC步以PROC语句开始,可以包含多个相应的
SAS语句。
例如: PROC MEANS Data=score; VAR x2 x3;
SAS语句中出现的SAS名有很多种类,如变量名、SAS数据集名 等。
➢ SAS命名规则: 1)由1至32个字符组成(SAS7以下版本为最多8个字符); 2)由三种字符构成: 英文字母A-Z,a-z,下划线_,数字0-9; 3)每个名字的第一个字符不能为数字; 4)SAS系统保留了一些名字作为特殊的变量名,这些变量名的开头 和结尾都用特殊字符下划线表示(如_N_、_ERROR_等)。
• 在一条语句中各项之间至少要有一个空格; • SAS对大小写不敏感。即SAS语句用大写字母、小写字母或大、
46.0000000
87.0000000
------------------------------------------------------------------------------
卫生统计教研室 彭斌 Slide 15
1.SAS程序的书写方法
(1)书写格式
• SAS语句可以从一行上的任意位置开始;几个SAS语句可以写 在同一行上;一个语句也可以写成几行,只要语句中的单词 不被断开即可;
;表示数据行 的结束
DATA score; INPUT no x1 x2 x3 x4 $; CARDS;
20010873 20010874 20010875 20010876 20010877 20010884 20010885 20010886 20010887 20010888 20010889 20010890 20011118 20010893 20010894 20010909
卫生统计教研室 彭斌
Slide 9
§2、 SAS程序
一系列SAS语句组成一段SAS程序。SAS程序中的 语句可分为两类:DATA步和PROC步。这两类步骤是 所有SAS程序的组成模块。通常用DATA步产生SAS数 据集而用PROC步对SAS数据集内的数据进行分析处理 并输出结果。
一段SAS程序可由一个DATA步或一个PROC步组 成;或者由DATA步和PROC步两部分组成;也可由多 个DATA步和多PROC步组成。
PROC PRINT Data=score; VAR x1 x3 x4; RUN;
注意:一个完整的SAS程序必须以RUN语句结尾方能提交运行。
卫生统计教研室 彭斌 Slide 13
§3、编写SAS程序
相关主题