数据分析实验指导书理学院实验中心数学专业实验室编写实验一SAS系统的使用【实验类型】(验证性)【实验学时】2学时【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。
【实验内容】1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。
2. 建立数据集表1Name Sex Math Chinese EnglishAlice f908591Tom m958784Jenny f939083Mike m808580Fred m848589Kate f978382Alex m929091Cook m757876Bennie f827984Hellen f857484Wincelet f908287Butt m778179Geoge m868582Tod m898484Chris f898487Janet f8665871)通过编辑程序将表1读入数据集sasuser.score;2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share price: 000096 广聚能源8500 0.059 1000 13.27000099 中信海直6000 0.028 2000 14.2000150 ST麦科特12600 -0.003 1500 7.12000151 中成股份10500 0.026 1300 10.08000153 新力药业2500 0.056 2000 22.753)将下面Excel表格中的数据导入SAS数据集work.gnp;name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53 新疆123.24 38 13.72 4.64 17.77 5.754)使用VIEWTABLE格式新建数据集earn,输入如表所示数据Year earn1981 1250001982 1360001983 1223501984 652001985 8446001986 2550001987 2650001988 2800001989 1360003. 将sasuser.score数据集的内容复制到一个临时数据集test,要求只包含变量name, sex, math。
4.将sasuser.score数据集中的记录按照math的高低拆分到3个不同的数据集:math大于等于90的到good数据集,math在80到89之间的到normal数据集,math在80以下的到bad数据集。
5.将4题中得到的数据集good,normal,bad合并为数据集combine,并将数据集combine 按照数学成绩排序,然后打印排序后的数据集。
【实验报告要求】1. 写出2. 1) 2) 3), 3,4,5的程序设计;2. 附上5题打印程序运行的结果。
【实验方法或步骤】1.SAS系统的启动:2种方法1)双击桌面上的SAS快捷方式;2)单击屏幕左下角的“开始”菜单,在菜单中选择“程序”,在程序中选择The SAS System,最后选择The SAS System for Windows V8。
2.数据的输入与输出1)在SAS程序窗口下,直接输入数据以建立一个SAS数据集,其基本语句形式为:输出数据集的内容,可用2)将其他格式的数据文件导入数据集.3.能够利用已有的SAS数据集建立新的SAS数据集1)两个数据集的合并两数据集的串接:将A和B两个数据集串接成为一个名为“name”的新的SAS数据集.序排列,可将两数据集并接以形成新的SAS数据集,其中数据集中变量的个数为原两数据集中的变量个数之和.示例:将记录学生成绩的//数据集按性别分成两个数据集,即一个记录男生的成绩,一个记录女生的成绩。
程序如下:Data scorem scoref;Set sasuser.score;Select (sex);When (‘m’) output scorem;When (‘f’) output scoref;End;Run;实验二1991年全国各省、区、市城镇居民月平均收入的数据分析【实验类型】(综合性)【实验学时】6学时【实验目的】通过对1991年全国各省、区、市城镇居民月平均收入进行数据描述性分析、判别分析、聚类分析和主成分分析,培养和提高学生应用统计软件SAS分析处理数据的能力,为以后的学习及应用打下良好的基础。
【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下表,变量含义如下:X1-人均生活费收入(元/人);X2-人均全民所有制职工工资(元/人);X3-人均来源于全民标准工资(元/人);X4-人均集体所有制工资(元/人);X5-人均集体职工标准工资(元/人);X6-人均各种奖金及超额工资(元/人);X7-人均各种津贴(元/人);X8-职工人均从工作单位得到的其他收入(元/人);X9-个体劳动者收入(元/人)。
diqu leixing x1 x2 x3 x4 x5 x6 x7 x8 x9 北京 1 170.03 110.2 59.76 8.38 4.49 26.8 16.44 11.9 0.41 天津 1 141.55 82.58 50.98 13.4 9.33 21.3 12.36 9.21 1.05 河北 1 119.4 83.33 53.39 11 7.52 17.3 11.79 12 0.7 上海 1 194.53 107.8 60.24 15.6 8.88 31 21.01 11.8 0.16 山东 1 130.46 86.21 52.3 15.9 10.5 20.61 12.14 9.61 0.47 湖北 1 119.29 85.41 53.02 13.1 8.44 13.87 16.47 8.38 0.51 广西 1 134.46 98.61 48.18 8.9 4.34 21.49 26.12 13.6 4.56 海南 1 143.79 99.97 45.6 6.3 1.56 18.67 29.49 11.8 3.82 四川 1 128.05 74.96 50.13 13.9 9.62 16.14 10.18 14.5 1.21 云南 1 127.41 93.54 50.57 10.5 5.87 19.41 21.2 12.6 0.9 新疆 1 122.96 101.4 69.7 6.3 3.86 11.3 18.96 5.62 4.62 山西 2 102.49 71.72 47.72 9.42 6.96 13.12 7.9 6.66 0.61 内蒙古 2 106.14 76.27 46.19 9.65 6.27 9.655 20.1 6.97 0.96 吉林 2 104.93 72.99 44.6 13.7 9.01 9.435 20.61 6.65 1.68 黑龙江 2 103.34 62.99 42.95 11.1 7.41 8.342 10.19 6.45 2.68 江西 2 98.089 69.45 43.04 11.4 7.95 10.59 16.5 7.69 1.08 河南 2 104.12 72.23 47.31 9.48 6.43 13.14 10.43 8.3 1.11 贵州 2 108.49 80.79 47.52 6.06 3.42 13.69 16.53 8.37 2.85 陕西 2 113.99 75.6 50.88 5.21 3.86 12.94 9.492 6.77 1.27 甘肃 2 114.06 84.31 52.78 7.81 5.44 10.82 16.43 3.79 1.19 青海 2 108.8 80.41 50.45 7.27 4.07 8.371 18.98 5.95 0.83 宁夏 2 115.96 88.21 51.85 8.81 5.63 13.95 22.65 4.75 0.97 辽宁 3 128.46 68.91 43.41 22.4 15.3 13.88 12.42 9.01 1.41江苏 3 135.24 73.18 44.54 23.9 15.2 22.38 9.661 13.9 1.19 浙江 3 162.53 80.11 45.99 24.3 13.9 29.54 10.9 13 3.47 安徽 3 111.77 71.07 43.64 19.4 12.5 16.68 9.698 7.02 0.63 福建 3 139.09 79.09 44.19 18.5 10.5 20.23 16.47 7.67 3.08 湖南 3 124 84.66 44.05 13.5 7.47 19.11 20.49 10.3 1.76 广东待判211.3 114 41.44 33.2 11.2 48.72 30.77 14.9 11.1 西藏待判175.93 163.8 57.89 4.22 3.37 17.81 82.32 15.7 0 1、对变量x1作如下计算:1)计算均值、方差、标准差、变异系数、偏度、峰度;2)计算中位数,上、下四分位数,四分位极差,三均值;3)作出直方图;4)作出茎叶图;5)进行正态性检验(正态W检验);对变量x1-x9作如下计算:6)计算协方差矩阵,Pearson相关矩阵;7)计算Spearman相关矩阵;8)分析各指标间的相关性。