当前位置:文档之家› _数据描述性分析解读

_数据描述性分析解读


SAS软件
在数据处理与统计分析领域,SAS系统已成为国 际上流行标准企业管理软件。美国《财富》杂志 评选的500家最大公司中的90%以上的企业都在 应用SAS软件。 在北美,SAS广泛地被用于所有的金融公司,医 药研发机构和政府调查和监管部门。特别是在加 拿大的金融中心-多伦多,每年更是需要大量熟练 掌握和运用SAS的科技人员。
2 方差、标准差与变异系数 方差是描述数据取值分散性的一个度量,
1 n 2 s ( x x ) i n 1 i 1
2
其量纲是数据量纲的平方。 标准差
1 n s s ( xi x) 2 n 1 i 1
2
均值、方差等数字特征
变异系数:刻画数据相对分散性的度量
s CV= 100 (%) x
SAS软件介绍-Colin
美国SAS软件研究所(SAS Institute Inc.)创建于1976年。 27年来,SAS软件研究所一直致力于为金融、医药研发、 保险、电信、制造、政府以及科研教育等部门,在SAS的 数据仓库, 统计分析、联机分析处理系统, 数据挖掘, Intranet和各种瘦客户端的核心产品和技术之上,为各种 企业提供客户关系管理、信贷风险分析和管理、企业综合 风险管理、数据仓库、协作式商务智能、企业均衡记分卡 (Balanced Score Card)、电子商务智能、供应关系管理、 财务分析和报告、人力资源管理和其它各种商务智能和决 策支持系统(DSS)的解决方案。
SAS系统的启动和退出
退出 1 选择关闭按钮; 2 执行菜单命令【File】→【Exit...】; 3 在命令框执行BYE或ENDSAS命令
n
数据描述性分析
数据分析研究的对象是数据,它们是n 个观测值:
x1 , x2 ,, xn ,
1
,
如果这 n 个观测值就是所要研究对象的全体,那么数据 分析的任务就是提取数据中包含的有用的信息。如果数 据是从总体中抽出的样本,就要分析推断样本中包含的 总体的信息。
SAS软件
SAS 是一个庞大的系统,它多个功能模块 组成,每个模块分别完成不同的功能。由于SAS 最初是为专业统计人员设计的(这一点和SPSS 已恰恰相反),因此使用上以编程为主,初学者 掌握较为困难。
SAS软件
SAS公司统计分析的强大优势和完美的数据挖掘产品,可以帮助用户: Customer Segmentation-识别最有利润的客户群,并揭示其中的 特征 Credit Risk Management-通过准确的信用评分提高客户的利润 率 Balanced Scorecard - 企业均衡计分管理 Fraud Detection-欺诈检测 Customer Retention-客户流失管理 Cross Selling-组合销售 以及其他需要预测和规则发现的应用等等 SAS的宗旨是为所有需要进行数据处理、数据分析的非计算机工作人 员提供一种易学易用、完整可靠的软件系统。SAS语言本身是一种非 过程语言(第四代语言),类似于C语言,且综合了各种高级语言的 功能和灵活的格式,将数据处理和统计分析融合于一体。
SAS系统的启动和退出
启动 1 双击桌面图标 2 执行开始菜单中程序菜单项
输出 窗口, F7
日志 窗口, F6
程序 编辑 窗口, F5
显示管理系统的基本窗口
在程序编辑窗口中,你可以 1 输入、编辑和提交程序语句 2 打开以前储存的程序 3 将程序存入文件
显示管理系统的基本窗口
在日志窗口中,你可以看到你提交的程序执行过 程中系统产生的一些信息 在输出窗口中,你可以浏览当前的SAS程序产生 的输出结果
SAS模块
SAS8.2的完整版本包含以下数十个模块。 BASE,GRAPH,ETS,FSP,AF,OR,IML,SHARE, QC,STAT,INSIGHT,ANALYST,ASSIST, CONNECT,CPE,LAB,EIS,WAREHOUSE,PC File Formats,GIS,SPECTRAVIEW, SHARE*NET, R/3,OnlineTutor: SAS Programming,MDDB Server, IT Service Vision Client, IntrNet Compute Services, Enterprise Reporter,MDDB Server common products, Enterprise Miner,AppDev Studio,Integration Technologies等 常用的模块有base,graph,stat,insight,assist, analyst模块等,分别执行基本数据处理、绘图、统计分 析、数据探索、可视化数据处理等功能。
均值、方差等数字特征
一元数据的数字特征主要是以下几种。设 n个观测值为
x1 , x2 ,, xn ,
其中n 称为样本容量。 , 1 均值:即是 x1 , x2 ,, xn的平均数:
1 n x xi n i 1
均值表示数据的集中位臵。(matlab mean函数)
均值、方差等数字特征
第一章 数据描述性分析
数据分析的基本内容
数据描述性分析 非参数方法 回归分析 主成分分析 判别分析 聚类分析 时间序列分析 Bayes统计分析
SAS软件介绍-Colin
随着信息技术的迅速发展-特别是数据仓库技术的 广泛应用,企业拥有的数据量急剧呈几何级数增 大,在这大量的数据信息中,隐藏着企业运作的 利弊得失,若能够对这种海量的数据与信息进行 快速有效地深入分析和处理,就能从中找出规律 和模式,获取企业决策所需知识,帮助企业进行 迅速有效的运筹决策。
n
校正平方和
(x CSS=
i 1
i
2 x )
未校平方和
2 x USS = i i 1 n
均值、方差等数字特征
3 偏度与峰度 偏度与峰度是刻画数据的偏态、尾重程度的度量。 它们与数据的矩有关。数据的矩分为原点矩与中心矩。
k阶原ቤተ መጻሕፍቲ ባይዱ矩
1 n k v k xi n i 1
uk 1 k ( x x ) i n i 1
相关主题