20数据可视化基础 (4)
组织等。
数据库
关系数据库 文档存储 列式存储 键值存储 图形数据库 分布式数据库 内存数据库
4. 大数据计算框架
数据类型
静态数据 动态数据 计算框架
批处理 流式处理 交互式查询 具体技术
MapReduce Spark
5. 数据挖掘
•(1)分类分析。 •(2)聚类分析。 •(3)关联分析。
02
数据准备
➢数据采集与预处理 ➢数据存储与管理 ➢数据分析与挖掘
大数据应用开发流程
数据采集 数据预处理
大数据存储与管 理
大数据分析 数据挖掘
可视化展示
1. 数据采集与预处理
(1)企业/机构内部数据 (2)社交Байду номын сангаас体数据 (3)机器和传感器数据
量更大
类型 更多
更快速
真实性
数据类型
类别型
有序型
数据类型
算法分类
有监督学习 无监督学习
分类 预测 关联分析 聚类
决策树 KNN 贝叶斯 SVM/神经网络 回归 SVM/神经网络
Apriori FP-growth
K-means 层次聚类 密度聚类
总结
2. 数据准备
数据采集 数据预处理
大数据存储与管 理
大数据分析 数据挖掘
可视化展示
感谢您的观赏
THANK YOU FOR WATCHING
数据可视化基础
报告人: 曙光瑞翼教育品牌部 时 间: 2017年7月6日
目录
01
视觉感知
02
数据准备
03
数据可视化基本框架
04
数据可视化基本原则
05
数据可视化基本图表
06
数据可视化工具
课前回顾 数据可视化概述 1. 视觉感知
• (1)视觉感知的定义和处理过程,以及格式塔原则 • (2)介绍了三基色的原理以及色彩三要素 • (3)可视化编码以及视觉通道的概念
区间型
比值型
1. 数据采集与预处理
初始数据 的获取
数据集成 与融合
数据归约
数据清理
数据变换
3. 大数据存储与管理
目前的主要数据存储介质类型包括内存、磁盘、磁带等。 主要数据组织管理形式包括按行组织、按列组织、按键值组织和
按关系组织。 主要数据组织管理层次包括按块级组织、文件级组织及数据库级