当前位置:文档之家› 20数据可视化基础 (4)

20数据可视化基础 (4)

组织等。
数据库
关系数据库 文档存储 列式存储 键值存储 图形数据库 分布式数据库 内存数据库
4. 大数据计算框架
数据类型
静态数据 动态数据 计算框架
批处理 流式处理 交互式查询 具体技术
MapReduce Spark
5. 数据挖掘
•(1)分类分析。 •(2)聚类分析。 •(3)关联分析。
02
数据准备
➢数据采集与预处理 ➢数据存储与管理 ➢数据分析与挖掘
大数据应用开发流程
数据采集 数据预处理
大数据存储与管 理
大数据分析 数据挖掘
可视化展示
1. 数据采集与预处理
(1)企业/机构内部数据 (2)社交Байду номын сангаас体数据 (3)机器和传感器数据
量更大
类型 更多
更快速
真实性
数据类型
类别型
有序型
数据类型
算法分类
有监督学习 无监督学习
分类 预测 关联分析 聚类
决策树 KNN 贝叶斯 SVM/神经网络 回归 SVM/神经网络
Apriori FP-growth
K-means 层次聚类 密度聚类
总结
2. 数据准备
数据采集 数据预处理
大数据存储与管 理
大数据分析 数据挖掘
可视化展示
感谢您的观赏
THANK YOU FOR WATCHING
数据可视化基础
报告人: 曙光瑞翼教育品牌部 时 间: 2017年7月6日
目录
01
视觉感知
02
数据准备
03
数据可视化基本框架
04
数据可视化基本原则
05
数据可视化基本图表
06
数据可视化工具
课前回顾 数据可视化概述 1. 视觉感知
• (1)视觉感知的定义和处理过程,以及格式塔原则 • (2)介绍了三基色的原理以及色彩三要素 • (3)可视化编码以及视觉通道的概念
区间型
比值型
1. 数据采集与预处理
初始数据 的获取
数据集成 与融合
数据归约
数据清理
数据变换
3. 大数据存储与管理
目前的主要数据存储介质类型包括内存、磁盘、磁带等。 主要数据组织管理形式包括按行组织、按列组织、按键值组织和
按关系组织。 主要数据组织管理层次包括按块级组织、文件级组织及数据库级
相关主题