当前位置:
文档之家› 20数据可视化基础 (10)
20数据可视化基础 (10)
大数据可视化技术 第三章
时间数据可视化
课前回顾
大数据存 储与管理
01
OPTION
时间概念
02
OPTION
03
OPTION
时间数据的概念
时间数据的广泛应用。
02
连续型数据处理
01
03
CONTENT
02
04
1.连续型数据概念
定义:
连续型数据就是指任意两个数据点之间可以细分出无限多个数值,它表现的是不断变化 的现象。
的数值标
出图表的
刻度
3
2
1
0
拟合线 在众多数据中估算出 一条趋势线
1月 2月 3月 4月 5月
6月
时间轴 根据月份显示数据,先后顺序排列
图 拟合曲线的基本框架
4.拟合曲线
Python实例: 在这里我们使用了多项式拟合的方法来拟合一条曲线。我们从网站
(/ unemployment-rate-1948-2010.csv)下载了 一个美国过去几十年的失业率的数据统计。代码如下页:
2
节点 对应的横轴和纵轴的 坐标
边线 表示链接各节点的线 条,有助于显示趋势
1
0
1月
2月
3月 4月 5月
时间轴 根据月份显示数据,先后顺序排列
图 折线图的基本框架
3.折线图
Python实例: 在阶梯图代码的基础上进行改进, 代码如下:
1. from pyecharts import Line 2. line = Line("美国邮票折线图") 3. datax = [1995,1996,1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,2009] 4. datay = [0.32,0.32,0.32,0.32,0.33,0.33,0.34,0.37,0.37,0.37,0.37,0.39,0.41,0.42,0.44] 5. line.add("Price",datax, datay, is_step = False,is_label_show = True,yaxis_min = 0.3,yaxis_max = 0.45) 6. line.render()
3. filename = "world-population.csv" #人口数据的文件
4. datax = []
5. datay = []
6. with open(filename) as f: #打开文件
7. reader = csv.reader(f) #读取文件内容
8. for datarow in reader: #遍历文件内容
4.拟合曲线
1. import numpy as np
例如:温度这种数据就是连续型,可以测量它一天内的任意时刻的温度。还有股市实时 行情也是一种连续型数据。
那如何处理这些数据呢?
这就用到下面讲到的数据可视化图表法。合适的可视化形式的选择也很重要,它更易于 大家的理解。
2.梯形图
➢阶梯图 定义: 阶梯图是曲线保持在同一个值,直到发生变化,直接跳跃到下一个值。
2.梯形图
图 邮费变化的阶梯图
3.折线图
➢折线图 定义: 折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的
变化趋势。
应用场景有: 折线图比较适用于趋势类的需求,人口增长趋势,书籍销售量,粉丝增长进度, 等等。
3.折线图
基本框架:
数值轴 从0开始 4
的数值标
识出图表 的刻度
3
0
1月
2月
3月 4月 5月
时间轴 根据月份显示数据,先后顺序排列
图 阶梯图的基本框架
2.梯形图
Python实例: 在python中好几个数据可视化的包,这里我们用的是pyecharts。在梯形图中
我们使用的是一组美国每年邮费变化的数据。代码如下:
1. from pyecharts import Line 2. line = Line("美国邮票阶梯图") 3. datax = [1995,1996,1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,2009] 4. datay = [0.32,0.32,0.32,0.32,0.33,0.33,0.34,0.37,0.37,0.37,0.37,0.39,0.41,0.42,0.44] 5. line.add("Price",datax, datay, is_step = True,is_label_show = True,yaxis_min = 0.3,yaxis_max = 0.45) 6. line.render()
9.
if reader.line_num != 1:
10. #
print(reader.line_num,datarow)
11.
datax.append(datarow[0]) #把时间数据保存到datax列表
12.
datay.append(datarow[1]) #把人口数据保存到datay列表
13. plt.plot(datax,datay) #画图
3.折线图
图 邮费变化的折线图
3.折线图
Python实例:
这里我们从/world-population.csv 下载了一个人
口变化的数据文件。代码如下:
1. import csv #处理csv文件的模块
2. import matplotlib.pyplot as plt #把pyplot命名为别名plt
应用场景有: 银行的利率,它一般会持续几个月不变,然后某一天出现上调或下调。楼
盘价格长时间停留在某个值,突然有一天因为各种调控,出现调整。还有人的 年龄的上涨,等等。
2.梯形图
基本框架:
数值轴 从0开始 4
的数值标
识出图表 的刻度
3
2
1
水平线 水平边线表示在某个 间断没有发生变化
C
A
B
跳跃 代表瞬间跳跃 到下一个值
14. plt.show() #显示图像
3.折线图
图 过去50年ห้องสมุดไป่ตู้世界人口趋势图
4.拟合曲线
➢拟合曲线 定义: 拟合曲线是根据所给定的离散数据点绘制的曲线,称为不规则曲线。
应用场景有: 获取的数据很多,或者数据很杂乱,可能很难甚至无法辨认出其中的发展趋
势和模式
4.拟合曲线
基本框架:
数值轴 从0开始 4