当前位置:
文档之家› 3.3 数据分析与可视化(精品课件)-【新教材】(共53张PPT)
3.3 数据分析与可视化(精品课件)-【新教材】(共53张PPT)
3.3.1数据分析
➢ 体验数据分析 ③ 使用编程工具进行数据分析 例1:编写程序统计分析南水北调中线工程各地区水资源情况。 (3)编程实现与调试
3.3.1数据分析
实践活动:编写程序计算京津地区人均水资源量 中国水资源短缺,且时空分布不均,南方水多,北方水少。例如,黄
淮海流域 水 资 源 严重短缺 , 人均水资源量约为全国平均水平的21%。请利用前 面收集到的全国各地区水资源数播 , 计算京津地区人均水资源量是全国平均 水平的百分之几。 思考: 1. 分析问题,写出已知条件和求解目标。 2. 设计算法并编程实现。 3. 依据水资源数据,从某个角度分析实施南水北调工程的必要性。
例如,分析全国27个主要城市近50年来月平均降水量和降水天数,再对比 相关城市航班正常率的数据,可以发现航班正常率的走向与月降水量和天数呈 相反方向变化的趋势。对航空公司、空中交通管理措施和天气等各方面大量历 史数据的分析研究,可以帮助管理者找到影响航班正常运行的干扰因素,从而 选择最佳的应对措施。
3.3 数据分析与可视化
教学目标
掌握常用的数据分析方法 , 能根据需要选择恰当的方法 进行数据分析。
了解数据可视化的形式,能选用合适的工具进行数据可视化表达 与呈现。
通过项目研究,感受数据分析和可视化表达对日常生活的影响。
体验探究
你能读懂这些数据吗? 为了解近年来我国水资源状况 , 访问国家统计局政府网站获得如 P105图3.3.1所示的数据和图表。 思考: 1. 利用该网站数据可视化功能 , 调整水资源数据指标和数据呈现方式 , 进 一步分析不同类型图表所表达信息的异同。 2. 根据自己的需求,浏览网站栏目,了解相应的数据,并分析其中蕴含的 信息。
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
例如,使用pyplo子库中的画图函数plot(x,y)可以绘制折线图,程序如下:
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
若将plot(x,y)修改为plot(x,y."o",则可给制出散点图(函数中的"o"表示的是 点形标记符),程序运行效果如图所示:
3.3.1数据分析
➢ 体验数据分析 ③ 使用编程工具进行数据分析 例1:编写程序统计分析南水北调中线工程各地区水资源情况。 问题:分析南水北调中线工程各地区水资源数据,有助于了解我国水资源的 分 布 情 况 。 将 采 集 并 整 理 后 的 中 线 工 程 各 地 区 水 资 源 数 据 保 存 为 “ 0716nsbd.csv”文件,如图3.3.10所示。编写程序,计算中线工程各地区20072016年水资源总量的平均值,并将结果保存到CSV文件中。
折线图 : 折线图可显示随时间而变化的连续数据 , 常用于分析相等时间 隔下数据的发展趋势。
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
柱形图:通常用于显示一定范围内数据的变化情况或用于各项数据的比较。
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
饼图:用于显示各部分数据在总数据中的大小和比例关系。
3.3.1数据分析
➢ 体验数据分析 ② 用在线数据分析平台进行数据分析
随着数据规模越来越大 , 应用范围越来越广 , 分析数据和挖掘数据价值 的需求也越来越多 , 许多在线数据分析平台应运而生。这些平台集成了多种 分析功能,提供了简单易用的交互界面,使得多种数据分析需求得以实现。
3.3.1数据分析
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
使用Python语言可以灵活地制作出以上图表,绘制时可以使用Matplotlib 库。该库是提供数据绘图功能的第三方扩展库,其子库主要用于实现各种数 据图表的绘制。绘图时可使用import.matplotlib.pyplot as plt语句导入该库,在 后读的代码中,则用由代替plt代替pyplot。
例如 , 通过分析游客人数变化 、旅游花费等数据 , 如图3.3.2所示 , 能够了解旅游业当前整体的发展状况 , 帮助旅游业经营者有针对性的调整经营 策略,制订发展方案。
3.3.1数据分析
➢ 数据分析的作用 ② 剖析事物的发展历程
通过数据分析,可以剖析事物的发展历程,了解事物的过去,揭示某些 现象产生的原因。
3.3.2数据可视化
实践活动:了解数据可视化 了解各种数据可视化形式,体验数据可视化效果和魅力。
思考: 1. 访问国家统计局网站,了解数据可视化在国家数据统计分析领的应用(如 图3.3.16所示),体验数据可视化效果。 2. 上网查找数据可视化的网站,熟悉各种数据可视化形式。 3. 举例说明数据可视化效果,填入表3.3.1中。
3.3.1数据分析
采集了所需要的数据,并对数据进行了组织和整理后,为了获得有价 值的信息,还需要对数据做进一步的分析。
数据分析指用适当的计算方法与工具对收集来的数据进行处理,提取 有用信息,形成结论从而支持决策。
3.3.1数据分析
➢ 数据分析的作用 ① 了解事物的现状
通过数据分析 , 可以帮助我们 更好地认识所调研事物的目前状况。
3.3.2数据可视化
数据可视化是以图形、图像和动画等方式直观生动地呈现数据及数据 分析结果,揭示数据之间的关系、趋势和规律等,便于人们更好地理解数据。 可视化的作用体现在多个方面,如观察事物变化的趋势,揭示想法和关系, 总结或汇聚数据,形成论点或意见等。
3.3.2数据可视化
➢ 数据可视化的形式
数据可视化的形式丰富多样,常见的有图表云等。例如,图3.3.15形象地 展示了某公交线路的路线及客流情况。图中的蓝色线条显示了公交车行进的 路线,右侧的柱形显示了各站点乘车的人数,折线图显示出客流随时间的变 化情况。
3.3.1数据分析
➢ 数据分析的基本方法 从统计应用上讲,数据分析可以分为描述性数据分析、探索性数据分析和
验证性数据分析。 • 描述性数据分析侧重于对数据的各种特征进行分析 , 之中发现新的特征; • 验证性数据分析侧重于验证已有假设的真伪。
3.3.1数据分析
➢ 体验数据分析 ③ 使用编程工具进行数据分析 例1:编写程序统计分析南水北调中线工程各地区水资源情况。 (1)分析问题 已知与未知的关系:可以根据中线工程各地区水资源数据文件“07-16nsbd.csv” 中的2007-2016年水资源数据,计算出各地区这十年水资源总量的平均值。
3.3.1数据分析
➢ 体验数据分析 ③ 使用编程工具进行数据分析 例1:编写程序统计分析南水北调中线工程各地区水资源情况。 (2)规划问题求解流程
首先导入用到的库,读入“07-16nsbd.csv”文件中的全部数据,然后统计 各地区十年水资源总量的平均值,生成一个数据表,并将统计结果写入CSV 文件。
结构分析法也称构成分析法,是将各个部分 与总体进行对比,是分析事物内部的结构和部分 与整体之间关系的方法。结构分析法的基本表现 形式就是计算结构指标。结构指标即各个部分相 对于总体所占的百分比,因此总体中各结构指标 的总和等于100%。
3.3.1数据分析
➢ 体验数据分析 确定了数据分析方法后,我们还需要借助合适的工具才能更快捷地进行
3.3.1数据分析
➢ 体验数据分析 ③ 使用编程工具进行数据分析 例1:编写程序统计分析南水北调中线工程各地区水资源情况。 (1)分析问题 已知条件:已有中线工程各地区水资源数据文件“07-16nsbd.csv”,其中包含 了2007-2016年相关地区水资源数据。 求解目标:统计计算中线工程各地区2007-2016年水资源总量的平均值,将统 计结果保存为CSV文件“ nsbd_avg.csv”,并显示中线工程各地区十年来的平 均水资源总量。
数据分析。 计算机普及前,数据分析主要依靠人工方式完成。随着计算机的广泛应
用,涌现出很多功能强大的数据分析工具,例如电子表格软件、在线数据分 析平台和程序设计语言编写的程序等。
3.3.1数据分析
➢ 体验数据分析 ① 用电子表格软件进行数据分析
电子表格软件可对数据进行格式编辑、统计计算和图表处理等。在电 子表格软件中通常用若干工作表存储数据。
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
散点图 : 用于表示若干数据系列中各数值之间的关系 , 以便判断两个变 量之间是否存在某种关联,适用于三维数据集,但其中只有两维需要比较。
3.3.2数据可视化
➢ 数据可视化的实现 ① 用图表将数据可视化
雷达图 : 用来比较每个数据相对中心的数值变化 , 适用于多维数据的呈 现,且每个维度可以排序。
3.3.1数据分析
➢ 数据分析的基本方法 ① 对比分析法
对比分析法分为横向和纵向对比两大类。任务完成量与目标量的对比,部 门之间、地区之间的对比都是横向对比,而不同时期的比较则为典型的纵向 对比。
3.3.1数据分析
➢ 数据分析的基本方法 ② 平均分析法
平均分析法是运用计算平均数的方 法来反映总体在一定时间、地点等条件 下某一数量特征的一般水平。平均指标 中最常用的是算术平均数,如平均身高、 平均工资和平均降水量等。
➢ 体验数据分析 ② 用在线数据分析平台进行数据分析
数据分析除了可以对数值型数据进行统计和描述以外 , 还可以对文本、 图像等数据进行分析。常用的文本分析有字词频率统计、语句分词、句法分 析、分类分析和情感分析等。
3.3.1数据分析
实践活动:使用在线数据分析平台分析全国供水情况 登录国家统计局网站 , 查找全国供水数据 , 体验在线数据分析平台分析
3.3.1数据分析
➢ 数据分析的基本方法 ② 平均分析法
平均分析法多用于比较同类现象在 不同地区、不同行业、不同类型单位等 之间的差异程度,分析现象之间的依存 关系,进行数量上的推算;也可以对某 一现象在不同时间的水平进行比较,以 说明现象的发展规律及趋势。