数据可视化和分析工具有哪些
当你分析和可视化数据前,常需要“清理”工作和需要你的数据的图形化的表达。
因此你需要标准化这些工作,使看到统一的样式。
下面千锋教育大数据培训技术分享的22个工具被用来帮助使数据处于最佳的状态。
1、DataWrangler
斯坦福大学可视化组(SUVG)设计的基于web的服务,以你刚来清理和重列数据。
点击一个行或列,DataWrangler 会弹出建议变化。
比如如果你点击了一个空行,一些建议弹出,删除或删除空行的提示。
它的文本编辑很cooool。
2、Google Refine
Google Refine。
用户在电脑上运行这个应用程序后就可以通过浏览器访问之。
这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个CSV 文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。
但是这些其实都代表了同一个属性,Google Refine 的作用就是帮你把这些不规范的写法迅速统一起来。
3、R 项目
R语言是主要用于统计分析、绘图的语言和操作环境。
虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。
其分析速度可比美GNU Octave甚至商业软件MATLAB。
可视化应用与服务(Visualization applications and services)这些工具提供了不同的可视化选项,针对不同的应用场景。
4、Google Fusion Tables
Google Fusion Tables 被认为是云计算数据库的雏形。
还能够方便合作者在同一个服务器上分享备份,email和上传数据,快速同步不同版本数据,Fusion Tables可以上传100MB的表格文件,同时支持CSV和XLS格式,当然也可以把Google Docs里的表格导入进来使用。
对于大规模的数据,可以用Google Fusion Tables创造过滤器来显示你关心的数据,处理完毕后可以导出为csv文件。
Google Fusion Tables的处理大数据量的强大能力,以及能够自由添加不同的空间视图的功能,也许会让Oracle,IBM, Microsoft传统数据库厂商感到担心,Google未来会强力介入数据库市场。
5、Impure
Impure,允许点击、拖曳来连接模块,由西班牙分析公司Bestiario 创建。
6、Tableau Public
7、Many Eyes
8、VIDI
9、Zoho Reports
10、Choosel
11、Exhibit
12、Google Chart Tools
13、JavaScript InfoVis Toolkit
14、Protovis
15、Quantum GIS (QGIS)
16、OpenHeatMap
17、OpenLayers
18、OpenStreetMap
19、TimeFlow
20、IBM Word-Cloud Generator
21、Gephi
22、NodeXL。