当前位置:文档之家› 【原创】R语言天气数据分析可视化报告(附代码数据)

【原创】R语言天气数据分析可视化报告(附代码数据)

【原创】R语言案例数据分析报告论文(附代码数据)
有问题到淘宝找“大数据部落”就可以了

.R语言天气数据分析可视化报告
.概要
在本报告中,我们的目标是根据美国国家海洋和大气管理局(NOAA)从1950 - 2011
年收集的风暴数据库,分析不同天气事件对公共卫生和经济的影响。

数据处理
以下代码用于加载数据分析所需的依赖关系。
加载库

library(ggplot2)
library(stringr)
library(R.utils)
library(data.table)
library(dplyr)
library(lubridate)
library(reshape2)
library(scales)

.加载数据集
数据从互联网下载并加载到环境中。
fileUrl <-"https://d396qusza40orc.cloudfront.net/repdata%
2Fdata%2FStormData.csv.bz2"

#根据需要创建目录数据
if(!file.exists("./data")) {
【原创】R语言案例数据分析报告论文(附代码数据)
有问题到淘宝找“大数据部落”就可以了

dir.create("./data")
}

# 根据需要下载压缩文件
if(!file.exists("./data/repdata-data-StormData.csv.bz2"))
{

download.file(fileUrl,
"./data/repdata-data-StormData.csv.bz2",
mode = "wb") # mode "wb" for binary files
}

# Extract the file if needed
if(!file.exists("./data/repdata-data-StormData.csv")) {
bunzip2("./data/repdata-data-StormData.csv.bz2")
}

# #加载CSV
stormData <- fread("./data/repdata-data-StormData.csv")
##
Read 17.6% of 967216 rows
Read 34.1% of 967216 rows
Read 49.6% of 967216 rows
Read 60.0% of 967216 rows
Read 74.4% of 967216 rows
【原创】R语言案例数据分析报告论文(附代码数据)
有问题到淘宝找“大数据部落”就可以了

Read 81.7% of 967216 rows
Read 91.0% of 967216 rows
Read 902297 rows and 37 (of 37) columns from 0.523 GB file
in 00:00:09

事件类型
每个天气事件的类型存储在数据集的列EVTYPE中。
为了提高分析质量,报告的事件类型需要进行标准化。
stormData$EVTYPE <- str_trim(stormData$EVTYPE)

# #把所有的事件类型放在大写字母中
stormData$EVTYPE <- toupper(stormData$EVTYPE)

Subset columns relevant to the analysis
stormDataValues <- select(stormData, EVTYPE,
FATALITIES, INJURIES,

相关主题