随着我国大气环境监测工作的广泛开展,各部门、各系统产生的大量信息为大气环境监测工作提供了有力依据。
但由于大气环境问题具备较高的复杂性和多样性特点,且不同类型数据之间存在非线性、多元化的相互关系,大气环境监测工作获得的相关数据在分析和利用中往往会面临多方制约。
为更好发挥大气环境监测效用,正是本文围绕大数据解析技术开展具体研究的原因所在。
1大气环境监测中大数据解析技术的运用优势与运用路径
1.1优势分析
在大气环境监测中,大数据解析技术的运用具备多方面优势,如提升预警能力、提高决策科学性、增强服务能力等,具体优势如下:①提升预警能力。
通过对海量大气环境监测数据的解析,大数据解析技术可从中挖掘中存在利用价值的信息,并以此更为精确的判断和评估区域内大气环境,大气环境治理与保护工作可由此获得充足依据。
此外,较为快捷的技术运用还能够第一时间发出大气污染事件预警,结合互联网技术加快沟通与交流速度,大数据解析技术的运用将深入改变传统的大气环境监测工作。
②提高决策科学性。
通过运用大数据解析技术深入、高效的分析各项大气环境监测指标,工作人员即可更为快速、直观的了解当前大气环境状况,相关决策工作可获得有力支持,由此构建的数字模型也能够大气治理工作的开提供可靠参考。
③增强服务能力。
通过建立云分析平台并综合运用大数据解析技术,各类大气污染问题即可得到更为及时的反馈,相关结果也可直接通过互联网进行发布,环境监测的服务能力可由此实现长足提升,得到群众全面监督的大气环境监测工作也能够由此实现,大气环境监测工作的服务能力自然会因此实现长足提升[1]。
1.2运用路径
在大气环境监测工作的大数据解析技术运用中,技术的具体运用可围绕可视化操作展开,也需要关注数据的收集、记录、整理、挖掘,大气环境的预测、空气质量预警平台的构建也属于大数据解析技术的典型运用,具体运用路径如下:①可视化操作。
考虑到大气环境监测工作需要关注的因素较多,且简单的数据记录不足以反映大气环境变化的规律,因此可采用大数据解析技术实现图像化的数据展示,并通过气象平台进行发布,相关活动的开展可由此获得依据。
②数据的收集、记录、整理、挖掘。
大数据解析技术可较好服务于大气环境监测数据的收集、记录、整理、挖掘,以此形成档案保存、找出大气环境变化规律,即可为大气环境预测提供有力支持。
③大气环境预测。
基于处理过的大气环境数据,可采用大数据解析技术总结数据的规律和联系,配合针对性编程、严谨性与科学性的遵循、气象公式的运用,并参考生态环境因素、历史同期数据,即可更好实现大气环境预测[2]。
2大气环境监测中大数据解析技术的具体运用
2.1技术的运用流程
为提升研究的实践价值,本文以城市局地PM2.5浓度计算作为研究对象,深入探讨大数据解析技术在计算中的应用,大数据解析技术的具体运用流程可概括为:“确定研究问题的对象和内容→选择数据类及其特征量→开展数据归一化处理→进行数据分类→分别建立空间类/时间类数据集→分别建立训练空间分类器SC/TC→判别训练成否→循环训练直至完成训练→分别开展计算→综合计算结果→输出”,由此大数据解析技术即可较好服务于城市局地PM2.5浓度计算。
2.2研究对象与研究内容
相互间较为复杂的数据类属于大数据解析技术面对的主要对象,因此技术的运用必须重点关注研究对象与研究内容,以此多样、灵活的解决问题。
本节的研究对象为城市局部地区,研究内容为城市局部地区的PM2.5平均浓度。
在具体研究中,需首先基于单元网格划分目标城
市,单元网格的规格为1km×1km,由此可见研究对象表示为:G(g1,g2,…,gi,…,gn),城市中范围为1km2的地点由Gi表示;研究内容可表示为:C(Cg1,Cg2,…,Cgi,…Cgn),gi局地网格的PM2.5平均浓度由Cgi表示。
在大数据解析技术的运用中,研
究内容也被称作目标函数,将其表示为:J(Ci),这一目标函数存在C1、C2两类,分别代
表设有和未设有大气自动监测站的网格,二者的PM2.5平均浓度分别为已知和未知,C2网
格的PM2.5平均浓度的确定需应用大数据解析技术[3]。
2.3数据类及特征量选择
为保证未设有大气自动监测站网格的PM2.5平均浓度计算精度,大数据解析技术的运用需得
到大量C2相关的数据,以此满足解析需要。
C2相关数据的选择应以“需要”、“可能”为原则,“可能”指的是存在相关数据,需要则应分析各类数据,以此保证选择的数据类与目标函数J (Ci)存在一定相关性。
结合相关调研与实践,研究选择的C2相关数据包括每个网格的坐标、与空气污染有关的网格内特征单位数据、人群活动情况数据、交通状况数据、气象条件
数据、PM2.5平均浓度历史数据,其中的单位数据包括公园、运动场、购物中心、餐饮业、
工厂、加油站等单位的数据。
在大数据解析技术的运用中,解析的实现需关注目标函数受到
的各类数据所包含的特征量影响,因此研究用特征量采用气象条件中的风速、气压、气温以
及相对湿度,交通状况中的不同车速下的车辆数、平均车速方差、平均车速、总车辆数,以
及历史上PM2.5h平均浓度,由此选择各个特征量,即可采用下式归一化处理各个特征量,
式中的下标K、i、x-k、sk、x′ik、n分别为第k个特征量、第K个特征量的第i个数值、第k
个特征量的平均值、第k个特征量的标准差、特征量k归一化后的第i个数据、第k个特征
量数据个数。
分析上述特征量可发现,存在随时间变化和不随时间变化的两种特征量,目标
函数受到的影响过程将因此受到影响,解析途径也存在显著区别,因此研究采用空间分类器,围绕与空间相关数据集,对目标函数进行运算,最终得到预期结果,时间分类器则用于随时
间变化的相关数据集,以此通过运算得到预期结果。
其中,与空间相关的数据集包括网格坐
标数据类、特征单位数据、网格道路状况,随时间变化的数据集则包括人群活动情况、交通
状况、气象条件、历史数据。
2.4空间分类器
空间分类器包含的特征量不会受到时间的影响,处于静态过程,目标函数受到的空间分类器
所包含特征量的影响则属于多层多节点的传递过程,空间分类器具备静态神经网络结构特征。
因此空间分类器的局地网格PM2.5浓度预测采用输入部分(IG)与人造神经网络部分(ANN)组成,输入部分负责用各类空间特征量构建人造神经网络部分的输入值,图1为空间分类器
输入部分的数据生成流程。
在具体研究中,需随机选取l1、l2两个局地坐标(建有大气自动
监测站),基于图2所示的神经网络节点输入输出流程,研究可采用反演法解决神经网络中
存在的非线性函数变换等问题,配合Widrow-Hoff学习规则,即可通过不断反复训练空间分
类器,以满足大数据解析技术运用需要。
2.5时间分类器
作为随时间变化的特征量,局地点大气污染物浓度记为yi,某网格点的某个特征量记为xij,
因此可得出X={x1,x2,…xn},且xi={xi1,xi2,…xij,t},t为某一时刻。
在特征量X确
定情况下,具有马和科夫特性的随机变量yi仅与相邻的yi-1值有关,因此可得出:在基于大
数据解析的城市局地大气污染物浓度计算中,可基于式(6),基于趋于最优的空间分类器
与时间分类器,即可最终实现未知网格的PM2.5估算。
3结论
综上所述,大数据解析技术可较好服务于大气环境监测工作。
在此基础上,本文涉及的技术
的运用流程、研究对象与研究内容、数据类及特征量选择、空间分类器、时间分类器等内容,则提供了可行性较高的大数据解析技术运用路径。
为更好发挥大数据解析技术的应用优势,
大气网格化监测质控技术与大数据解析技术的结合必须得到重视。