空气质量预测综述
作业完成人:吴旭倩、何阿静、王欢
ppt制作及报告人:吴旭倩
KNN算法简介
最近邻
设有c个类为1, …, i,… c,每类有Ni个样本,i=1…c. 到第i类的最近距离为
gi ( x) min || x xik ||, k 1..., Ni
i
||.||表示距离,或相似度。可以是欧式距离,曼哈坦距离,明考斯基距离等。
训练样本10000
10000个训练样本正确率
10000个训练样本误差率
正确率对比
训练样本100 训练样本少
训练样本1000 正确率越高 多
训练样本10000
误差率对比
训练样本100
训练样本1000 误差率越小
训练样本10000
训练样本少
多
谢谢观赏
空气质量预测案例
训练样本100
空气质量测试样本
100个测试样本
浓度
AQI=49.54 浓度=85.85
AQI
K个最相邻和距离
• K=5
• 则选定未知记录为中度污染
测试样本100
100个训练样本正确率正确率
100个训练样本误差率
训练样本1000
1000个训练样本正确率
1000个训练样本误差率
空气指数
可吸入颗粒物
PM10
细颗粒物
PM2.5
O3
臭氧
AQI
二氧化氮
NO2 CO
一氧化碳
SO2
二氧化硫
空气指数AQI
<=50
良
50~80
中度污染80~100严污染空气指数浓度
100
200
良
300
400
严重污染
500
中度污染
实验方法
1、先通过MATLAB生成所需的数据 2、采用IBM SPSS_Statistics base 数据统计软件,将准备数 据导入到SPSS数据库中 3、对这些数据进行分析,得到训练样本 4、对测试数据根据已生成的训练样本进行测试,得出结果