当前位置:文档之家› 基于Padde的人流检测和红绿灯识别

基于Padde的人流检测和红绿灯识别

人流计数和红绿灯识别
PaddleDetection比赛
实现
• https:///PaddlePaddlorflow 1.0 和Pytorch之间)
人流计数
CNN因为对图像上下文的挖掘更加充分,所以在 额外提取Mask的同时能够取得更高的BBOX AP,前期的训练发现 这种效果并不突出。
3.数据增强可能会起反作用。
谢谢大家!
• 方法,修改infer,设定一个scores阈值,来对所有 检测到的目标框进行筛选计数,结果输入csv文件中。
计数
写入
红绿灯检测
数据处理VOC to COCO(用的是别人的开源代码)
数据增强 之前的数据增强,需要对标签图片和真实图片同时变化,再对变化之后 的标签图片重新生成COCO/VOC标注。因为标签图通常是二值图,所以 对多类别的处理存在问题。 结合COCO标注的json的格式特点,想到了一个新的思路,就是对真实 图片做变换的同时直接对COCO的json标签进行变化。主要有两点变化:
结果输出
• 类比于人群检测,只不过输出的是json,需要把结果放在字典中。
过程中使用到的策略
两个问题的特点,数据比较单一,容易过拟合。
最初使用的Cascade CNN,基于dcnv2_se154,X101,Se154等厚 重网络,发现收敛速度极其快,大致第1000次迭代 loss就低于0.01 ,快速收敛带来的后果是精确度上不去,人群检测错误率降到0.13 就下不去了,而红绿灯检测精确度达到90就不动了。
一是,增加增强后新的图片的info。 二是,使用原始图片的标签进行增强,增加新的图片的标注。 (分为两种,一种是标注物坐标不变(直接复制原来标注,改变两个id 即可,如,模糊噪声),二是标注物坐标发生变化(根据变化方式,调 整标注里面的坐标,并改变id,如旋转、翻转、平移)
数据增强
原图
左右旋转
模糊增强 上下旋转
COCO格式的标注
人群数据转换的实现
• 从原始标注获取有用的信息,按照新的格式放入新的字典中。
字典初始化
图片info的获取
从原始json抓取图片对应bbox信息
ห้องสมุดไป่ตู้
标注的处理
解决方法,转换关键点检测为矩形框(30*30)
两个类别
问题 忽略区
原始图片
覆盖忽略区
提交结果(写入csv文件,阈值0.4)
后续换用了Faster RCNN使用R101的主干网进行实验,主要的改动 是在人群中修改了FPN的层数,原始是5层,我加到了6层,其次就 是调用了Paddle提供的自动增强方法,这两种措施结合下,两个项 目都达到了个人最高。
认识 Mask RCNN Faster RCNN
1.模型的选择需要考虑数据的规模,对特定的数据(类别和量少), 应该使用规模适中的模型。
相关主题