当前位置：文档之家› 基于Padde的人流检测和红绿灯识别

基于Padde的人流检测和红绿灯识别

人流计数和红绿灯识别
PaddleDetection比赛
实现
• https:///PaddlePaddlorflow 1.0 和Pytorch之间）
人流计数
CNN因为对图像上下文的挖掘更加充分，所以在额外提取Mask的同时能够取得更高的BBOX AP，前期的训练发现这种效果并不突出。
3.数据增强可能会起反作用。
谢谢大家！
• 方法，修改infer，设定一个scores阈值，来对所有检测到的目标框进行筛选计数，结果输入csv文件中。
计数
写入
红绿灯检测
数据处理VOC to COCO（用的是别人的开源代码）
数据增强之前的数据增强，需要对标签图片和真实图片同时变化，再对变化之后的标签图片重新生成COCO/VOC标注。因为标签图通常是二值图，所以对多类别的处理存在问题。结合COCO标注的json的格式特点，想到了一个新的思路，就是对真实图片做变换的同时直接对COCO的json标签进行变化。主要有两点变化：
结果输出
• 类比于人群检测，只不过输出的是json，需要把结果放在字典中。
过程中使用到的策略
两个问题的特点，数据比较单一，容易过拟合。
最初使用的Cascade CNN，基于dcnv2_se154，X101，Se154等厚重网络，发现收敛速度极其快，大致第1000次迭代 loss就低于0.01 ，快速收敛带来的后果是精确度上不去，人群检测错误率降到0.13 就下不去了，而红绿灯检测精确度达到90就不动了。
一是，增加增强后新的图片的info。二是，使用原始图片的标签进行增强，增加新的图片的标注。（分为两种，一种是标注物坐标不变（直接复制原来标注，改变两个id 即可，如，模糊噪声），二是标注物坐标发生变化（根据变化方式，调整标注里面的坐标，并改变id，如旋转、翻转、平移）
数据增强
原图
左右旋转
模糊增强上下旋转
COCO格式的标注
人群数据转换的实现
• 从原始标注获取有用的信息，按照新的格式放入新的字典中。
字典初始化
图片info的获取
从原始json抓取图片对应bbox信息
ห้องสมุดไป่ตู้
标注的处理
解决方法，转换关键点检测为矩形框(30*30)
两个类别
问题忽略区
原始图片
覆盖忽略区
提交结果(写入csv文件,阈值0.4)
后续换用了Faster RCNN使用R101的主干网进行实验，主要的改动是在人群中修改了FPN的层数，原始是5层，我加到了6层，其次就是调用了Paddle提供的自动增强方法，这两种措施结合下，两个项目都达到了个人最高。
认识 Mask RCNN Faster RCNN
1.模型的选择需要考虑数据的规模，对特定的数据(类别和量少)，应该使用规模适中的模型。

e商务文档

基于Padde的人流检测和红绿灯识别

相关文档推荐：