本文共 1253 字,大约阅读时间需要 4 分钟。
行人检测中的遮挡问题及解决方案
基于多项损失函数的行人检测方法
论文题目:Repulsion Loss: Detecting Pedestrians in a Crowd最新研究提出了一种复杂的损失函数来解决行人检测中的密集遮挡问题。该损失函数主要由三部分组成:首先是预测框与真实目标框之间的损失值(attraction term);其次是预测框与相邻真实目标框之间的损失值(repulsion term, RepGT);最后是预测框与相邻不是对应真实目标的预测框之间的损失值(repulsion Box, RepBox)。论文中通过两个相关系数α和β来调节两种repulsion损失部分的权重,发现α和β同时设为0.5时能够取得较好的实验结果。这一方法有效地平衡了不同损失项的影响,显著提升了行人检测的准确性。Bi-box方法:一种新型行人检测策略
论文题目:Bi-box Regression for Pedestrian Detection and Occlusion Estimation本文提出了一种Bi-box回归方法,专门针对行人检测中的遮挡问题。其核心思想是通过网络同时输出两个预测框:一个用于整个行人的目标框,另一个用于可见部分的框。与传统方法不同,本文将未被遮挡的信息直接用于网络训练,强制网络同时关注完整目标和可见部分。实验结果表明,这种方法能够显著提升检测性能,主要原因在于网络获得了更全面的监督信息。然而,这种方法也存在局限性,即需要对行人目标的可见部分进行额外标注,因此在没有相关标注数据的场景下并不适用。此外,本文也为未来的研究提供了启发,即通过数据增广来丰富训练集中的遮挡类型可能成为另一个值得探索的方向。OR-CNN:crowd中的行人检测与遮挡感知方法
论文题目:Occlusion-aware R-CNN: Detecting Pedestrians in a Crowd本文提出了一种改进的两阶段R-CNN框架,名为Occlusion-aware R-CNN(OR-CNN),旨在更好地解决行人检测中的遮挡问题。该方法主要包含两个创新策略:在RPN阶段引入聚合损失(aggregation loss),在Fast R-CNN阶段引入局部区域聚焦池化单元(PORoI pooling unit)。这些策略的设计使得检测框架能够更好地处理复杂的遮挡场景,显著提高了行人检测的准确率。实验结果表明,OR-CNN在数据集上表现优于传统方法,证明该方法是有效的。此外,本文也提到该方法的延伸性和适用性,未来可能在更广泛的遮挡场景中发挥重要作用。常见两阶段RPN算法的工作原理
RPN(区域提取建议网络)是一种两阶段的行人检测框架,其主要目标是通过生成区域建议框(region proposals)、得分(scores)和特征(features)来训练辅助分类器(Boosted Forest)。这类网络通过逐步生成候选框并对其进行分类和回归,以实现精准的行人检测。转载地址:http://xjggz.baihongyu.com/