Faster R-CNN中的区域提议网络（RPN）如何工作？ - 问答

第一步 输入图像经过一个卷积网络，该网络将在最后一个卷积层上输出一组卷积特征图：

第二步 这些特征图在空间上进行滑动窗口，滑动窗口的大小为n×n（此处为3×3）。对于每个滑动窗口，将生成一个9个锚点的组，它们全部具有相同的中心（xa，ya），但具有3个不同的纵横比和3个不同的比例，如下所示。注意，所有这些坐标都是相对于原始图像计算的。

另外，对于这些锚点中的每个点，计算值p *，该值指示这些锚点与地面真相边界框有多少重叠。

IoU是联合交集，定义如下：

第三步 将从这些卷积特征图（如上红色框所示）中提取的3×3空间特征馈送到一个较小的网络，该网络具有两个任务：分类（cls）和回归（reg）。

回归器的输出确定预测的边界框（x，y，w，h），分类子网的输出是概率p，指示预测的框是否包含对象（1）或来自背景（0表示没有对象）。

损失函数由两个子网的输出定义，具有2项和一个平衡因子λ。

转载https://www.quora.com/How-does-the-region-proposal-network-RPN-in-Faster-R-CNN-work?q=R-CNN

2021-01-25 22:30 更新

阿托 • 17069

理工酷