2019-01-31 15:45

Faster RCNN: RPNs

网络结构

faster-rcnn-network.png

  1. 图像被缩放到最短边600像素,3通道
  2. 经过卷积网络(ZF模型、VGG16模型)。以ZF模型为例,每次卷积使用padding因此不改变图像尺寸,仅在pooling时长宽缩小一半,因此经过卷积网络后得到的Feature中,每个点对应原图16x16区域的信息
  3. Feature进行共享,RPNs和ROI Pooling均使用此信息,RPNs由此信息产生Region Proposal(RP)
  4. RP与Feature通过ROI Pooling后产生N个特征图
  5. 计算每个特征图的分类和边框

RPNs

接收到的尺寸为50x38x256的Feature,经过3x3x512卷积变为50x38x512,然后进入两个不同分支

  1. 分类网络,首先经过1x1x18卷积层【18=(前景/背景)两个分类x9个Anchor】,然后通过softmax选出前景区域
  2. 回归网络,首先经过1x1x36卷积层【36=(x,y偏移量+w,h缩放量)四个变量x9个Anchor】
    汇总分类网络和回归网络的信息,得到RP

RP总数量为50x38x9个,去除背景项后数量小于17100个,经过nms=0.7后数量约为2000+,取TopN作为输出(在文章中,N=300效果最优)

volica

原创文章,欢迎转载。转载请注明:转载自 我家Ai智障,谢谢!
原文链接:http://www.mclover.cn/blog/index.php/archives/323.html

你可能还喜欢...

添加新评论

icon_question.gificon_razz.gificon_sad.gificon_evil.gificon_exclaim.gificon_smile.gificon_redface.gificon_biggrin.gificon_surprised.gificon_eek.gificon_confused.gificon_cool.gificon_lol.gificon_mad.gificon_twisted.gificon_rolleyes.gificon_wink.gificon_idea.gificon_arrow.gificon_neutral.gificon_cry.gificon_mrgreen.gif

captcha
请输入验证码