기존의 Fast R-CNN 네트워크에서는 CPU 상에서 selective search 알고리즘을 계산하여 객체가 존재하는 영역을 탐색했지만, Faster R-CNN에서는 Region Proposal Network를 도입하여 end-to-end 방식으로 훈련을 시킬 수 있게 개선하였다. (논문링크)
Region Proposal Network (RPN)
- classification layer - objectnetss score를 기반으로 객체의 존재 유무에 대해 판별한다
- regression layer - bounding box의 정보값들을 뽑아낸다 coordinates: (center x, center y, width, height)
- anchor - anchor box의 개수는 default 값으로 3 scales * 3 ratios * WxH (a convolutional feature map size) 를 가진다
- loss function for RPN
- L cls - 객체의 존재 유무에 대한 loss < log loss(=cross entropy loss) >
- L reg - anchor box에 객체가 존재하는 경우에만 활성화 되는 bounding box의 coordinates값에 대한 loss < robust loss(=smooth L1 loss) >
- positive anchors - ground truth box와 겹쳤을 때 가장 높은 iou를 가지는 anchors 또는 iou가 0.7 이상이 되는 anchors
- negative anchors - iou가 0.3 이하인 anchor boxes
728x90