ML Paper 5

[ML Paper] ScribbleSup: Scribble-Supervised Convolutional Networks for Semantic Segmentation

Segmentation을 위해 labeling을 하는 단계는 시간도 오래 걸리고 힘든 작업이다. 이를 좀 더 효율적이고 덜 고통스럽게 해주는 레이블링 방식이 등장했는데 그것이 바로 Scribble이다. 찾고자 하는 객체의 엣지를 따라 레이블링 하는 것이 아니라 객체를 단어 그대로 휘갈기듯이, 객체에 선을 그어주면서 레이블링 한다. (논문링크) ScribbleSup Network의 전반적인 구조 ScribbleSup Network는 Fully Convolutional Network 와 Graphical Model 두 부분으로 나뉜다. 첫 단계는 scribble 방식으로 레이블링 된 정보를 가지고 segmentated Image를 뽑아내는 Graphical Model 단계를 거치고, 이 labeled seg..

ML Paper 2022.05.23

[ML Paper] R2CNN-Rotational Region CNN for Orientation Robust Scene Text Detection

R2CNN은 axis-aligned bounding boxes (모든 면의 법선이 좌표축과 일치하는 박스)를 기반으로 inclined bounding boxes (aabb가 임의의 방향으로 회전된 박스)를 제안해 객체를 탐지하는 네트워크다. Faster R-CNN을 기반으로 만들어진 네트워크이기 때문에 Region proposal network에서 axis-aligned bbox를 찾아내고, Roi pooling 단계에서 정해진 사이즈로 feature들을 뽑아준 후 concatenate 시킨다. 후에 inclined non maximum suppression 을 거쳐서 회전된 boxes의 결과물을 얻을 수 있다. (논문링크) Region Proposal Network RPN 단계에서는 axis-align..

ML Paper 2022.05.23

[ML Paper] VGG-Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG 네트워크에서 주목할 점은 매우 작은 3x3 filter를 이용하여 convolution layer를 깊게 쌓았다는 것이다. VGG 이전에는 큰 kernel size를 이용하여 receptive field 를 넓혀나갔다. 이는 너무 많은 computational cost가 요구되었기 때문에 VGG에서는 작은 kernel을 사용해 이를 보완했다. 작은 kernel size를 사용해 레이어를 깊게 쌓을 때의 이점은 training parameter의 수를 줄임으로써 computational cost를 줄일 수 있고 레이어를 깊게 쌓음으로써 네트워크에 non-linearity를 증가시키는데, 이는 feature를 판별함에 있어 더 복잡한 상황에서도 유연하게 작동할 수 있음을 의미한다.

ML Paper 2022.05.23

[ML Paper] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

기존의 Fast R-CNN 네트워크에서는 CPU 상에서 selective search 알고리즘을 계산하여 객체가 존재하는 영역을 탐색했지만, Faster R-CNN에서는 Region Proposal Network를 도입하여 end-to-end 방식으로 훈련을 시킬 수 있게 개선하였다. (논문링크) Region Proposal Network (RPN) classification layer - objectnetss score를 기반으로 객체의 존재 유무에 대해 판별한다 regression layer - bounding box의 정보값들을 뽑아낸다 coordinates: (center x, center y, width, height) anchor - anchor box의 개수는 default 값으로 3 sca..

ML Paper 2022.05.23

[ML Paper] Selective Search for Object Recognition

Selective Search는 2012년에 처음 등장한 알고리즘으로 (논문링크), object가 존재할 만한 위치를 찾아준다. Selective Search는 기존의 pyramid & sliding window 방식이 갖고 있는 처리 속도의 문제점을 대폭 개선시켰다. 저자에 따르면, 이 방법은 exhaustive search 와 segmentation의 장점을 결합시켰다고 한다. exhaustive search --> 완전 탐색은 문제가 주어졌을 때 가능한 모든 경우를 비교하여 끝날 때까지 답을 계속 찾아나가는 방식이다. 여기서는 객체가 존재하는 모든 가능한 locations 을 파악하고 비교해 나간다. segmentation --> 다른 객체일 것으로 판별되는 pixel들을 cluster하여 이미지의..

ML Paper 2022.05.23
728x90