VGG 네트워크에서 주목할 점은 매우 작은 3x3 filter를 이용하여 convolution layer를 깊게 쌓았다는 것이다. VGG 이전에는 큰 kernel size를 이용하여 receptive field 를 넓혀나갔다. 이는 너무 많은 computational cost가 요구되었기 때문에 VGG에서는 작은 kernel을 사용해 이를 보완했다. 작은 kernel size를 사용해 레이어를 깊게 쌓을 때의 이점은
- training parameter의 수를 줄임으로써 computational cost를 줄일 수 있고
- 레이어를 깊게 쌓음으로써 네트워크에 non-linearity를 증가시키는데, 이는 feature를 판별함에 있어 더 복잡한 상황에서도 유연하게 작동할 수 있음을 의미한다.
728x90