본문 바로가기

위데이터랩 도서/야사와 만화로 배우는 인공지능

[인공지능 만화] 48. 1등보다 빛나는 2등, VGG-16

 

 

세상에는 많은 대회가 있습니다.

이미지를 정확히 맞히는 알고리즘 대회도 존재하죠.

바로 ILSVRC, 일명 '이미지넷 대회' 입니다.

 

 

 

2014년 이 대회에서 2등을 한 VGG 넷

1등을 한 구글넷보다 각광을 받고 있는데요,

 

 

 

VGG넷이 CNN 학습의 표준모델로까지 자리잡을 수 있었던 이유는

CNN의 기본 아키텍처Convolution layer, Pooling layer, Fully connected layer 만을 사용해서 만들었기 때문입니다.

다른 모델에 비해 배우기 쉬운 것이죠.

 

 

 

VGG-16 모델은 아래와 같이 구성되어 있습니다.

 

 

 

앞의 그림을 부연 설명하자면

 

 

 

VGG 모델을 만든 곳은 옥스포드 대학 연구팀입니다. 

 

 

 

VGG팀의 지도교수 지세르만컴퓨터 비전 분야의 대가입니다.

컴퓨터 비전 연구원에게 최고의 영예인

마아 프라이즈를 3번이나 수상한 유일한 인물이죠.

 컴퓨터 비전은 인간의 시각이 하는 몇 가지 일을 수행하는 자율적인 시스템을 만드는 것을 목표로 한답니다.

 

 

 

 

지세르만 교수는 이미지만을 보고 3D로 구현하는 MVG기법

인간이 풀지 못하는 문제를 '컴퓨터 비전'으로 풀 수 있음을 보여주었답니다.

리차드 하틀리와 함께 저술한 책은 컴퓨터 비전 계의 교과서처럼 여겨지고 있습니다. 

 

 

 

2012년 이미지넷 대회에서 딥러닝을 활용한 알렉스넷이 우승하면서 딥러닝이 인기를 얻자

지세르만 교수는 제자인 카렌 시몬얀컴퓨터 비전에 딥러닝을 결합해보자는 아이디어를 냅니다.

 

 

 

그렇게 그들은 알렉스넷과 유사한

VGG-F, VGG-M, VGG-S라는 초기 모델을 만들어냈고

이를 더 발전시킨 VGG 넷으로 2014년 이미지넷 대회 준우승이라는 쾌거를 이루어낸 것이랍니다.

 

 

 

2014년 이미지넷 대회 준우승 이후

지세르만 교수는 구글 딥마인드에 스카웃되었고 

카렌 시몬얀 역시 구글 딥마인드에 들어가 알파고 제로 프로젝트에 참여하는 등 활발한 연구를 계속하고 있습니다.

 

 

 

한편 VGG팀은 지속적인 연구를 통해

2015년 VGG-Face를 개발했는데 

4대 얼굴인식 알고리즘 중 하나로 인정받고 있답니다. 

 


49화 (2월 22일 금요일)에 계속됩니다.