본문 바로가기

위데이터랩 도서/야사와 만화로 배우는 인공지능

[인공지능 만화] 3-2. 1등보다 빛나는 2등. VGG-16

세사에는 많은 대화가 있습니다. 이미지를 정확히는 맞히는 알고리즘 대화도 존재하죠. 바로 ILSVRC, 일명'이미지 넷 대회' 입니다.

2014년 이 대회에서 2등을 한 VGG넷이 1등을 한 구글넷보다 각광을 받고 있는데요,

VGG넷이 CNN 학습의 표준모델로 까지 자리잡을 수 있었던 이유는 CNN의 기본 아키텍처인

concolution layer/ Pooling layer/ Fully connected layer 만을 사용해서 만들었기 때문입니다.

다른 모델에 비해 배우기 쉬운 것이죠.

VGG-16 모델은 아래와 같이 구성되어 있습니다.

위 그림을 단순화시켜서 그려보면 아래와 같습니다.

너무 단순와시켰나요?

약간 추가정보를 넣어보면 다음과 같습니다.

앞의 그림을 부연 설명하자면

VGG모델을 만든 곳은 옥스포드 대학 연구팀입니다.

Visual

Geometry

Group

앤드류 지세르만 교수/카렌시몬얀

VGG팀의 지도 교수 지세르만은 컴퓨터 비전 분야의 대가입니다.

컴퓨터 비전 연구원에게 최고의 영예인 마아 프라이즈를 3번이나 수ㅅ상한 유일한 인물이죠.

(컴퓨터 비전은 인간의 시각이 하는 몇가지 일을 수행하는 자율적인 시스템을 만드는 것을 목표로 한답니다.

지세르만 교수는 이미지만을 보고 3D로 구현하는 MVG(Multiple/View/Geometry)등 인간이 풀지 못하는 문제를 '컴퓨터 비전'으로 풀 수 있음을 보여주었답니다.

리차드 하틀리와 함께 저술한 책은 컴퓨터 비전 계의 교과서처럼 여겨지고 있습니다.

2012년 이미지 넷 대회에서 딥런닝을 활용한 알렉스넷이 우승하면서 딥러닝이 인기를 얻자

지세르만 교수는 제자인 카렌 시몬얀과 컴퓨터 비전에 딥러닝을 결합해보자는 아이디어를 냅니다.

그렇게 그들은 알렉스넷과 유사한 VGG-F, VGG-M, VGG-S라는 초기 모델을 만들어냈고 이를 더 발전시킨 VGG넷으로 2014년 이미지넷 대회 준우승이라는 쾌거를 이루낸 것이랍니다.

2014년 이미지 넷 대회 준우승 이루 지세르만 교수는 구글 딥마인드에 스카웃 되었고

카렌 시몬얀 역시 구글 딥마인드에 들어가 알파고 제로 프로젝트에 참여하는 등 활발한 연구를 걔속하고 있습니다.

한편 VGG팀은 지속적인 연구를 통해 2015년 VGG-Face를 개발했습니다. 4대 열굴인식 알고리즘 중 하나로 인정받고 있답니다.

(출처)

https://bskyvision.com/504

 

[CNN 알고리즘들] VGGNet의 구조 (VGG16)

LeNet-5 => https://bskyvision.com/418 AlexNet => https://bskyvision.com/421 VGG-F, VGG-M, VGG-S => https://bskyvision.com/420 VGG-16, VGG-19 => https://bskyvision.com/504 GoogLeNet(inception v1) =>..

bskyvision.com

https://arxiv.org/pdf/1409.1556.pdf

https://www.robots.ox.ac.uk/~vgg/data/

 

Visual Geometry Group - University of Oxford

 

www.robots.ox.ac.uk

https://ichi.pro/ko/eolgul-insig-paipeu-lain-i-myeonghwaghage-seolmyeong-doem-269929031411536

 

얼굴 인식 파이프 라인이 명확하게 설명 됨

얼굴 인식 파이프 라인에 사용되는 최첨단 알고리즘을 소개합니다. 얼굴 인식은 비디오 또는 사진에서 얼굴을 사용하여 개인을 식별하거나 확인하는 기술입니다.

ichi.pro

https://www.robots.ox.ac.uk/~vgg/

 

Visual Geometry Group - University of Oxford

 

www.robots.ox.ac.uk

https://en.m.wikipedia.org/wiki/Andrew_Zisserman

 

Andrew Zisserman - Wikipedia

In 1984 he started to work in the field of computer vision at the University of Edinburgh. Together with Andrew Blake they wrote the book Visual reconstruction published in 1987, which is considered one of the seminal works in the field of computer vision.

en.m.wikipedia.org

https://www.chessprogramming.org/Karen_Simonyan

 

Karen Simonyan - Chessprogramming wiki

From Chessprogramming wiki Home * People * Karen Simonyan Karen Simonyan, a British computer scientist and researcher at Google DeepMind, involved in the WaveNet speech synthesis system, and in the AlphaGo Zero and AlphaZero projects. He received his Ph.D.

www.chessprogramming.org

https://towardsdatascience.com/step-by-step-vgg16-implementation-in-keras-for-beginners-a833c686ae6c

 

Step by step VGG16 implementation in Keras for beginners

VGG16 is a convolution neural net (CNN ) architecture which was used to win ILSVR(Imagenet) competition in 2014. It is considered to be…

towardsdatascience.com

https://towardsdatascience.com/cnn-architectures-a-deep-dive-a99441d18049

 

CNN Architectures, a Deep-dive

Implementing every popular CNN architecture out there.

towardsdatascience.com

https://www.iammercedes.com/2020/07/13/vgg-16-image-classification/

 

VGG-16 customised architecture for flower classification – I am Mercedes

The purpose of this article is to discuss the experiments and results obtained from customising a standard CNN architecture for an image classification task using Python. The standard architecture chosen for the image classification task is VGG-16 and the

www.iammercedes.com


적송 권건우 

https://blog.naver.com/redpine71 

 

 

적송 숲에서 한가로이 거닐다 : 네이버 블로그

동서문명 탐구의 기난긴 여정

blog.naver.com

공무원을 꿈꾸며 대학에 들어갔으나 동서양문화에  심취하여 수많은 사부님들을 찾아다녔고 기나긴 갈 구끝에 서울 인사동과 중국 하남성 황토벌판 그리고  실리콘밸리에서 스승을 만났다. 지금은 산에서 내려 와 많은 친구들과 동서문명을 융합시키는 새로운 도 전의 여정에 있다. 그 중 하나로 빅데이터와 인공지 능의 본질을 연구하고 쉽게 전달하는 전도사로 활약 하고 있다. 

現 위데이터랩 대표이사 

現 디랩아카데미 원장 

現 성균관대, 한양대 겸임교수 

現 세계진소왕태극권총회 서울분회장 

現 국제서법연합 한국본부 사무차장 

前 삼성SDS Technical Architect 

 

가인

www.instagram.com/ga_casso

하루를 더 생생하게 기억하기 위해 일기장에 사진을 따라 그리는 것으로 그림을 그리기 시작했다. 가카소는 스스로 만든 별명인데 피카소처럼 재미난 그림을 그린다는 의미로 지었다. 미디어커뮤니케이션과 경영학을 전공하며 콘텐츠 기획에 관심을 갖게 되었고, 자전거·드럼·그림 등 다양한 취미를 갖고 있다. 항상 ‘한다면 한다’는 마인드로 새로운 것에 도전하며 꿈을 찾아가는 중이다.

 

전준혁

https://student-jjh.github.io/new/

 

Document

Now 지금 하고 있는 활동들

student-jjh.github.io

 

경영학을 전공으로 하는 학생. 우연히 갖게된 인공지능 역사탐구를 통해 공부의 방향성과 융합적 사고의 중요성을 알게 되었다. 경영학이 다양한 학문과의 관계 속에서 발전할 수 밖에 없는 학문이라는 것을 알게 되면서 코딩과 통계학 등 다양한 학문의 기초분야에 관하여 공부하고 있다.

 

루나 허령

 

https://brunch.co.kr/@hvnpoet 

 

루나의 브런치

야만인이야기 만화가 | 마음공부하는 천상시인 루나의 브런치입니다. #마음공부 #모델링 #마인드맵 #서예 #진소왕태극권 #천상병 #서울데이터과학연구회 #물질이개벽되니정신을개벽하자 #곳곳

brunch.co.kr

 

컴퓨터과학과 소프트웨어공학을 전공하고, 지금 은 금융회사의 상품과 서비스를 분석, 설계, 구현하 는 일을 하고 있다. 대학 초년생 시절 마인드맵을 접 한 이후 즐겁게 생각하는 방법을 깨달았고, 소프트웨 어공학의 모델링 사상을 이해하고부터는 마인드맵과 모델링을 아우르는 마인드맵모델링을 연구 중이다. 세상에 대한 공학적인 접근 이외에도 마음공부와 서 예, 태극권 등으로 자신과 세상의 경계를 넘어 진리 를 탐구하고 있다.

現 삼성SDS Principal Engineer