1231 0

SGNet : 실시간 얼굴 및 랜드마크 검출을 위한 DCNN 최적 설계

Title
SGNet : 실시간 얼굴 및 랜드마크 검출을 위한 DCNN 최적 설계
Other Titles
SGNet : Optimized DCNN design for face and landmark real-time detection
Author
이승현
Alternative Author(s)
Lee, Seung Hyun
Advisor(s)
조인휘
Issue Date
2018-02
Publisher
한양대학교
Degree
Master
Abstract
최근에 음성인식과 영상인식, 번역 등 다양한 분야에 걸쳐 Deep Learning 이 적용되고 있다. 이러한 여러 가지 일들을 하나의 네트워크에서 한꺼번에 처리하는 통일(Unified) Network를 설계하는 것이 최종 목표로, 본 논문에서는 우선 영상인식을 대상으로 하여 최고의 처리 속도와 최소의 모델 크기를 구하기 위한 네트워크 최적화 기법을 제안하였다. 카메라 영상을 통해 들어온 각 프레임 이미지에서 얼굴들을 검출하고 개개의 얼굴마다 랜드마크라고 부르는 윤곽 라인 포인트를 검출하는 것을 목표로 하였다. 2017년까지 제시된 검출 알고리즘들 중 가장 최고의 성능을 보여주는 2 가지 DCNN들의 장점을 모아서, 서로의 단점을 보완하였다. 기존에 거의 모든 얼굴/물체 검출 알고리즘이 사용하는 슬라이드 윈도우 방식처럼 단순하게 전체 이미지를 Brutal Force로 탐색하는 비효율적인 방식 대신, Grid 기반의 단일 검색으로 물체를 찾아내는 기법을 활용했다. 하나의 깊은 DCNN을 설계하는 대신 3 단계 네트워크로 나누어서, 큰 얼굴을 전문적으로 찾아내는 DCNN과 작은 얼굴을 전문적으로 찾는 DCNN, 마지막으로 각 얼굴의 랜드마크를 찾아내는 DCNN 등으로 나누어 설계하였다. Caffe, Darknet, Tensorflow, Theano 를 사용하여 다양한 시뮬레이션을 수행했고, 가장 최적의 성능을 보여주는 프레임워크와 네트워크 구조를 선정했다. Transfer Learning을 통해 네트워크를 점차적으로 축소시키면서 재학습시켰고, 3 가지 가속화 기법을 적용하여 416x416 로 resize된 이미지 처리 속도는 0.015초, 검출 성능은 98%의 높은 검출률을 얻었다. 비교 대상으로 삼은 얼굴 검출 DCNN인 MTCNN과 비교했을 때, 66배의 속도 향상과 약 20%의 검출률 향상률이 있었다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/68850http://hanyang.dcollection.net/common/orgView/200000432177
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ETC
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE