251 0

혼잡한 상황에 강인한 군중 수 추정방법

Title
혼잡한 상황에 강인한 군중 수 추정방법
Other Titles
Robust Method of Counting People in a Dense Crowd
Author
가기환
Alternative Author(s)
Ka, Kee Hwan
Advisor(s)
김회율
Issue Date
2009-02
Publisher
한양대학교
Degree
Master
Abstract
군중 수 추정은 입력 영상 내 군중의 숫자 또는 밀도를 자동으로 추정하는 기술로써, 영상감시의 다양한 분야에 응용 가능하기 때문에 지금까지 이에 대한 많은 연구가 진행되어 왔다. 군중 수 추정을 위한 기존의 연구에서는 영상의 특징량과 군중 수 사이에 비례 관계를 가정하여 군중 수를 추정하였다. 즉, 영상 내 특징의 양과 사람의 수 사이의 상관관계를 선형으로 가정하고 훈련을 통해 얻어진 사상함수를 통하여 군중 수를 측정하였다. 하지만, 이러한 가정은 영상 내에서 군중의 숫자가 적을 때에는 잘 성립하지만 영상 내 군중 수가 증가하면 인접한 군중간에 가려짐(occlusion)이 발생하여 특징량 손실이 발생하게 되며, 이로 인해 정확한 군중 수 추정에 어려움이 발생한다. 이러한 문제를 해결하기 위하여 특징량의 히스토그램을 이용하는 방법이나 신경망을 이용하는 방법 등이 제안되었으나, 이들 방법은 훈련에 사용된 영상의 군중 수를 벗어나는 입력 영상에 대하여서는 출력이 보장되지 않으며 또한 다양한 범위의 군중을 포함하는 실제 영상을 확보하기 어려운 문제가 있었다. 본 논문에서는 이러한 문제를 해결하기 위하여 혼잡한 영상에 강인한 군중 수 추정 방법을 제안한다. 제안한 방법에서는 전경 화소(foreground pixel)를 특징으로 하여 발생한 특징의 양으로부터 영상 내 군중 수를 추정한다. 가려짐에 의해 발생하는 특징량의 손실 정도는 카메라 각도와 영상의 혼잡도에 영향을 받는다고 가정하였으며, 손실된 특징의 양을 통계적으로 예측하기 위하여 특징량 보상 함수를 이용하였다. 이 특징량 보상 함수의 훈련을 위해서 다양한 각도와 혼잡도에서 생성된 합성 영상(synthetic image)을 이용하였다. 제안한 방법을 검증하기 위하여 합성 영상과 실제 영상을 이용하여 실험이 이루어졌으며, 실험 결과 합성 영상에서는 약92.6%, 실제 영상에서는 약89.7%의 정확도로 제안한 방법이 다양한 각도와 밀도의 변화를 갖는 영상에서 군중 수를 효과적으로 추정할 수 있음을 확인하였다.; Because of its usefulness on various applications of video surveillance, crowd size estimation to measure the amount of people in an image, has been studied extensively so far. Most of previous researches on crowd size estimation assume a linear relation between image features and the number of people in the scene. That is, a linear mapping function is trained to estimate the number of people in a scene from the amount image features. However, because of occlusions between people, this assumption on linear relation does not hold as the congestion level of a scene increase. To solve this problem, some of previous works employed histogram analysis or neural network, but they still have a limitation that the estimation result is not guaranteed to inputs that exceeds the level of crowdedness in training data. In addition, acquisition of real videos of such diverse situation which is essential for a high performance is not an easy task. To resolve this problem, we propose a crowd size estimation which is robust to complex scenes with high congestion levels. The propose method measures the size of crowds from the amount of foreground pixels while estimating loss of image features statistically. The amount of feature loss is expected by a mapping function which is trained by a series of synthetic images at various viewing angles and crowd levels. To verify the proposed method, synthetic image sequences and a real video at different camera angles and varying crowd levels are used. The proposed method effectively estimated the size of crowd with the accuracy of 92.6% and 89.7% for synthetic and real videos, respectively.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/144826http://hanyang.dcollection.net/common/orgView/200000411868
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ELECTRONICS AND COMPUTER ENGINEERING(전자컴퓨터통신공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE