115 0

초고해상도 기법 및 기반 SRP-PHAT 방향 추정 및 추적 모델

Title
초고해상도 기법 및 기반 SRP-PHAT 방향 추정 및 추적 모델
Other Titles
Super-resolution based SRP-PHAT for sound source localization and tracking
Author
조재흥
Advisor(s)
장준혁
Issue Date
2024. 2
Publisher
한양대학교 대학원
Degree
Master
Abstract
음성 및 음향 원천의 위치 파악과 추적은 마이크 어레이를 통해 녹음된 다채널 신호를 분석하는 분야이다. 소리의 위치를 파악하는 기술은 로봇과 인간의 상호작용, 화자 분할, 음성 인식 등에 널리 사용 될 수 있다. 이 기술은 신호처리 기술을 기반으로 발전해 왔으며, 최근에는 딥러닝 기술의 발전으로 CNN, RNN과 같은 딥러닝 모델을 기반으로 하는 연구가 주를 이루고 있다. 이로 인해 신호처리 기반으로 어려움을 겪는 반향과 노이즈가 강한 환경에서의 연구에 큰 관심이 기울어지고 있다. 그 중에서도 steered response power with phase transform (SRP-PHAT) 기반 모델이 좋은 성능을 보이고 있다. 그러나 이러한 모델에도 여전히 한계점이 있다. SRP-PHAT 알고리즘은 신호처리 기반 알고리즘으로 여전히 열악한 환경에서 소리 원천의 방향을 정확하게 표현할 수 없고, 딥러닝 모델에 정확한 정보를 전달하지 못한다는 점이다. 본 논문에서는 super resolution 모델과 SRP-PHAT 기반의 소리 위치 추정 모델을 결합한 혁신적인 구조를 제안한다. 이 구조는 반향과 노이즈가 심한 환경에서도 소리 위치를 정확하게 나타내는 고품질의 SRP-PHAT 특징맵을 생성한다. 더불어, 제안된 구조는 저해상도 맵을 사용하기 때문에 SRP-PHAT 알고리즘에 사용되는 계산 비용을 낮출 수 있다. 시뮬레이션 기반 및 실제로 녹음된 데이터에 대한 실험 결과는 본 논문에서 제안된 방법이 최첨단 모델인 Cross3D보다 우수한 성과를 보임을 보여준다.
URI
http://hanyang.dcollection.net/common/orgView/200000721705https://repository.hanyang.ac.kr/handle/20.500.11754/189093
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > DEPARTMENT OF FUTURE MOBILITY(미래모빌리티학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE