1404 0

머신 러닝을 적용한 노이즈 필터링 기반 오디오 컨텐츠 인식률 향상기법

Title
머신 러닝을 적용한 노이즈 필터링 기반 오디오 컨텐츠 인식률 향상기법
Other Titles
A Noise Filtering Scheme with Machine Learning for Audio Content Recognition
Author
박지홍
Alternative Author(s)
Park, Ji Hong
Advisor(s)
조인휘
Issue Date
2019-02
Publisher
한양대학교
Degree
Master
Abstract
현재(2018) 앰비언트환경에서 음원을 인식하는 기술에 대한 제품이 많이 나와있다. 샤잠, 사운드하운드, 네이버 음악검색 등 일상공간에서 재생되고 있는 음악을 인식해 음원의 정보를 제공하는 서비스가 이미 출시되어 있으며 음성을 인식하여 서비스를 제공하는 스마트 스피커 등도 활성화가 되고 있다. 하지만 실제 환경에서 오디오 신호에 잡음이 많이 포함되어 있는 경우가 많기 때문에 신호를 인식하기 어려운 경우가 많다. 잡음 환경에서 인식율을 높이기 위해 오디오 인식 알고리즘 자체도 연구가 많이 되고 있으나 잡음이 오디오 신호보다 클 경우 큰 효과를 보지 못하고 있다. 본 연구에서는 잡음을 제거하기 위한 방안으로 인공 신경망 알고리즘 중 Autoencoder를 사용하여 잡음을 제거하는 방안을 제안한다. 잡음 제거를 위해 실 생활에서 발생하는 여러 잡음을 Autoencoder에 학습시키고 이를 사용하여 잡음이 포함된 오디오 신호로부터 음원을 복원하였다. 화이트 노이즈의 경우 특정한 패턴이 없기 때문에 잡음 제거가 잘 되지 않았으나 실생활에서 발생하는 잡음 중 화이트 노이즈를 제외한 잡음은 제거가 가능할 것 이므로 화이트 노이즈에 대한 별도의 필터를 적용한다면 대부분의 잡음제거에 사용할 수 있음을 확인 할 수 있다. 추가 학습이 가능한 인공지능 신경망 알고리즘을 사용하여 능동적인 잡음 제거를 할 수 있었다.; Currently there are many products for sound recognition technology in the (2018) ambient environment. Many people already use services that recognize music being played in everyday spaces such as Shazam, Sound Hound, Naver Music Search, and provide information about the music source. In addition, smart speakers that provide voice recognition services are increasingly being used. However, in real environments, audio signals often contain a lot of noise, so it is often difficult to recognize the signal. Recognition of audio signals from the original already has a very high hit rate of over 99%, but the recognition rate in a noisy environment is very low. Accordingly, various methods such as a high frequency band filter are proposed to remove noise of an audio signal, and a method using machine learning is also actively studied. In this study, we propose a method to remove noise by using autoencoder among artificial neural network algorithms as a way to remove noise. In order to remove the noise, I used the noise generated in real life to the Autoencoder and used it to restore the sound source from the noisy audio signal. Additional learning can eliminate the changing noise.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/100017http://hanyang.dcollection.net/common/orgView/200000434983
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > ELECTRICAL ENGINEERING AND COMPUTER SCIENCE(전기ㆍ전자ㆍ컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE