78 0

Novel Anomaly Detection Research for Diverse Clinical Cases in Otorhinolaryngology

Title
Novel Anomaly Detection Research for Diverse Clinical Cases in Otorhinolaryngology
Author
송다혜
Alternative Author(s)
Dahye Song
Advisor(s)
Yeonjoon Lee
Issue Date
2024. 2
Publisher
한양대학교 대학원
Degree
Master
Abstract
Novel Anomaly Detection Research for Diverse Clinical Cases in Otorhinolaryngology DaHye Song Dept. of Applied Artificial Intelligence Major in Bio Artificial Intelligence The Graduate School of Hanyang University In otolaryngology, diagnostic accuracy varies due to reliance on practitioners' expertise. To address this issue, AI research has been applied, focusing on unsupervised learning-based anomaly detection due to the limitations of supervised learning in handling cases outside its training domain. This method leverages errors in image reconstruction as abnormality scores, enabling the detection of a wide range of anomalies using only normal case data. The complexity of tympanic membrane images, such as depth and transparency, challenged effective anomaly detection. To overcome this, semantic decomposition techniques like Adaptive Histogram Equalization and Canny edge detection were used, enhancing feature isolation for accurate anomaly detection (94.5% accuracy) using a Variational AutoEncoder. Additionally, the cooperative observation network, employing a dual encoder and GAN's discriminator, analyzes a wider range of diagnostics. This approach eliminates the decoding process required in traditional methods, significantly boosting computational efficiency and detection accuracy, achieving 96.75% accuracy with low computational costs.|이비인후과에서의 진단은 진단자의 경험과 방식에 크게 의존하기 때문에, 정확도에 상당한 차이가 발생한다. 예를 들어, 진주종과 같은 중이 질환은 조기 진단이 이루어지지 않을 경우 청력 상실이나 안면 마비와 같은 심각한 결과를 초래할 수 있어, 진단 정확도의 표준화가 매우 중요하다. 이러한 문제를 해결하기 위해,이비인후과 분야에서 인공지능 기술의 적용을 위한 연구가 지속적으로 진행되고 있다. 기존의 연구들은 고막 내시경 이미지의 복잡도가 높다는 점을 고려하여 대부분 지도학습에 기반을 두어 왔다. 그러나, 이러한 지도학습 기반 진단 시스템은 학습 데이터와 다른 예외적인 경우들에 대해 질병을 정확히 예측하기 어렵기 때문에 실제 의료 환경에서 다양한 임상 케이스에 대응하기 어렵다는 한계점을 가지고 있다. 이러한 지도학습의 한계를 극복하고자, 비지도학습을 기반으로 한 anomaly detection 연구가 진행되어 왔다. 이 접근 방식에서는 정상 케이스의 데터만을 학습시킨 후, 비정상 데이터가 입력되면 모델이 이미지를 재구성하는과정에서 발생하는 오류를 이상 점수로 활용한다. 이 방법은 지도학습과 달리 정상 케이스의 학습 데이터만 있으면 모든 범위의 이상 케이스를 감지할 수 있는 장점이 있다. 그러나 이비인후과에서 사용되는 고막 내시경 사진은 고막의 투명도, 색상,깊이 등 해부학적 요소가 매우 복잡하게 얽혀 있어, 원본 이미지만을 사용한anomaly detection 연구에서는 좋은 성과를 얻기 어려웠다. 이 문제를 해결하기 위해, 고막의 임상적 특징을 기반으로 내시경 이미지에 대한 의미론적 분해를 시도했다. 이 과정에서 Adaptive Histogram Equalization을 통해 고막 내시경 이미지에서 RGB 정보를 제외하고, 병변의 깊이와 고막의 투명도 같은 중요 정보만을 추출했다. 또한, Canny edge detection을 사용하여 고막의 구조적 정보만을 남겨 처리했다. 이렇게 처리한 이미지들을 Variational AutoEncoder에 학습시켜, K-NN 알고리즘을 이용하여 94.5%의 높은 정확도로 이상을 감지할 수 있었다. 전통적인 anomaly detection 방법은 재구성 오류를 사용하기 때문에, 계산 비용이 많이 드는 디코딩 과정에 의존한다. 또한, 이러한 방식은 재구성 오류를 통해 이상 점수를 추출하고 이를 다시 분류하는 이중의 작업을 필요로 한다. 이에 대한 해결책으로, cooperative observation network를 도입했다. 이 시스템은 Dual encoder와 GAN의 discriminator를 활용하여 고막 내시경 이미지뿐만 아니라 청력 검사 결과까지 분석하여, 보다 넓은 범위의 진단을 가능하게 한다. 이 시스템에서는 discriminator에 cross-attention으로 결합된 두 변수의 데이터를 실제 데이터로 활용하며, 이를 기반으로 임의로 생성된 데이터를 가짜 데이터로 학습시킨다. 이러한 접근 방식은 기존의 anomaly detection 연구에서 요구되는 디코딩 과정을 완전히 제거하고, discriminator를 통해 한 번에 감지 결과를 추출함으로써 계산 비용과 감지 과정의 효율성을 크게 개선하였다. 이 방법은 96.75% 라는 높은 정확도를 달성하면서도 낮은 계산 비용을 유지하는 데 성공했다.
URI
http://hanyang.dcollection.net/common/orgView/200000725234https://repository.hanyang.ac.kr/handle/20.500.11754/188849
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > APPLIED ARTIFICIAL INTELLIGENCE(인공지능융합학과) > Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE