311 0

VGG16모델을 활용한 코로나 진단에 관한 연구

VGG16모델을 활용한 코로나 진단에 관한 연구
Other Titles
Diagnosing covid-19 with deep learning approach : VGG16
Alternative Author(s)
Choi, Hye Jin
Issue Date
2022. 2
2019년 12월 중국 우한에서 발생한 코로나 바이러스는 비말을 통해 전파되면서 높은 전염세를 보였고, 현재까지도 확진자가 끝없이 발생하고 있다. 코로나19는 전국민의 일상생활부터 국가 경제에 막대한 악영향을 미치고 있다. 코로나19의 진단 방법으로는 대표적으로 실시간 역전사 중합 효소 연쇄 방법이 있으며, 이는 정확하지만 검사 결과가 나오기까지 24시간이 걸린다는 단점이 있다. 최근 출시된 자가진단 키트는 검사결과가 15분 만에 나오지만 정확도가 낮은 단점이 있다. 따라서 본 연구에서는 빠르면서도 정확한 코로나19 진단 모델을 개발하고자 한다. 코로나 진단 모델을 개발하기에 앞서, 어떤 증상이 코로나 19에 가장 영향을 많이 주는지 알아보기 위해 LGBM을 사용하였다. 이를 통해서 호흡 문제(Breathing Problem), 마른기침(Dry Cough), 해외여행(Abroad travel), 열(Fever) 등이 주요 증상이라는 것을 확인하였다. 본 연구에서 제시하는 진단 모델은 사전 훈련된 CNN 모델인 VGG16으로 개발하였다. 이 모델의 정확도는 98%가 나왔으며 이는 다른 사전 훈련된 모델들인 VGG19, DenseNet, MobileNet, ResNet, Inception 보다 높은 수치였다. 본 모델은 X-ray 데이터를 입력 이미지로 사용하는 데, 모델 구조가 간단하여 학습 속도가 빠르고, 동시에 정확도가 높아서 본 연구가 해결하고자 하는 기존 검사 방법의 문제점들을 해결한다. 또한, Grad CAM을 통해서 환자의 이상 부위까지 시각화하였다. 하지만 본 연구에 몇 가지 문제점이 존재한다. 첫 번째는 딥러닝이 원래 방대한 데이터를 통해 학습을 하는 반면에, 본 연구에서 사용한 데이터 수는 현저히 적었다. 두 번째 한계점은 본 연구는 이진 분류를 하였다. 이진 분류의 경우 다중 분류에 비해 정확도가 상대적으로 높게 나온다. 마지막으로는 다른 segmentation 기법들을 적용하지 못한 점이다. 추후 이 한계점들을 보완한다면 더 뛰어난 모델을 개발할 수 있을 것이라 생각한다.|Coronavirus Disease 19(COVID-19) first broke out in Wuhan, China, in 2019. COVID-19 is highly contagious and is transmitted through respiratory droplets of different sizes. COVID-19 pandemic has impacted people’s daily lives and is slowing down the global economy. For diagnosing COVID-19, there are Real-time reverse transcription polymerase chain reaction (RT-PCR), which is the most commonly used method, and COVID-19 self-testing kit. However, the RT-PCR test takes a day or days to get the test result and COVID-19 self-testing kit shows low accuracy of the test result even though results are available within 15 minutes. Therefore, this study tries to develop a quick and accurate COVID-19 diagnosis model. Light Gradient Boosting Machine(LGBM) has been used to find out the most common signs and symptoms of COVID-19. This paper finds out that shortness of breath or difficulty breathing, dry cough, and fever are main symptoms of COVID-19. The diagnostic model presented in this paper is developed from a pre-trained CNN model, VGG16. This model shows higher accuracy than accuracies from other pre-trained models: VGG19, DenseNet, MobileNet, ResNet, Inception. This model, using X-ray data as an input image, which shows fast learning rate due to a simple structure, handles obstacles that existed from common COVID-19 diagnosing methods. Furthermore, through Gradient-weighted Class Activation Mapping(Grad CAM), abnormal areas caused by COVID-19 can be visualized. However, there are few problems in this research. While the deep learning model originally requires vast amounts of data to train, the amount of data used in this study was remarkably little. The second limitation of this study is that this study uses binary classification, which results in relatively higher accuracy than using multiclass classification. Lastly, no other segmentation methods have been applied in this study. If these limitations can be overcome, it is possible to develop a further advanced model for diagnosing COVID-19 with speed and accuracy.
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > INFORMATION SYSTEMS(정보시스템학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.