1097 0

딥러닝을 이용한 분자구조 이미지 인식 및 화학 분자식 예측 성능 개선

Title
딥러닝을 이용한 분자구조 이미지 인식 및 화학 분자식 예측 성능 개선
Other Titles
Improvement of SMILES prediction from molecular structure image using deep learning
Author
김수진
Advisor(s)
김태현
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
최근 딥러닝의 발전으로 다양한 분야에서 인공지능을 활용하는 사례가 많아지고, 새로운 문제를 해결할 수 있게 되었다. 이미지 캡셔닝(Image Captioning)과 같이 기존의 문제가 확장하여 컴퓨터 비전 분야와 NLP (Natural Language Processing) 분야가 합쳐진 새로운 task도 생겼다. 또한 딥러닝의 발전은 기존의 연구 분야 이외에도 다양한 영역에서 활용하여 활발하게 연구되고 있으며, 그 중 화학이나 약학 분야에서는 새로운 재료를 탐색하거나 분자 구조로부터 물성을 예측하는 연구에 인공지능을 활용하고 있다. 분자 구조와 이에 따른 물성 정보 데이터를 기반으로 분자구조와 화합물의 물성간의 관계를 이해함으로써, 새로운 분자 구조에 대한 물성을 예측하거나 목표 물성에 맞는 새로운 화합물을 설계할 수 있다. 인공지능을 활용함으로써 목표에 맞는 재료와 물성을 스크리닝하여 개발 시간을 단축할 수 있다. 기본적으로 분자 구조 이미지나 분자식의 데이터를 기반으로 물성을 예측하기 때문에 분자 구조 이미지와 분자식의 데이터가 필요하며, 일반적으로 컴퓨터가 인지하기 쉽게 문자열의 분자 표현식으로 변환해서 사용하며, 그 중 SMILES (Simplified Molecular Input Line-Entry System)를 많이 사용하고 있다. 본 연구에서는 화학 분자 구조 이미지를 SMILES로 변환하는 모델에 대해 연구를 진행하였으며, 특히 손상된 이미지에서도 SMILES을 예측할 수 있는 방법을 제안하고자 한다. 화학 분자 구조 이미지는 화학 분자 구조를 그리는 전용의 프로그램을 이용하여 주로 생성되며, 전자 문서 형식으로 접하는 것이 일반적이다. 그러나 현실에서 접하게 되는 분자 구조 이미지는 수기 작성, 스캔 문서 등 다양한 이유로 손상된 이미지를 자주 접하게 된다. 이러한 문제를 해결하기 위해서 이미지 품질을 개선하는 모델을 결합하여 손상된 이미지에서도 분자식을 예측할 수 있는 방법을 제안하고자 한다. 먼저 화학 분자 구조 이미지로부터 분자식을 예측하는 모델은 Transformer 방식을 이용한 방법을 베이스라인 모델로 선정하였다. 베이스라인 모델에 이미지 품질 개선 모델을 결합하였을 때, 분자식 예측 성능의 차이를 확인함으로써 제안한 방법이 효과적임을 검증하였다. 이미지 품질 개선 방법은 Instance Normalization (IN)과 Group Normalization (GN), 2개의 정규화 방법을 이용하여 손상된 이미지의 왜곡 완화 및 왜곡에 대한 학습을 통해 이미지 품질을 개선함으로써 깨끗한 이미지와 동등하게 손상된 이미지에서도 분자식을 예측할 수 있는 모델을 제안하였다. 학습 방법은 추가한 이미지 품질 개선 모델만 학습함으로써, 기존의 깨끗한 이미지로 학습된 베이스라인 모델을 추가로 학습하지 않고 사용할 수 있다. 제안하는 정규화 방법을 이용한 이미지 품질 개선 모델을 결합함으로써 손상된 화학 분자 구조 이미지에서도 분자 표현식 예측 성능이 저하되지 않음을 확인할 수 있었으며, 학습되지 않은 noise한 이미지에서도 분자 표현식 예측이 가능한 알고리즘을 제시하였다.
URI
http://hanyang.dcollection.net/common/orgView/200000649676https://repository.hanyang.ac.kr/handle/20.500.11754/179811
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ARTIFICIAL INTELLIGENCE(인공지능학과) > Theses(Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE