278 0

주요 국가 바이오·헬스와 인공지능 융·복합 연구동향에 관한 연구

Title
주요 국가 바이오·헬스와 인공지능 융·복합 연구동향에 관한 연구
Other Titles
Trend Analysis on Convergence Research of Bio-Health and AI in Major Countries - Focus on Text Mining and Keyword Network Analysis -
Author
윤지은
Advisor(s)
서창진
Issue Date
2023. 8
Publisher
한양대학교
Degree
Doctor
Abstract
The bio-health sector is a future new growth engine industry, bringing various changes in social and economic aspects while converging and combining with core technologies of the 4th Industrial Revolution. In addition, intensive investments are being made by governments and the private sector around the world. However, the bio-health industry, unlike other industries, has enormous development costs, long-term payback, and risks of development failure, and barriers to market entry and industrialization are high for non-advanced companies with huge capital and technology, such as advanced countries or global pharmaceutical companies. Therefore, it is important to objectively grasp the research trends of existing technologies in order to narrow down the technological results with developed countries and preoccupy promising technologies in the fields of bio, health, and artificial intelligence convergence. This study quantitatively analyzed the rapidly changing trends in the bio-health field and data were analyzed for about six years from 2016 to 2021, when the Fourth Industrial Revolution was first mentioned. First, 56,455 papers in the fields of bio-health and artificial intelligence convergence published in WoS were extracted, pre-processed, and processed, and Time Series Analysis, Text Mining, LDA-based Topic Modeling, Word Cloud Visualization, and Keyword Network Analysis were conducted through Netminer 4.4.3.g. In the past, Text Mining research using general-purpose dictionaries was mainly conducted, but in this study, user dictionaries were developed based on keywords of authors of theses in the field of bio health and artificial intelligence convergence, medical and pharmaceutical terms, and terms of the 4th Industrial Revolution. It is significant in that the quality of Text Mining analysis results has been improved by constructing a user dictionary(synonyms, designated words, and stopwords) and performing text mining. The results of Frequency Analysis of the number of papers by classifying countries by corresponding author are as follows. The leading countries in the field of bio health and artificial intelligence convergence were USA, EU, China, Korea, and India. From 2016 to 2020, the number of published papers per year increased by 77% on average, and China was analyzed as the number one country for paper publication. In addition, it can be assumed that Korea is a rapidly growing research field, with an average annual increase of 90% in the number of published papers from 2016 to 2021. The top 15 key keywords were derived through keyword connection centrality analysis by year in 5 major countries and compared and analyzed. As a result of the comparative analysis, the core keywords derived over the past 6 years were derived ‘25 core keywords’ in the USA, ‘26 core keywords’ in the EU, ‘26 core keywords’ in China, ‘39 core keywords’ in Korea, and ‘31 core keywords’ in India. Through this comparative analysis, it can be predicted that the USA, EU, and China are conducting similar research by year, and that Korea and India have differences in research areas by year. The main keywords of the five major countries in the bio-health sector were 'Brain’, ‘Cancer’, ‘Hospital’, and ‘Bio-Marker', and artificial intelligence-related technologies that have emerged as major keywords for more than four years have been ‘Machine Learning’, ‘Neural Network’, ‘Cross-Validation’, ‘Random Forest’, and ‘SVM(Support Vector Machine)’. As a result of the analysis, ‘Artificial Intelligence’ appeared as a top keyword in 2019 in the USA, EU and Korea, but appeared in 2016 in China and India. The order of countries in which 'Deep Learning' appeared as a top keyword was appeared at China in 2016, at USA, EU and Korea in 2017, and at India in 2019. The result of analysis is interpreted that China started earlier than the other country. As a result of LDA-based topic modeling of thesis data of 5 major countries, 7 topics(research subject) were derived for each country and a total of 16 research topics were identified from 5 major countries. It was confirmed that the research topics commonly derived from the five major countries were 'AI medical image analysis’, ‘AI based clinical decision support system', and 'AI based new drug development'. Next, 'digital medicine(USA, EU, China, India)', 'AI based genetic analysis and precision medicine(USA, EU, China)', 'medical big data analysis(USA, China, India)', 'Smart Healthcare, Healthcare Robot(USA, EU)', 'Telemedicine, AI based Monitoring System(EU, China)', 'Neuromorphic Computing(EU, Korea)', 'Smart Wearable Device'(China, Korea)', 'artificial intelligence based synthetic medical data(China, Korea, India)', and 'intelligent IoT based health care(Korea, India)'. It was confirmed that ‘AI based diagnostic tests for infectious diseases and AI based medical devices’ derived from India did not overlap with other countries in research topics. This is interpreted as the fact that the USA, EU, and China have similar research areas, while Korea and India have different research areas. Keyword network analysis was conducted on the top 50 key words with allocation probability for each research topic in the five major countries. By analyzing the structural characteristics of the keyword network, detailed areas were analyzed focusing on co-occurring key words such as link weight and fully connected graph. This study has academic significance in that it conducted research using a quantitative method based on objective and highly credible paper data in deriving key national research topics. In addition, 16 research topics and detailed areas for each research topic were derived for 'USA, EU, China, Korea, and India', which were analyzed as leading countries in the field of bio health and artificial intelligence convergence. It is judged that it will be able to provide useful practical implications for setting the direction of future bio-health research and establishing the government's R&D policy direction and strategy.| 바이오·헬스 분야는 미래 신성장 동력 산업으로 4차 산업혁명 핵심 기술과 융·복합하면서 사회적·경제적 측면에서 다양한 변화를 불러오고 있다. 또한 전 세계적으로 정부 및 민간 주도의 집중적인 투자가 진행되고 있다. 그러나 바이오·헬스 산업은 다른 산업과 달리 개발에 대한 막대한 비용과 장기간에 걸친 투자회수, 개발 실패에 대한 위험성 등으로 인해 선진국이나 글로벌 제약사와 같이 거대 자본과 기술을 가진 선진 기업이 아닌 경우 시장 진입 및 산업화에 대한 장벽이 높다. 따라서 선진국과의 기술 결과를 좁히고 바이오·헬스와 인공지능 융·복합 분야의 유망한 기술을 선점하기 위해서는 기존 기술 연구 동향을 객관적으로 파악하는 것이 중요하다. 본 연구는 빠르게 변화해가는 바이오·헬스 분야의 흐름을 정량적으로 분석하기 위해 4차 산업혁명이 처음 언급된 2016년부터 2021년까지 약 6년간 WoS에 게재된 바이오·헬스와 인공지능 융복합 분야의 논문 56,455편을 추출, 전처리, 가공단계를 거쳐 Netminer 4.4.3.g를 통해 시계열 분석, 텍스트 마이닝, LDA 기반 토픽모델링, 워드 클라우드 시각화, 키워드 네트워크 분석을 실시하였다. 기존에는 범용 사전을 활용한 텍스트 마이닝 연구가 주로 수행되었으나, 본 연구에서는 바이오·헬스와 인공지능 융·복합 분야 논문 저자 키워드, 의학용어 및 의약품 용어, 4차 산업혁명 용어 등을 기반으로 사용자 사전(유의어, 지정어, 불용어)을 구축하여 텍스트 마이닝 함으로써 텍스트 마이닝 분석 결과의 질을 향상시켰다는 점에서 의의가 있다. 교신저자 기준으로 국가를 분류하여 논문 수를 빈도 분석한 결과 바이오·헬스와 인공지능 융·복합 분야의 선도국가는 미국, 유럽 연합, 중국, 한국, 인도로 나타났으며, 중국은 2016년부터 2020년까지 연평균 발표 논문 수가 77% 증가하여 논문 발표 1순위 국가로 분석되었다. 또한 한국은 2016년부터 2021년까지 연평균 발표 논문 수가 90% 증가하여 빠르게 성장하고 있는 연구 분야임을 추정할 수 있다. 주요 5개국의 연도별 키워드 연결중심성 분석을 통해 상위 15개 핵심 키워드를 도출하여 비교분석 하였다. 6년간 도출된 핵심 키워드는 총 미국 ‘25개’, 유럽 연합 ‘26개’, 중국 ‘26개’, 한국 ‘39개’, 인도 ‘31개’로 나타났다. 이를 통해 미국, 유럽 연합, 중국은 연도별 유사한 연구가 진행되고 있으며, 한국과 인도는 연도별 연구 분야에 차이가 있음을 추정할 수 있다. 주요 5개국에서 바이오·헬스 분야의 주요 핵심어는 ‘뇌(Brain), 암(Cancer), 병원(Hospital), 바이오마커(Bio-Marker)’로 나타났으며, 4년 이상 주요 핵심어로 등장한 인공지능 관련 기술은 ‘머신러닝(Machine Learning), 뉴럴 네트워크(Neural Network), 교차검증(Cross-Validation), 랜덤 포레스트(Random Forest), Support Vector Machine(SVM)’으로 나타났다. ‘인공지능(Artificial Intelligence)’은 미국, 유럽 연합, 한국에서 2019년에 상위 핵심어로 등장했으나, 중국과 인도는 2016년도에 등장하였다. 또한 ‘딥러닝(Deep Learning)’이 상위 핵심어로 등장한 국가 순서는 중국(2016년), ‘미국, 유럽 연합, 한국(2017년)’, 인도(2019년)로 나타나 중국이 인공지능 융·복합 분야 연구가 다른 나라에 비해 빨리 시작된 것으로 해석된다. 주요 5개국의 논문데이터를 LDA 기반 토픽모델링한 결과 각 국가별로 토픽(연구주제) 7개가 도출되었다. 국가별 연구주제의 세부 연구를 파악하기 위해 주요 5개국에서 도출된 연구주제별 할당 확률 상위 50개 핵심어를 대상으로 키워드 네트워크 분석을 실시하였다. 주요 5개국에서 도출된 핵심 연구주제와 세부 연구주제를 정리하니 상대적 관심도가 높은 연구주제는 14개 분야로 나타났다. 주요 5개국에서 공통적으로 도출된 연구주제는 ‘인공지능 의료영상 분석’, ‘인공지능 기반 임상의사결정지원시스템’, ‘인공지능 기반 신약개발’, ‘의료 빅데이터 분석’, ‘헬스케어 로봇 및 스마트 웨어러블 디바이스’, ‘인공지능 기반 합성 의료데이터’임을 확인하였다. 다음으로 ‘디지털 치료제(미국, 유럽 연합, 중국, 인도)’, ‘인공지능 기반 유전자 분석과 정밀의료(미국, 유럽 연합, 중국)’, ‘스마트홈 헬스케어(미국, 유럽 연합)’, ‘원격의료, 인공지능 기반 모니터링 시스템(유럽 연합, 중국, 인도)’, ‘뉴로모픽 컴퓨팅(유럽 연합, 중국, 한국)’, ‘인공지능 기반 의료기기(중국, 인도)’, ‘지능형 사물인터넷 기반 헬스케어(한국, 인도)’임을 확인하였다. ‘인공지능 기반 감염병 연구(미국, 유럽, 한국, 인도)’에서 미국과 유럽은 인공지능 기반 감염병 백신 개발을 중점적으로 연구하고, 한국과 인도는 인공지능 감염병 의료영상 분석 및 감염병 조기 진단을 중점적으로 연구하고 있음을 추정할 수 있다. 본 연구는 주요 국가 핵심 연구주제를 도출함에 있어서 객관성 있고 공신력 높은 논문 데이터를 기반으로 정량적 방법을 활용하여 연구를 진행했다는 점에서 학술적 의의가 있으며, 바이오·헬스와 인공지능 융·복합 분야의 선도국가로 분석된 ‘미국, 유럽 연합, 중국, 한국, 인도’를 대상으로 연구주제 14분야와 연구주제별 세부 연구 분야를 도출하여 향후 바이오·헬스의 연구방향 설정, 정부의 R&D 정책 방향 및 전략 수립에 유용한 실무적 시사점을 제공할 수 있을 것으로 판단된다.
URI
http://hanyang.dcollection.net/common/orgView/200000686131https://repository.hanyang.ac.kr/handle/20.500.11754/187231
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > BUSINESS ADMINISTRATION(경영학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE