규칙기반 데이터 증강기법을 활용한 한국어 증상발화 데이터 구축
- Title
- 규칙기반 데이터 증강기법을 활용한 한국어 증상발화 데이터 구축
- Other Titles
- Construction of Korean symptom articulation data using rule-based data augmentation technique
- Author
- 이동호
- Issue Date
- 2023-05
- Publisher
- 정보처리학회
- Citation
- 한국정보처리학회 학술대회논문집, v. 30, NO 1, Page. 360-362
- Abstract
- 건강정보 검색 요구가 증가하면서 다양한 건강정보 검색 서비스가 제공되고 있다. 하지만 최근의 건강정보 검색 서비스는 정형화 된 전문적인 의료정보와 그 해석을 제공하기 때문에 사용자는 이러한 정보를 스스로 이해하여 원하는 건강정보를 검색해야 한다. 사용자의 검색 피로를 줄이고 원하는 정보를 정확하게 얻을 수 있는 건강정보 검색 시스템 개발을 위하여 사용자의 비의료적 표현인 한국어 증상발화 데이터 구축이 선행되어야 한다. 이러한 데이터 구축은 많은 시간과 비용이 필요하기 때문에 이를 줄이기 위한 규칙기반 데이터 증강기법을 제시하고, 이를 활용하여 한국어 증상발화 데이터를 증강하였다. 증강된 데이터의 유효성을 보이기 위하여 KoBERT 기반의 증상분류 실험을 진행하였으며, 증강된 데이터가 그 전의 데이터보다 F1 스코어가 더 높음을 확인할 수 있었다.
- URI
- https://information.hanyang.ac.kr/#/eds/detail?an=edskis.4028376&dbId=edskishttps://repository.hanyang.ac.kr/handle/20.500.11754/190043
- ISSN
- 2005-0011
- Appears in Collections:
- ETC[S] > 연구정보
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML