논문 데이터베이스를 위한 텍스트 기반 유사도 계산 방안
- Title
- 논문 데이터베이스를 위한 텍스트 기반 유사도 계산 방안
- Other Titles
- A Text-based Similarity Measure for Scientific Literature
- Author
- 김상욱
- Keywords
- 텍스트기반유사도; 키워드확장; 논문데이터베이스; Text-based Similarity Measure; Keyword-extension; Scientific Literature
- Issue Date
- 2011-10
- Publisher
- 한국정보처리학회
- Citation
- 정보처리학회논문지D, 18, 5, 317-322
- Abstract
- 본 논문에서는 기존 텍스트 기반 유사도 계산 방안을 이용해서 논문들 간의 유사도를 계산하는 방안에 대해서 논의한다. 먼저, 실험을 통해 서 논문의 제목, 요약, 그리고 본문 중에서 어떤 부분이 유사도를 계산하는데 더 유용한지 확인하고 적절한 가중치를 부여한다. 두 번째로 논문의 텍스트 정보가 불완전한 상황에서 논문들 간의 유사도를 보다 정확하게 계산할 수 있는 키워드 확장 방안을 제안한다. 실제 논문 데이터베이스를 이용해서 제안하는 방안의 우수성을 검증한다. This paper addresses computing of similarity among papers using text-based measures. First, we analyze the accuracy of the similarities computed using different parts of a paper, and propose a method of Keyword-Extension, which is very useful when text information is incomplete. Via a series of experiments, we verify the effectiveness of Keyword-Extension
- URI
- https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001601817https://repository.hanyang.ac.kr/handle/20.500.11754/70484
- ISSN
- 1598-2866
- Appears in Collections:
- COLLEGE OF ENGINEERING[S](공과대학) > COMPUTER SCIENCE(컴퓨터소프트웨어학부) > Articles
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML