226 0

논문 데이터베이스를 위한 텍스트 기반 유사도 계산 방안

Title
논문 데이터베이스를 위한 텍스트 기반 유사도 계산 방안
Other Titles
A Text-based Similarity Measure for Scientific Literature
Author
김상욱
Keywords
텍스트기반유사도; 키워드확장; 논문데이터베이스; Text-based Similarity Measure; Keyword-extension; Scientific Literature
Issue Date
2011-10
Publisher
한국정보처리학회
Citation
정보처리학회논문지D, 18, 5, 317-322
Abstract
본 논문에서는 기존 텍스트 기반 유사도 계산 방안을 이용해서 논문들 간의 유사도를 계산하는 방안에 대해서 논의한다. 먼저, 실험을 통해 서 논문의 제목, 요약, 그리고 본문 중에서 어떤 부분이 유사도를 계산하는데 더 유용한지 확인하고 적절한 가중치를 부여한다. 두 번째로 논문의 텍스트 정보가 불완전한 상황에서 논문들 간의 유사도를 보다 정확하게 계산할 수 있는 키워드 확장 방안을 제안한다. 실제 논문 데이터베이스를 이용해서 제안하는 방안의 우수성을 검증한다. This paper addresses computing of similarity among papers using text-based measures. First, we analyze the accuracy of the similarities computed using different parts of a paper, and propose a method of Keyword-Extension, which is very useful when text information is incomplete. Via a series of experiments, we verify the effectiveness of Keyword-Extension
URI
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001601817https://repository.hanyang.ac.kr/handle/20.500.11754/70484
ISSN
1598-2866
Appears in Collections:
COLLEGE OF ENGINEERING[S](공과대학) > COMPUTER SCIENCE(컴퓨터소프트웨어학부) > Articles
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE