확률 모델; 텍스트 기반 유사도; 텍스트 기반 유사도; scientific papers; probabilistic model
Issue Date
2014-03
Publisher
한국정보과학회
Citation
정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터, v.20 no.3[2014년], pp. 186-190
Abstract
본 논문에서는 실제 학술 논문 데이터 셋을 사용하여 벡터 공간 모델 및 확률 모델을 바탕으로 하는 텍스트기반 유사도 척도들의 유효성을 평가 및 비교한다. 다양한 실험 결과를 통해 벡터 공간 모델 기반의 유사도 측정방법이 학술 논문간의 유사도 측정에 더 적합함을 보인다.In this paper, we evaluate and compare the effectiveness and efficiency of the text-based similarity measures based on the vector space model and probabilistic model for scientific papers by using a real-world dataset. Our extensive experimental results show that the similarity measures based on the vector space model are more appropriate to compute the similarity of scientific papers.