466 0

텍스트 내용 기반 추천을 위한 토픽추출의 영향에 대한 연구 : K금융사 중심으로

Title
텍스트 내용 기반 추천을 위한 토픽추출의 영향에 대한 연구 : K금융사 중심으로
Other Titles
A study of topic detection in text-content based recommendation : focused on K financial company
Author
이지성
Alternative Author(s)
Lee, Ji Sung
Advisor(s)
이기천
Issue Date
2020-02
Publisher
한양대학교
Degree
Master
Abstract
오늘 날 기업은 뛰어난 인적 자원이 기업 경영에 가장 중요한 자원임을 인식하고, 구성원의 기술, 지식, 능력 개발을 위해 다양한 교육훈련 프로그램을 운영하고 있다. 특히, 온라인 네트워크를 활용한 이러닝 강의는 기업 측면에서 비용 절감이 가능하고, 오프라인에 집합하지 않아도 교육을 받을 수 있는 편리함 및 학습자에게 다양한 학습 컨텐츠를 제공할 수 있는 장점을 갖고 있어 빠른 속도로 확산되고 있다. 그러나 학습 컨텐츠가 확대됨에 따라 수강자들은 모든 컨텐츠의 정보에 대해 알 수가 없으며, 이로 인해 본인이 원하는 컨텐츠를 선택할 수 없는 '정보 과부하'라는 문제가 생기기도 한다. 이러한 문제를 해결할 수 있는 방안 중 하나로 최근 '개인화 추천 서비스'가 대두되고 있다. 국내 K금융사도 이러한 추세를 반영하여 임직원들의 자기 계발을 위한 방법의 하나로 이러닝 컨텐츠 운영 비율을 높이려 하고 있으며, 그에 대한 조치로 최근 대대적인 임직원 이러닝 사이트 개편을 시행하였다. 그러나 사이트 개편 이후 개인화 추천 서비스를 운영하려고 하나, 초기 선택된 아이템에 대한 정보 없이 협업 필터링 추천 방식을 사용할 수 없고, 내용 기반 추천방식을 사용할 경우 개인별 계발 방향과 관심사를 반영한 추천이 되지 못할 확률이 높아 적절한 개인화 추천 서비스가 운영되지 못하고 있는 실정이다. 개인화 추천 서비스 통해 정보 과부하 현상을 방지하기 위해 HRMS Human Resource Management System (인사정보관리시스템)에 보유 중인 '자기 계발 계획서' 데이터를 근거로 데이터 마이닝 기법을 이용해 이를 토픽별로 분류하고 분류된 토픽을 사용자의 대표 성향으로 판단하는 기법을 도출하는 것이 본 논문의 목적이다. 따라서, 본 논문에서는 문장 단위 임베딩의 대표적 기법인 Doc2Vec과 LDA 기법을 사용하여 각 토픽의 핵심 단어를 추출하여 설문 평가를 통해, 데이터 특성에 맞는 문장 임베딩 기법을 찾았다. 실험결과 Doc2Vec기법의 경우 10개의 적정 토픽이 생성되었으며, LDA기법의 경우 14개의 적정 토픽이 생성되었다. 각 토픽별 상위 5개 단어를 추출하여, 설문을 통해 상위 5개 단어와 자기 계발 계획서 내용상 더 유사한 기법이 무엇인지 조사하였다. 설문 집계 결과 Doc2Vec기법 보다 LDA기법이 32% 더 우수함을 확인하였고, 특히 600자 이상의 자기 계발 계획서에 대해서는 LDA 기법이 Doc2Vec 기법보다 72% 더 우수하다는 결론을 도출하였다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/122933http://hanyang.dcollection.net/common/orgView/200000437736
Appears in Collections:
GRADUATE SCHOOL OF ENGINEERING[S](공학대학원) > MECHANICAL AND PLANT ENGINEERING(기계ㆍ플랜트공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE