646 0

고객 불만데이터에 대한 감성분석을 결합한 텍스트 마이닝 분석

고객 불만데이터에 대한 감성분석을 결합한 텍스트 마이닝 분석
Other Titles
Text mining method based on sentiment analysis for consumer complaint data
Alternative Author(s)
Soo Hyun Lee
Issue Date
오늘날 정보통신의 발달과 인터넷의 모바일화로 인하여 장소와 시간에 관계없이 SNS(Social Network Service)를 통한 개인의 파급효과가 점차 커지고 있다. 이에 따라 고객게시판 및 SNS 등에 업로드 되는 제품에 대한 리뷰데이터와 비례하여 불만데이터 또한 기하급수적으로 증가하고 있다. 이러한 비정형데이터 형태의 고객 불만데이터가 이슈화되어 클레임으로 이어지게 되면 기업입장에서는 막대한 손실과 기업이미지의 추락을 피할 수 없게 된다. 따라서 본 논문에서는 제품에 대한 고객의 불만들이 약 5개월에서 1년 사이에 클레임으로 이어지기 이전에, 기업에 입장을 고려하여 빠른 시간 안에 불만데이터만을 확보할 수 있는 방법을 제안 하고자 한다. 대표적인 텍스트마이닝 방법 중에 하나인 TF-IDF(Term Frequency –Inverse Document Frequency)에 Riloff and Wiebe(2003)가 정의한 긍정/부정사전을 감성사전으로 적용한 나이브베이즈 분류(Naïve Bayes classifier) 방법을 결합하여 텍스트데이터에서 불만데이터 만을 분류해내는 고객불만지표로 정의하였다. 다음단계로 이렇게 정의된 고객불만지표를 활용하여 고객불만비율이 높아지는 이상 비율을 실시간으로 파악하기 위하여, 제조 공정에서 제품의 이상을 사전에 감지하기 위해 실시간 모니터링 하는 방법으로 쓰이는 다변량관리도(Multivariate control chart)를 텍스마이닝에 적용시켜 불만비율의 이상감지를 파악하기 위한 실시간 모니터링 방법으로 제안하였다. 이러한 고객불만지표를 적용한 실시간모니터링 방법을 검증하기 위하여 A기업의 고객게시판에 업로드 된 데이터에서 불만데이터가 확연히 많은 시점을 클레임급증기간, 그렇지 않은 긍정/부정 데이터의 수가 비슷한 시점을 정상기간으로 임의 설정하였고, 불만비율의 이상 감지 여부를 분석 하였다. 본 논문에서 제안한 고객불만지표를 적용한 고객불만데이터 실시간 모니터링 방법을 이용함으로써 기업은 제품에 대한 불만데이터가 클레임으로 이어지기 이전에 불만데이터를 사전에 확보 하고, 그 원인을 분석하는데 도움이 될 수 있을 것으로 기대된다.; Nowadays, due to the development of internet, the size of SNS (social network service) data are explosively increasing. Customer review data for products uploaded to customer bulletin boards can be used for earlier reliability prediction before claims. In this thesis, we propose reliability problem detection via the sentiment analysis for user conplaint data usig text mining technique. A customer complaint indicator sorting out only complaint data from text data was defined by TF-IDF (Term Frequency – Inverse Document Frequency) among typical text mining methods, and Naïve Bayes classifier method was applied to positive/negative dictionary by Riloff and Wiebe (2003) as a sentiment dictionary. In next step, in order to identify an abnormal rate related to increasing customer complaint rate in real time, an idea of a multivariate control chart as a real-time monitoring method is employed. As an example, we analyzed the user complaint data for an “A”automobile extracted from SNS data. The method to earlier detection for reliability issues.
Appears in Collections:
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.