107 0

온라인 리뷰와 고객 매장 방문의 관계에 미치는 가짜 리뷰 비율의 조절효과

Title
온라인 리뷰와 고객 매장 방문의 관계에 미치는 가짜 리뷰 비율의 조절효과
Other Titles
Online review and customer store visit: the moderating effect of the proportion of fake reviews
Author
황서연
Advisor(s)
김종우
Issue Date
2024. 2
Publisher
한양대학교 대학원
Degree
Master
Abstract
With the recent growth of online review platforms, many consumers read online reviews before visiting restaurants or deciding to purchase products. However, with the growth of online review platforms, fake reviews are also have increased exponentially. Sellers make a fortune by leaving reviews for competitors or leaving positive ratings for competitors through fake review companies. Due to the financial incentives gained from review manipulation, sellers have become more active in using review manipulation strategies. as a result, fake reviews are increasing, and for the online review platform YELP in the United States, it is estimated that fake reviews account for 20% of all reviews. With this surge in fake reviews, it has become difficult for consumers to get the right information through online reviews, and they are confused by uncertainty in the purchase decision step. These changes in customer purchase intentions have a positive effect on a company's sales in the early stages of review manipulation, but research has shown that they have a negative impact on product sales over time. Therefore, online review platforms need to know how fake reviews affect consumers' perception of online reviews for companies' sales management and customers' correct purchase decisions. Therefore, this research analyzes the factors of reviews that affect customer visits using the amount of reviews, reviews ratings, the number of votes received, reviews' sentiment scores, and the ratio of elite reviews, and examines the moderating effect of fake review rate in the relationship between these factors and customer visits. Previous studies on the impact of fake reviews focused on quantitative factors such as the sentiment of the review and the length of the review. However, these studies have a limitation in that they do not reflect information such as user votes and elite reviews provided by recent review platforms. Most of the studies examining the effects of fake reviews used the number of fake reviews as an independent variable and focused on the direct effect of the number of fake reviews on sales. However, some studies have shown that fake reviews do not directly affect product sales. Therefore, this study examined the relationship between the elements of the review and the number of customer visits by adding several other variables as well as text features, and examined the moderating effect of ratio of fake review in these relationships. It also collected fake review data from as many restaurants as possible and aimed to study through rich fake review data. This study basically used the academic dataset provided by Yelp. Data from 54454 restaurants with data on the number of customer visits were extracted, and price range and ratings of the restaurant were extracted. After that, the number of customer visits was organized by week number and restaurant, and the number of previous week customer number of visits was matched. At this time, if there were no customer visits in the previous week, it was treated as 0. After that, crawling fake reviews about 54554 restaurants, and restaurant review data were generated by combining them with the normal review data of academic data. After that, the review was processed by stop word processing and removing special characters, and the sentiment score of the review was measured using the VADER model. Independent variables were calculated by cumulatively calculating restaurant review data. Finally, the review data were combined with each number of week in the restaurant data to generate the final data. After that, hierarchical regression analysis was conducted to analyze the effect of online review variables on the number of customer visits and to determine whether ratio of fake review has a moderating effect in the relationship between these factors and customer visits. At this time, the dependent variable used the number of customer visits in the week, and the control variable used the restaurant rating, the presence or absence of information on the restaurant's price range, the restaurant's price range, and the number of customer visits for the previous week. The independent variables are the number of reviews, the average rating of reviews, the average count of useful, funny, cool votes, the average sentiment score of reviews, and the ratio of elite reviews of reviews, and the ratio of fake reviews was used as a moderating variable. In regression analysis using control variables, independent variables and dependent variables, the number of reviews, average rating of reviews, average usage, funny, cool votes, average sentiment score of reviews, and elite review rates were significantly correlated with the number of visits. In the regression analysis examining the moderating effect of fake review rate, interaction term that using average rating of reviews, the average number of cool votes, the ratio of elite reviews, and the average sentiment score of reviews had a significant correlation with the number of visits. Keywords: sentiment analysis, fake review, review usefulness, online reviews, natural language processing|최근 온라인 리뷰 플랫폼의 성장으로 많은 소비자들은 식당에 방문하거나, 상품의 구매를 결정할 때 온라인 리뷰를 참고하고 있다. 그러나 온라인 리뷰 플랫폼의 성장과 함께, 가짜 리뷰 또한 증가하고 있는 상황이다. 판매자들은 가짜 리뷰 업체들을 통해 경쟁 기업에 부정적인 리뷰를 남겨 평판을 깎거나, 자신에게 긍정적인 리뷰를 남겨 평판을 올리는 방식을 통해 이득을 취한다. 리뷰 조작으로 얻는 금전적 인센티브로 인해, 판매자들은 리뷰 조작 전략을 더욱 적극적으로 사용하게 되었고, 이러한 결과로 가짜 리뷰가 점점 증가하여 미국의 온라인 리뷰 플랫폼 YELP의 경우 가짜 리뷰가 전체 리뷰의 20%를 차지하고 있다고 추산된다. 이렇게 가짜 리뷰가 급증하게 되면서, 소비자들은 온라인 리뷰를 통해 제대로 된 정보를 얻는 것이 힘들어졌고, 구매결정 단계에서 불확실성을 받게 되어 혼란을 겪고 있다. 이러한 고객 구매 의도의 변화로 인해 리뷰 조작 초기에는 기업의 매출에 긍정적인 영향을 주지만, 시간이 지날수록 매출에 부정적인 영향을 준다는 연구 결과가 있다. 따라서 온라인 리뷰 플랫폼들은 기업들의 매출 관리 및 고객의 올바른 구매 결정을 위하여, 가짜 리뷰가 소비자의 온라인 리뷰 인식에 어떠한 영향을 미치는지 알아야 할 필요가 있다. 따라서 본 연구는 리뷰의 양, 리뷰의 평점, 리뷰가 받은 투표 수, 리뷰의 감성 점수, elite 리뷰어의 비율을 사용하여 고객 방문에 영향을 미치는 리뷰의 요소를 분석하고, 이러한 요소들과 고객 방문과의 관계에서 가짜 리뷰 비율의 조절효과를 살펴본다. 가짜 리뷰의 영향에 대한 선행 연구들은 리뷰의 감성, 리뷰의 길이와 같은 정량적 요소에 집중하여 연구를 진행하였다. 그러나 이러한 연구들은 최근 리뷰 플랫폼들에서 제공하고 있는 리뷰에 대한 유저들의 투표, elite 리뷰와 같은 정보들을 반영하고 있지 않다는 한계가 있다. 가짜 리뷰의 영향을 살펴본 대부분의 연구에선 가짜 리뷰의 개수를 독립 변수로 사용하면서 가짜 리뷰의 개수가 직접적으로 매출에 미치는 영향에 집중하여 연구하였다. 그러나 일부 연구에서는 가짜 리뷰가 상품 판매량에 직접적인 영향을 미치진 않는다고 밝혔다. 따라서 본 연구는 텍스트 특징들 뿐만 아니라, 다른 여러 변수들을 추가하여 리뷰의 요소들과 고객 방문 횟수 간의 관계를 살펴보고 이러한 관계에서 가짜 리뷰 비율의 조절 효과를 살펴보았다. 또한 최대한 많은 음식점들의 가짜 리뷰 데이터를 수집하며, 풍부한 가짜 리뷰 데이터를 통한 연구를 목표로 하였다. 본 연구는 기본적으로 Yelp에서 제공하는 academic dataset을 사용했다. 고객방문 횟수 데이터가 존재하는 음식점 54454 곳의 데이터를 추출하고, 해당 음식점의 가격대 정보와 평점을 추출했다. 이후 고객 방문 횟수를 주차 별, 음식점별로 정리하고 해당 주차의 이전 주차 고객 방문 횟수를 매칭시켰다. 이때 이전 주차의 고객 방문 횟수가 없는 경우 0으로 처리하였다. 이후 음식점 54554곳에 대한 가짜 리뷰(not recommended review) 크롤링을 실시한 후 이를 academic dataset의 정상 리뷰 데이터와 결합하여 레스토랑 리뷰 데이터를 생성했다. 이후 리뷰를 불용어 처리, 특수문자 제거 등으로 정제한 후 VADER 모델을 이용해 리뷰의 감성 점수(compound score)를 측정하였다. 레스토랑 리뷰데이터를 누적으로 계산하여 독립 변수를 산출하였다. 마지막으로 레스토랑 데이터의 각 주차에 리뷰 데이터를 결합하여 최종 데이터를 생성하였다. 그 후 고객 방문 횟수에 대한 온라인 리뷰 변수의 영향을 분석하고, 이런 요소들과 고객 방문과의 관계에서 가짜 리뷰 비율이 조절효과를 가지는지 확인하기 위해 위계적 회귀분석을 실시했다. 이때 종속변수는 해당 주차의 고객 방문 횟수, 통제변수는 음식점의 평점, 음식점의 가격대 정보 유무, 음식점의 가격대, 이전 주차의 고객 방문 횟수를 사용했다. 독립변수는 리뷰의 개수, 리뷰의 평균 평점, 리뷰의 평균 useful, funny, cool 투표 수, 리뷰의 평균 감성 점수, elite 리뷰 비율이며 조절변수로는 가짜 리뷰의 비율을 사용했다. 통제 변수, 독립 변수와 종속 변수를 사용한 회귀분석에선 리뷰의 개수, 리뷰의 평균 평점, 평균 useful, funny, cool 투표수, 리뷰의 평균 감성, elite 리뷰 비율이 방문 횟수와 유의한 상관관계를 가지는 것으로 나타났다. 가짜 리뷰의 조절 효과를 살펴본 회귀분석에선 리뷰의 수, 리뷰의 평균 평점, cool 투표 수, 리뷰의 평균 감성 점수, elite 리뷰 비율을 사용한 상호작용항이 방문 횟수와 유의미한 상관 관계를 가지는 것으로 나타났다. 주제어: 감성 분석, 가짜 리뷰, 리뷰 유용성, 온라인 리뷰, 자연어처리
URI
http://hanyang.dcollection.net/common/orgView/200000725434https://repository.hanyang.ac.kr/handle/20.500.11754/189148
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > BUSINESS INFORMATICS(비즈니스인포매틱스학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE