1231 0

비정형정보와 CNN기법을 활용한 고객행태예측: 전자상거래 사례를 중심으로

Title
비정형정보와 CNN기법을 활용한 고객행태예측: 전자상거래 사례를 중심으로
Author
김승수
Alternative Author(s)
Customer Behavior Prediction Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront
Advisor(s)
김종우
Issue Date
2018-08
Publisher
한양대학교
Degree
Doctor
Abstract
최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 논문에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 ‘이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델’을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 ‘비정형 정보의 벡터 전환’, ‘이종 정보 결합’, ‘다층 퍼셉트론’, 그리고 ‘합성곱 계층’으로 하는 4개의 설계 방식을 정의하고 각 설계 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고자 한다. 본 연구에서 사용한 고객 행태 예측을 위한 목표 변수는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제와 예상 구매 횟수, 예상 구매 금액, 예상 반품 횟수, 예상 반품 금액, 고객 예상 가치 등 5개의 수치 예측 문제로 각각 정의한다. 실험 구성은 훈련 데이터와 테스트 데이터를 분리하는 기준에 따라 동일 기간 실험과 분리 기간 실험 2가지로 구분한다. 먼저 동일 기간 실험은 훈련 데이터와 테스트 데이터를 랜덤 샘플링 방식으로 분리하는 방식이다. 다음으로 분리 기간 실험은 특정 시점을 기준으로 훈련 데이터와 테스트 데이터를 구분하는 방식으로 과거의 고객 행동 패턴을 기준으로 미래의 고객 행위를 예측하는 구조이다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 이진 분류 문제에 대한 실험 결과에서는 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도가 높은 것으로 평가되었으며 NBC, SVM, ANN에서는 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 수치 예측 문제의 실험 결과에서는 제안 모델이 5개의 목표 변수 중에서 2개의 목표 변수의 성능이 높게 평가되었다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/75437http://hanyang.dcollection.net/common/orgView/200000433773
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > STRATEGIC MANAGEMENT(전략경영학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE