227 0

DARNN 모델을 이용한 시공간에서의 배달 건 수 장기 시 계열 재귀 예측 방법

Title
DARNN 모델을 이용한 시공간에서의 배달 건 수 장기 시 계열 재귀 예측 방법
Other Titles
Long-Term Time Series Recursive Prediction to Delivery Call Count using DARNN Model
Author
유승혁
Alternative Author(s)
Seunghyuck Yoo
Advisor(s)
박태준
Issue Date
2022. 2
Publisher
한양대학교
Degree
Master
Abstract
From the past to the present, time series data prediction has been made in many industrial fields, and the time series data prediction has many advantages. For example, in the case of an industry that needs to increase or decrease supply to meet demand, when demand sharply increases or decreases at a certain point in the industry, forecast demand to increase supply at the time when demand sharply increases It is possible to respond to the situation in advance by increasing the number of personnel or by increasing the manpower, and vice versa, thus greatly increasing the efficiency of production. But, in the fast-growing delivery industry, it is not known how many delivery calls are made in what region and at what time, and how many delivery drivers exist in that region. For this reason, delivery drivers have to forcefully check delivery calls while driving, and many accidents occur due to frequent movement between regions. In such a situation, if the demand for delivery call can be predicted for time and space, the delivery driver does not have to move too much, because they has already know to a specific time and region according to the delivery call prediction result.. And delivery companies will also be able to respond appropriately to the demand for delivery in a specific region and time. However, it is very difficult to predict time series data in real time. Currently, many statistical techniques are used for time series prediction. In the case of a statistical time series prediction model, this is not a problem in the case of a stationary time series prediction with a constant variance and not many correlated variables. But, In the case of these models, it is not easy to predict non-stationary data with non-uniform variance or a large number of correlated variables, such as delivery call data, because humans must analyze and set parameters and correlation variables. To supplement the limitations of the statistical-based time series model, a DARNN (Dual-Stage Attention-Based Recurrent Neural Network) model that directly learns the correlation of correlation variables and the period and pattern of data was used. In addition, in the case of delivery call data, there are numerous delivery agency data and delivery platforms, and it is very difficult to collect this information in real time. However, in order to predict time-series data in real time, it is necessary to perform prediction by collecting data in real time. To solve this situation, this paper presents a long-term time series recursive prediction method. In this method, for a model trained based on past time series data, the prediction result is used as an input value of the neural network again as with the past data, and the prediction is performed recursively after the past time series data. This prediction method was applied to the delivery data in space-time, which is the actual observation data, and compared to other neural network-based time-series prediction models, it was possible to reduce the error of convergence or divergence to a specific value. In addition, to check the performance of the model, three models (CNN (Convolution Neural Network) + LSTM (Long Short-Term Memory), CNN+BI-LSTM (Bidirectional Long Short-Term Memory), Seq2seq (Sequence-To-Sequence)) and performance comparison was performed. Mean Square Error for the verification data set and the mean error for the test set were set as performance indicators and compared. It was confirmed that DARNN was dominant at maximum 0.6897 (14,0879%) compared to other models, and it was confirmed that the mean square error for the validation data set was also small as much as 6.3867 (23,4324%). |과거에서부터 현재까지 많은 산업 분야에서 시 계열 데이터의 예측이 이루어지고 있으며, 시 계열 데이터의 예측에는 많은 장점이 있다. 예를 들어, 산업 분야에서 어느 시점에 급격하게 수요가 증가하거나 감소 할 때, 수요에 맞춰 공급을 늘려야 하거나 줄여야 하는 산업의 경우에는 수요를 예측하여 수요가 급격하게 증가하는 그 시점에 맞춰서 공급을 늘리거나 인력을 늘려 그 상황에 대해 미리 대응할 수 있고 그 반대의 경우도 가능하게 때문에 생산의 효율성을 크게 증가시킬 수 있다. 그 중 현재 빠르게 성장하고 있는 배달 산업에서는 어떤 지역과 어떤 시간에 얼마나 많은 배달 콜이 발생하고, 그 지역에 얼마나 많은 배달 기사가 존재하는 지 알 수 없다. 이 때문에 배달 기사가 운전 중에 무리하게 배달 콜을 확인해야 하며, 지역 간의 이동이 빈번하여 많은 사고가 발생하고 있다. 이러한 상황에서 배달 콜을 시공간에 대해 수요 예측을 할 수 있다면, 배달 기사는 배달 콜 예측 결과에 따라 특정 시간 및 지역에 미리 이동해 있으면 무리하게 이동하지 않아도 되며, 배달 대행 회사 입장에서도 특정 지역 및 시간의 배달 수요에 맞춰 적절하게 대응 할 수 있을 것이다. 하지만 실시간으로 시 계열 데이터를 예측하는 것은 매우 어려운 일이다. 현재 시 계열 예측에는 통계적인 기법이 많이 사용되는데 통계 기반 시 계열 예측 모델의 경우, 분산이 일정하며, 상관 변수가 많지 않은 정상성 시 계열 예측의 경우에는 크게 문제가 되지 않지만, 상관 변수 분석 및 모델의 파라미터 설정을 사람이 직접 설정해 주어야하기 때문에 분산이 일정하지 않거나 배달 콜 데이터와 같이 상관 변수가 많은 비정상성 데이터를 예측하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 상관 변수에 대한 상관관계와 데이터의 주기 및 패턴을 직접 학습하는 신경망 기반 DARNN(Dual-Stage Attention-Based Recurrent Neural Network) 모델을 사용하여 통계 기반 시 계열 모델의 한계점을 보완 하였다. 또한 배달 콜 데이터의 경우, 수많은 배달 대행 데이터와 배달 플랫폼이 존재하며, 이러한 정보를 실시간으로 수집 하는 것이 매우 힘들다. 하지만 실시간으로 시 계열 데이터를 예측하기 위해서는 실시간으로 데이터를 수집하여 예측을 수행해야 한다. 이러한 상황을 해결하기 위하여 과거 시 계열 데이터기반으로 학습된 모델을 사용하여 예측하고, 예측 결과를 과거 데이터와 같이 다시 신경망 네트워크 입력 값으로 사용하여, 과거 시 계열 데이터에 이어서 또 다시 예측을 재귀적으로 수행하는 장기 시 계열 재귀 예측 방법을 제안한다. 이러한 예측 방법을 실제 관측 데이터인 시공간에서의 배달 데이터에 적용하였으며, 다른 신경망 기반의 시 계열 예측 모델에 비해 특정 값에 수렴 하거나 발산 하는 오차를 줄일 수 있었다. 또한 해당 모델의 성능을 확인하기 위하여 세 가지 모델(CNN(Convolution Neural Network) + LSTM(Long Short-Term Memory), CNN+BI-LSTM(Bidirectional Long Short-Term Memory), Seq2seq(Sequence-To-Sequence))과 성능 비교를 진행하였다. 검증 데이터 셋에 대한 Mean Square Error와 테스트 셋에 대한 평균 오차를 성능 지표로 설정하고 비교 하였다. 평균오차의 경우 다른 모델에 비해 최대0.6897(14,0879%) DARNN 이 우세한 것을 확인할 수 있었으며, 검증데이터 셋에 대한 Mean Square Error 또한 최대6.3867(23,4324%) 만큼 오차가 작은 것을 확인 할 수 있었다.
URI
http://hanyang.dcollection.net/common/orgView/200000589817https://repository.hanyang.ac.kr/handle/20.500.11754/167813
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > DEPARTMENT OF CONVERGENCE ROBOT SYSTEM(융합로봇시스템학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE