626 0

머신러닝을 이용한 아파트 계약군 예측모델 연구

머신러닝을 이용한 아파트 계약군 예측모델 연구
Other Titles
A Study on The Forecasting Model for Contract Group of Apartment by Using Machine Learning Methods
Alternative Author(s)
Son Jun Woo
Issue Date
2021. 8
인공지능(AI)의 발전이 국가 발전의 원동력이 되는 시대가 도래하였다. 수많은 분야에서 쌓아온 지식(데이터)를 집대성하고 활용할 수 있다면, 다양한 효익이 예상되기 때문이다. 그러나 아파트 분양시장에서 사업단계별로 양질의 데이터가 입수되는 것에 비해 해당 데이터를 활용한 연구는 미비하다. 본 연구에서는 아파트 분양시장에서 초기 기획단계의 정보만으로 머신러닝을 활용하여, 공급절차에 따른 계약자군(정식당첨, 선착순, 한달이내, 한달초과)들의 결정요인을 분석하고 계약률을 예측한다. 데이터의 활용이 가장 극대화 되도록 초기 정보로, 가장 중요한 계약결과를 예측하는 것이다. 본 연구는 ㅇㅇ신도시 4개단지 4,431세대를 대상으로 하였으며, 머신러닝 모형 중 랜덤포레스트, XG부스트, 심층신경망 모형을 적용하였다. 보다 정확한 모형을 위해 초모수를 조절하여 최적합 모형을 만들었다. 각 모형평가는 혼동행렬을 통한 정확도(CA), 민감도(Recall), 정밀도(Precision), 특이도(Specificity), F1점수, ROC커브를 통한 AUC 등으로 평가하였다. 각 모형에서 변수에 대한 영향도 및 평가는 Permutation Feature Importance와 SHAP Summary Plot를 적용하였다. 과적합 방지를 위해 교차검증을 5등분하여 진행하였다. 모든 모형에서 층에 대한 변수를 중요하게 채택하였으며, 차순으로 평균매매가 대비 분양가율, 직전년도 공급물량, 전세가율 등울 중요변수로 채택하였다. 더 세부적으로 레이블(각 계약군별)로 예측에 영향을 준 변수도 모형별로 모두 확인하였다. 모든 계약군에서 모형들은 KB매수우위지수를 중요한 변수로 채택하였다. 모형의 예측력 비교는 계약군에서 가장 많은 비중을 차지하는 정식당첨 계약군을 기준으로 XG부스트가 93.3%의 정확도(CA)로 가장 우수하게 예측하였다. 그 외 모든 예측지표의 평균은 심층신경망이 가장 높았다. 랜덤포레스트는 다른 모델에 비해 비교적 성능이 종합적으로 떨어지는 것으로 확인되었다. 본 연구에서는 정식당첨 계약군 예측률이 심층신경망보다 1.4%이상 높은데 반하여, 종합예측지표는 비슷한 성능인 XG부스트를 예측모형으로 선정하였다. 본 연구는 21개의 설명변수를 사용한 고차원적인 모형에 비해 4개 단지, 4,431세대의 데이터셋으로 규모가 작아, 설명력의 한계가 있다. 또한, 특정지역의 아파트로만 모형을 만들었기 때문에 실제 미분양이 많이 발생하는 지방등의 타지역에 적용 가능성이 검증되지 않았고, 오피스텔 등 다른 상품에 적용에도 한계가 있다. 그러나 추가적인 연구를 통해 다양한 지역과 상품을 추가한다면, 아파트 계약 시기별 결정요인과 계약률 예측에 관해 신뢰성 있는 모형이 구축될 것이다. 신뢰성 있는 모형은 초기에 분양되지 않은 열위세대에 대한 올바른 가격보정이나 상품향상에 대한 정확한 근거를 마련한다. 필요한 수준만큼만 정밀한 보정을 하는 객관적 토대를 마련하고, 계약예측을 통해 명확한 현금흐름을 관리한다면 사업성 제고에도 도움을 줄 것이다. | The age has arrived when artificial intelligence (AI) development is the driving force behind national development. If knowledge (data) accumulated in many fields can be aggregated and utilized, various benefits are expected. However, compared to the acquisition of quality data by business stage in the apartment sales market, research using the data is insufficient. In this study, machine learning is used only information from the initial planning stage in the apartment sales market to analyze the determinants of the contractor group (Formal Winning, First-Come, Within a Month, and Over a Month) and predict the contract rate. It is the most important contractual outcome prediction, with initial information to maximize the utilization of the data. This study was conducted on 4,431 generations of four Apartment complex in OOO New Town, and applied random forest, XG boost, and deep neural network models among machine learning models. For a more accurate model, we create an optimal sum model by adjusting the hyperparameters. Each model evaluation was evaluated with accuracy (CA), sensitivity (Recall), precision, specificity, F1 score, and AUC via ROC curve. In each model, we apply Permutation Feature Importance and SHAP Summary Plot for the evaluation of the effects on variables. To prevent overfitting, cross-validation was conducted by dividing it into 5 equal parts. In all models, variables for floors were adopted as important variables such as the average selling price ratio, supply volume in the previous year, and lease rate in the next order. More specifically, the variables that affected the prediction with labels (by each contract group) were also identified by model. In all contract groups, the models adopted the KB Buying Advantage Index as an important variable. The comparison of the predictive power of the model was best predicted by XG Boost with 93.3% accuracy (CA) based on the qualifying winning contract group, which accounts for the largest portion of the contract group. The average of all other predictors was the highest for deep neural networks. Random forests have been found to perform relatively poorly compared to other models. In this study, the prediction rate of the Formal Winning Contract Group is more than 1.4% higher than that of the Deep Neural Network, while the comprehensive predictors selected XG boost, a similar performance, as the prediction model. This study is smaller in scale with four Apartment complex(4,431 generations of datasets) compared to a high-dimensional model with 21 explanatory variables, which has limitations in explanatory power. In addition, because the model was made only from apartments in certain areas, the applicability of the model to other regions, such as provinces where there are many unsold products, has not been verified, and there is a limit to its application to other products such as officetels. However, if additional research adds a variety of regions and products, reliable models will be established for determining factors and predicting contract rates by apartment contract timing. Reliable models provide an accurate basis for correct price correction or product improvement for the initially unsold inferior generation. Providing an objective basis for precise correction to the required level and managing clear cash flows through contract predictions will also help improve business feasibility.
Appears in Collections:
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.