397 0

베이지안 및 머신러닝 기법을 활용한 사고위험 상황 정의 및 예측에 관한 연구

Title
베이지안 및 머신러닝 기법을 활용한 사고위험 상황 정의 및 예측에 관한 연구
Other Titles
Assessment of Crash Risk Situations Using Bayesian Inference and Machine Learning Techniques
Author
박누리
Alternative Author(s)
Park, Nuri
Advisor(s)
박준영
Issue Date
2023. 2
Publisher
한양대학교
Degree
Master
Abstract
교통사고는 사회적 경제적 측면에서 큰 손실을 야기하고 사망을 초래하기 때문에 교통사고 감소를 위한 안전관리 전략이 필요하다. 과거 안전관리 전략은 주로 교통사고 자료, 기하구조 자료, 상습 지정체 구간 등 위험 구간 자료와 같이 이력 자료를 활용하여 교통사고에 대한 사후대처(Reactive Safety Management)에 초점을 두었다. 하지만 최근에는 교통사고 발생 전 사고발생 징후를 포착하고 사고위험 상황에 대응 및 사고를 예방하는 선제적 안전관리 전략(Proactive Safety Management)의 필요성이 제기되고 있다. 이에 따라 실시간으로 도로 교통 사고위험을 예측하는 연구가 활발히 수행되고 있으며, 기존 연구들에서는 통계기법과 머신러닝 등 다양한 방법론을 활용하여 실시간 사고위험 예측모형을 도출하고자 시도하였다. 본 연구에서는 고속도로에서의 실시간 사고위험 상황 도출과 사고위험도를 바탕으로 하는 선제적 안전관리 전략 수립을 위한 기반 연구로, 베이지안 추론 기법을 활용하여 실시간 사고위험 예측모형을 개발하고자 하였다. 사고위험 예측 시 교통류 군집 별 특성을 포함해 모형의 정확도와 신뢰도를 높이기 위해 다층 베이지안 방법론 기반의 사고위험 교통류 분류모형을 구축하였다. 본 연구에서는 사고위험 예측에 앞서 구득 가능한 데이터를 동적 데이터와 정적 데이터로 나누어 정리하였으며, 사고 데이터와 결합한 통합 데이터를 구축하였다. 동적 데이터의 경우 시간에 따라 변화하는 실시간성이 있는 데이터로, 고속도로 차량검지기 데이터와 기상 데이터 등이 이에 해당한다. 정적 데이터의 경우 과거에 구축된 고정 시점의 이력 데이터로, 취약 구간 데이터와 도로 기하구조 데이터가 포함되어있다. 본 연구에서는 실시간성과 이력 자료가 포함된 통합 데이터를 활용함으로써 사고위험에 영향을 주는 다양한 요인을 사고위험 정의와 사고위험 예측모형 개발에 포함하고자 하였다. 분석을 위한 통합 데이터 구축 후 대표적인 비지도 학습 군집 분류 방법론 K-means Clustering을 사용하여 사고위험 군집을 나누고 군집의 특성을 정리하여 사고위험 상황을 정의하였다. 사고위험 상황 정의 후 사고위험 예측모형 구축을 위해 다층 베이지안 로지스틱 회귀분석을 수행하여 사고위험 교통류 군집 별 특성을 모형에 적용하고자 하였으며, 모델 성능 비교를 위해 이항 분류에 대표적으로 많이 사용되는 통계기법 중 하나인 로짓 모형과 머신러닝 기법의 하나인 서포트벡터머신 기반의 사고위험 예측모형을 개발하여 예측성능을 비교하였다. 사고위험 상황 정의 결과 총 3개의 군집으로 분류되었으며, 군집 1의 경우 차선 수가 적고 교통량이 적으며 교통량 차이와 속도 차이가 상대적으로 적은 상황에서의 사고위험 교통류, 군집 3의 경우 군집 1과 정반대의 교통상황으로, 군집 2의 경우 군집 1과 군집 3 사이의 특성을 보이는 사고위험 교통류로 정의 내렸다. 사고위험 상황 정의 후, 각 사고위험 상황 군집을 모형에 반영할 수 있도록 다층 모형을 개발하였고, 베이지안 모형 개발 결과 전체적으로 핵심 변수에 사전 분포를 부여한 모형의 예측성능이 높게 도출되었으며, 다층 모형의 경우 무작위 기울기를 부여한 모형의 성능이 무작위 기울기를 부여하지 않은 모형에 비해 높게 나타나 모형 구축 시 모형 내에서 각 군집의 기울기가 다르게 설정되도록 무작위 기울기를 부여해주어야 한다는 결과를 도출하였다. 최종 모형은 무작위 기울기를 부여한 다층 베이지안 로짓 모형으로, 서포트벡터머신과 기본 로짓 모형 기반의 사고위험 예측모형과 비교하였을 때 가장 높은 예측성능을 보이는 것으로 나타나 다층 모형의 예측성능을 증명하였다. 본 연구에서 도출된 사고위험 상황 정의와 사고위험 예측모형을 사용하여 향후 고속도로 선제적 안전관리 대책 수립 시 실시간 사고위험에 따른 대처를 마련할 수 있을 것으로 기대되며, 사고위험도 기반의 선제적 안전관리를 통해 사고위험 대처와 나아가서는 사고 예방에 도움이 될 것으로 예상된다.| A safety management strategy is needed to reduce road traffic accidents because crashes cause deaths and great losses in social and economic aspects. In the past, safety management strategies focused mainly on reactive safety management by using historical data such as crash data, roadway geometric structure data, and hazardous section data such as congestion sections. However, recently, the need for a proactive safety management strategy that detects the precursor of a crash before a crash occurs, responds to crash risk situations, and prevents crashes has been raised. Accordingly, research to predict real-time crash risk is being actively conducted, and previous studies attempted to derive a real-time crash risk prediction model using various methodologies such as statistical techniques and machine learning techniques. In this study, a real-time crash risk prediction model was developed by using Bayesian methodology as a basis for establishing a proactive safety management strategy based on the real-time crash risk situation on the highway and the crash risk level. In order to increase the accuracy and reliability of the model by including the characteristics of each traffic flow cluster in the crash risk prediction, a hazardous traffic flow classification model based on Multilevel Bayesian Modeling was constructed. In this study, the available data were divided into dynamic data and static data and collected for crash risk prediction, and integrated data combined with historical crash data was constructed. In the case of dynamic data, it is data with real-time characteristics that change over time, such as highway vehicle detection system (VDS) data and weather data. In the case of static data, it is historical data at a fixed point in time built in the past, and includes data on vulnerable sections and road geometry. In this study, various factors affecting crash risk were included in the crash risk definition and crash risk prediction model development by using integrated data including real-time performance and historical data. After constructing the integrated data for analysis, the crash risk situation was defined by dividing the crash risk cluster using K-means clustering, a representative unsupervised learning cluster classification method, and organizing the characteristics of the cluster. After defining the crash risk situation, Multilevel Bayesian logistic regression analysis was performed to build a crash risk prediction model, and the characteristics of each cluster of hazardous traffic flow were applied to the model. The predictive performance was compared by developing a logistic regression model, which is one of the statistical techniques used, and a support vector machine, a support vector machine-based crash risk prediction model, which is one of the machine learning techniques. As a result of defining the crash risk situation, it was classified into three clusters. In the case of cluster 1, the traffic flow at risk of crashes in the situation where the number of lanes, the traffic volume, and the difference in traffic volume and speed are relatively small, in the case of cluster 3, the traffic in the opposite direction from cluster 1 As a situation, in the case of cluster 2, it was defined as a crash risk traffic flow showing characteristics between clusters 1 and 3. After defining the crash risk situation, a multilevel model was developed to reflect each crash risk situation cluster in the model. In this case, the performance of the model to which a random slope was applied was higher than that of the Multilevel Bayesian logit model to which a random slope was not applied. The results were derived. The final model is a Multilevel Bayesian logit model with a random gradient, which showed the highest predictive performance when compared with the crash risk prediction model based on the support vector machine and the basic logit model, thus proving the predictive performance of the multi-level model. Using the real-time crash risk prediction model derived from this study, it is expected to be able to prepare responses according to real-time crash risk when establishing preemptive safety management measures for highways in the future. It is expected that this will help to cope with the risk of crashes and further to prevent crashes.
URI
http://hanyang.dcollection.net/common/orgView/200000652753https://repository.hanyang.ac.kr/handle/20.500.11754/180130
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > DEPARTMENT OF SMART CITY ENGINEERING(스마트시티공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE