226 0

Feasibility test for machine learning-based CO2 saturation monitoring of CCS projects with uncertainty estimation

Title
Feasibility test for machine learning-based CO2 saturation monitoring of CCS projects with uncertainty estimation
Other Titles
CCS 프로젝트에서 불확실성을 고려한 머신러닝 기반 이산화탄소 포화도 모니터링의 타당성 검사
Author
조영화
Advisor(s)
변중무
Issue Date
2023. 8
Publisher
한양대학교
Degree
Doctor
Abstract
In recent years, carbon capture storage (CCS) projects have received increasing attention as one of the measures to mitigate greenhouse gas emissions to reduce the effect of climate change. In CCS project, CO2 saturation monitoring is important because it can be used to ensure that the captured CO2 is being stored as planned during injection, and to calculate the efficiency of storage after injection. Traditionally, the rock physics model has been employed for monitoring CO2 saturation. However, since rock physics models use empirical formulas, they tend to show lower performance when underlying assumptions are violated. Recent breakthroughs in machine learning (ML) have accelerated research into predicting CO2 saturation. However, existing studies primarily utilize acoustic impedance (AI) as the sole input data, thereby reducing the accuracy of CO2 saturation prediction. In addition, these studies often use 2D data, making it difficult to extend into a 3D structure and to incorporate 1D prior information like well logs. Furthermore, the lack of consideration for uncertainty undermines the reliability of the monitoring results. To address these challenges, this thesis employed multiple types of input data, 1D trace-to trace approach, and Monte Carlo (MC) dropout. First, to enhance the accuracy of CO2 saturation prediction, not only AI but also shear impedance (SI), Vp/Vs ratio, and pore pressure, which can be obtained from prestack seismic inversion, were used as input data. Second, a 1D trace-to-trace approach was used for easy expansion to 3D. Third, MC dropout was implemented to calculate uncertainty, thereby informing the reliability of the predicted CO2 saturation value. The SEAM time-lapse pilot data, a 4D time-lapse dataset, was used to validate the proposed algorithm. To confirm the impact of input data types on accuracy, a comparison was made between results from the model using AI only and the model using AI, SI, Vp/Vs ratio, and pore pressure. While the former model yielded lower training errors due to low complexity, the latter produced lower errors with test data by including additional information not available in the AI and successfully avoiding overfitting. Additionally, before proceeding with the uncertainty analysis, a few tests were conducted on the number of trails and the dropout rate, which are hyperparameters of the MC dropout. The purpose of these tests is to select proper hyperparameters that generate reliable results similar to those by the ML model without using MC dropout. As the result, the number of trials was set to 50 and the dropout rate was set to 10 % for the subsequent analysis. Finally, the uncertainty and confidence intervals, calculated from the mean and variance of the prediction results obtained by MC dropout, were investigated as a function of the noise level. In this way, the informative value of uncertainty for data without exact answers was discussed. |최근 기후변화 영향을 줄이기 위한 온실가스 감축 방안 중 하나로 탄소 포집 저장 (Carbon capture and storage, CCS) 프로젝트가 주목받고 있다. CCS 프로젝트에서 CO2 포화도 모니터링은 포집된 CO2가 주입 중에 잘 저장되고 있는지 확인하고 주입 후 저장 효율을 계산하는 데 사용할 수 있기 때문에 중요하다. 기존에는 CO2 포화도 모니터링에 Rock physics model을 사용해 왔지만, 경험식이 기반으로 하는 이론의 가정에 위배되는 경우 성능이 저하되는 경향이 있다. 최근 기계학습 (Machine learning, ML)의 획기적인 발전으로 CO2 포화도 예측에 대한 연구가 많이 수행되고 있다. 그러나 기존 연구는 주로 음향 임피던스 (Acoustic impedance, AI)를 유일한 입력자료로 활용하기 때문에 CO2 포화도 예측의 정확도가 떨어진다. 이러한 연구는 2차원 데이터를 사용하는 경우가 많기 때문에 3차원으로 확장하거나 well data와 같은 1차원의 사전 정보를 통합하기가 어렵고, 또한, 불확실성에 대한 고려가 부족하지 않아서 모니터링 결과의 신뢰성이 떨어진다. 이러한 문제를 해결하기 위해 이 연구에서는 CO2 포화도 예측의 정확도를 높이기 위해 입력 자료의 종류 확장, 1차원 자료를 이용한 trace-to-trace 방법의 사용, 그리고 Monte Carlo (MC) dropout을 활용하였다. 먼저, CO2 포화도 예측의 정확도를 높이기 위해 AI 뿐만 아니라 전단 임피던스(Shear impedance; SI), Vp/Vs ratio, 공극 압력을 활용했다. 두번째로는 3차원으로 쉽게 확장할 수 있도록 1차원의 trace-to-trace 방법을 사용했으며, 마지막으로, Monte-Carlo (MC) dropout을 구현하여 예측된 CO2 포화도 값의 신뢰성을 알려주는 불확실성을 계산하였다. 개발된 알고리즘을 검증하기 위해 4차원 시간경과 자료인 SEAM time-lapse data를 사용했다. 먼저, 입력 데이터 유형이 정확도에 미치는 영향을 확인하기 위해 AI만 사용한 모델과 AI, SI, Vp/Vs ratio, 공극압을 사용한 모델의 결과를 비교했다. 전자의 모델은 데이터 복잡성으로 인해 학습 오류가 더 낮았지만, 후자의 모델은 AI에서 사용할 수 없는 정보를 포함하고 over-fitting 되지 않아서 훈련과정에 포함되지 않은 test data에서 오류가 더 낮게 나타났다. 또한, 불확실성에 대한 분석을 진행하기 MC dropout의 hyperparameter인 모델의 실행 횟수와 dropout rate에 대한 실험이 진행되었다. 이 실험의 목적은 MC dropout을 사용하지 않은 ML model의 결과만큼 신뢰할 수 있는 결과를 생성하는 적절한 hyperparameter를 선택하는 것이다. 그 결과, 이후 분석을 위한 시도횟수를 50 회, dropout rate는 10 %으로 설정했다. 마지막으로, MC dropout으로 얻은 불확실성과 예측 결과의 평균과 분산으로부터 계산된 신뢰 구간을 잡음 수준을 변경하면서 분석하였다. 이러한 방식으로 정답이 없는 자료에 대한 불확실성의 정보적 가치를 증명하였다.
URI
http://hanyang.dcollection.net/common/orgView/200000684787https://repository.hanyang.ac.kr/handle/20.500.11754/187376
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > EARTH RESOURCES AND ENVIRONMENTAL ENGINEERING(자원환경공학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE