View : 219 Download: 0

낙동강 유역의 비점오염원관리를 위한 토지이용 및 토지피복(LULC)자료 기반의 XGBoost 모델 구축

Title
낙동강 유역의 비점오염원관리를 위한 토지이용 및 토지피복(LULC)자료 기반의 XGBoost 모델 구축
Other Titles
A study on Construction of XGBoost Model Based on Land Use and Land Cover (LULC) Data for Non-point Source Contamination Management in Nakdong River Basin
Authors
심선희
Issue Date
2023
Department/Major
대학원 환경공학과
Keywords
머신러닝, XGBoost, 수질오염, 수질오염총량제, 낙동강, 유역관리, 비점오염원, 토지피복, 토지이용
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
최정현
Abstract
본 연구의 목적은 낙동강 유역 전체를 대상으로 현재 시행되는 4단계 수질오염총량제 목표수질 달성 여부를 예측할 수 있는 머신러닝 모델을 구축하고, 특성 중요도 분석 결과를 통해 목표수질 달성 여부에 가장 큰 영향을 끼친 주요 인자들을 분석하는 것이다. 낙동강 유역의 수자원은 경상도 지역의 식수와 생활용수 및 농업용수로서 중요한 역할을 하고 있다. 이에 낙동강 유역은 2004년부터 수질오염총량제를 시행하여 수질관리를 하고 있음에도 불구하고, 환경기초시설의 설치로 크게 감소하고 있는 점오염원과 달리 비점오염원이 전체 발생되는 오염원 중 70%의 높은 비율을 차지하고 있어 낙동강 하류의 대표 상수원인 물금지역은 2011년 대비 2020년도의 TOC농도가 19% 증가하는 등 목표수질 관리에 어려움을 겪고 있다. 비점오염원은 지형, 토지이용, 기후 등의 영향을 받아 불특정한 활동에 따라 발생하게 되어, 유출경로 확인이 어렵고 오염물질이 비지속적으로 발생되어 관리가 어려운 특징을 가진다. 또한, 최근에는 기후변화로 인해 여름철 집중호우 발생빈도가 증가하는 등 강우패턴의 변화로 유역의 유출 특성이 변화되고 있어 하천 유역관리에 어려움을 겪고 있다. 이에 본 연구에서는 비점오염원의 유출 특성을 반영할 수 있는 경관지수와 기상자료만을 이용하여 TP, BOD, TOC 항목에 대한 강우기와 비강우기의 수질오염총량제 목표수질 달성 여부를 예측할 수 있는 머신러닝 모델을 XGBoost를 이용하여 구축하였다. 이때, 토지이용 특성에 따라 오염원의 유출 특성이 달라질 수 있기 때문에 K-means Clustering을 이용하여 우세한 토지이용 특성을 가지는 유역을 농지, 삼림지, 도심지 3가지 그룹으로 구분하여 연구를 진행하였다. XGBoost 모델을 이용한 TP, BOD, TOC 항목의 평균 예측 결과는 비강우기의 경우 농지는 78.7%, 삼림지는 91.1%, 도심지는 76.5%였으며, 강우기의 경우 농지는 78.5%, 삼림지는 79.2%, 도심지는 71.9%로 비교적 높은 정확도를 보이는 것을 확인할 수 있었다. 이후, Feature Importance와 SHAP을 이용하여 목표수질 달성 여부 예측에 영향을 미치는 주요 인자를 도출하였다. 연구결과, 모든 토지이용 유형에서 기상 인자인 월 강수량합과 평균기온이 모델 예측 시 높은 영향을 미치는 인자로 나타났다. 경관지수에서는 ED가 모든 토지이용유형에서 공통적으로 높은 중요도를 보였으며, 그 외 농지에서는 CONTAG, PD, 삼림지에서는 LPI, COHESION, 도심지에서는 SHDI, COHESION, PD가 주요 인자로 나타났다. 농지에서 높은 중요도를 보인 CONTAG는 다양한 토지이용 유형의 비율과 분산정도를 반영하는 지수로, 국내 농지 중 밭의 경우 논에 비해 집약적인 영농이 이루어지지 않고 있으며, 특히 낙동강 유역의 밭은 경사지가 많아 유실되는 토양의 양이 많기 때문에 농지의 특성을 가지는 유역의 경우, 밭 주변 비점오염원 유출 및 이동에 대하여 관리하는 것이 보다 필요하다고 사료된다. 또한, 삼림지의 경우 경관지수 중 특히, LPI와 ED가 높은 중요도를 보였는데, 이를 통해 낙동강 유역 중 토지이용 특성이 삼림지의 특성을 가지는 유역은 유역 내 삼림의 형태가 복잡하고 넓은 면적을 차지할 수 있도록 관리하여 인근 하천의 수질개선효과를 높이는 것이 필요하다고 사료된다. 마지막으로 도심지의 경우, 강우기의 월 강수량합이 특히 중요한 요소로 도출되었으며, 경관지수 중 SHDI, COHESION, PD, ED가 주요 인자로 도출되었다. 이를 통해 도심지의 경우 강우시 불투수면에 의한 오염물질의 표면유출 관리와 도심지의 특성을 가지는 유역 내의 물리적 연결성을 높이는 것이 필요하다고 사료된다.;The purpose of this study is to build a machine learning model that can predict the achievement of the target water quality under the current 4th phase Total Water Pollution Load Management system for the entire Nakdong River basin. Additionally, the study aims to analyze the key factors that have the greatest impact on the achievement of water quality objectives through feature importance and SHAP analysis. Water resources in the Nakdong River basin play a crucial role in providing drinking water, domestic water, and agricultural water for the Gyeongsang-do region. Despite implementing the Total Water Pollution Load Management system since 2004, the Nakdong River Basin continues to face challenges in achieving its water quality objectives. Unlike point source pollution, which has significantly decreased due to the installation of environmental infrastructure, non-point source pollution accounts for a high proportion of 70% of all pollution sources. Consequently, the Moolgeum area, which is a representative water source in the downstream of the Nakdong River, has experienced difficulties in water quality management, such as a 19% increase in Total Organic Carbon (TOC) concentration in 2020 compared to 2011. Non-point source pollution occurs as a result of various unidentified activities influenced by factors such as topography, land use, and climate. It is characterized by the difficulty in identifying discharge pathways and the intermittent nature of pollutant generation, making it challenging to manage. Furthermore, changes in rainfall patterns due to climate change, including an increase in the frequency of intense summer rainfall, have posed challenges in managing the basin's runoff characteristics. To address these issues, this study utilizes landscape index and meteorological data to predict the achievement of water quality objectives under the Total Water Pollution Load Management system for TP, BOD, and TOC parameters. The XGBoost machine learning model is employed for this purpose. Considering that pollutant runoff characteristics can vary depending on land use characteristics, the study conducted research by classifying watersheds with dominant land use characteristics into three groups: agricultural areas, forested areas, and urban areas using K-means clustering. The average prediction results of the TP, BOD, and TOC parameters using the XGBoost model were as follows: for non-rainy seasons, agricultural areas showed 78.7% accuracy, forested areas showed 91.1% accuracy, and urban areas showed 76.5% accuracy. For rainy seasons, agricultural areas showed 78.5% accuracy, forested areas showed 79.2% accuracy, and urban areas showed 71.9% accuracy, indicating relatively high accuracy. Subsequently, through feature importance and SHAP analysis, the study identified the key factors influencing the prediction of the achievement of water quality objectives. The research results revealed that monthly total precipitation and average temperature, as meteorological factors, exerted significant influence across all land use types. In terms of landscape index, the ED index consistently showed high importance across all land use types. Additionally, the CONTAG and PD index were identified as key factors for agricultural areas, the LPI and COHESION index for forested areas, and the SHDI, COHESION, and PD index for urban areas. The CONTAG index, which showed high importance in agricultural areas, reflects the ratio and variability of various land use types. In domestic agricultural land, there is less intensive farming compared to paddy fields. Especially in the Nakdong River Basin, where there are many sloping terrains, a significant amount of soil loss occurs. Therefore, it is necessary to manage non-point source pollutant discharge and movement in watersheds with agricultural characteristics. In the case of forested areas, particularly the LPI and ED index among the landscape index exhibited high importance. This suggests that in watersheds within the Nakdong River Basin that share the characteristics of forested land use, maintaining complex and extensive forest coverage within the watershed is crucial for enhancing the water quality improvement effect in nearby rivers. Lastly, for urban areas, the monthly total precipitation during rainy seasons emerged as a particularly important factor, along with the SHDI, COHESION, PD, and ED index among the landscape index. This indicates that in urban areas, managing surface runoff of pollutants caused by impermeable surfaces during rainfall events and enhancing physical connectivity within urban watershed areas are necessary.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 환경공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE