View : 53 Download: 0

TOC 오염총량제 시범지역 대상 머신러닝 예측모형 구축

Title
TOC 오염총량제 시범지역 대상 머신러닝 예측모형 구축
Authors
김영주
Issue Date
2024
Department/Major
대학원 환경공학과
Keywords
수질오염총량제, TOC, 머신러닝
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
최정현
Abstract
본 연구의 목적은 TOC(총유기탄소) 오염총량제 시범지역인 금호강과 남강을 대상으로 총량제 단위유역별로 유기오염물질의 현황을 파악하고, BOD(생물화학적산소요구량) 배출부하량을 이용하여 TOC 농도를 예측할 수 있는 머신러닝을 구축해 TOC 농도 변화에 영향을 미치는 주요 요인을 파악하고 최적의관리 방안을 마련하고자 한다. 낙동강 유역은 별도의 댐 용수가 아닌 본류에 의존하여 유역의 다양한 용수 수요를 공급하고 있기 때문에, 목적에 맞는 수준의 용수를 공급하기 위해서 수계의 오염원 관리 매우 중요하였다. 2004년 대구광역시를 시작으로 낙동강수계의 수질오염총량제가 도입됨에 따라 생분해성 유기물질 농도 지표인 BOD농도는 꾸준히 감소하는 추이를 보이나, 산업의 발달과 화학물질 사용 증가 등의 이유로 TOC가 증가하는 추이를 보인다. TOC는 난분해성 유기물질을 포함하여 정확한 유기물질의 농도를 측정할 수 있는 지표이다. 난분해성 유기물질은 정수장의 소독과정에서 막여과 및 응집효과를 낮춰서 소독비용을 증가시킬 수 있고, 소독부산물이며 발암물질의 전구물질 중 하나인 트리할로메탄 (THM) 물질을 다량으로 발생시켜 인체에 해를 끼치는 문제를 야기시킬 수 있다. 따라서 BOD 중심의 관리방식은 수계의 전체 유기오염물질 관리에 한계에 다다랐다. 이에 본 연구에서는 낙동강 수계의 많은 유역을 차지하고 있는 남강과 금호강의 각 단위유역 대상으로 BOD, TOC, COD 등 오염물질의2011~2023년 동안의 추이와 오염물질 간의 상관관계를 파악하고자 하였다. 오염원별 TOC 농도에 영향을 주는 인자를 도출하기 위해 오염원별 BOD 배출부하량과 TOC 농도를 이용하여 머신러닝 기반 TOC 예측 모형을 구축하였다. 머신러닝 모델을 구축하기 위해 XGBoost을 활용하였으며, BOD 배출부하량은 각 지자체의 오염총량 이행평가 보고서와 전국오염원조사 보고서를 활용하였다. 추이분석 결과 BOD는 대부분 단위유역에서 감소하는 경향을 보였고, TOC는 증가하는 경향이 나타났다. BOD와 TOC 간의 상관계수 0.48~0.78, COD와 TOC 간의 0.68~0.87로 높은 상관성을 띠고 있음을 확인할 수 있었다. XGBoost 예측모형을 이용한 TOC 예측 결과 결정계수 R2이 training 0.73, testing 0.76으로 우수한 예측 성능으로 보였다. 이후, 구축된 모델 해석을 위해 특성중요도(Feture importance) 방법을 이용하여 TOC 농도에 영향을 주는 주된 오염원이 생활계, 산업계, 토지계 임을 확인하였다. 단위유역별로 주된 오염원의 배출 특성을 기반으로 K-means clustering을 실시하여 단위유역을 3개의 그룹으로 나누었고, 각 그룹별 TOC 평균농도는 A그룹 5.00 mg/L, B그룹 2.68 mg/L, C그룹 3.18 mg/L으로 그룹별로 유역의 TOC 농도 차이를 확인할 수 있었다. 그룹화된 결과를 바탕으로 그룹별 유역의 TOC 농도 수준 및 토지이용 특성을 살펴보았고, 그 결과를 기반으로 TOC의 우선 관리지역을 도출하고자 하며, 머신러닝 모형 결과에 대한 가능한 해석을 다양한 요인을 찾아 제시하고자 하였다. TOC 고농도지역이었던 A그룹의 경우 수질측명망 인근에 대형 하·폐수 및 가축분뇨 처리시설 등이 자리 잡고 있었으며, C그룹의 경우 소규모하수종말처리장이 다수 있었다. 환경기초시설의 TOC 방류수 농도 관리가 필요한 것으로 판단된다. 세밀한 분석을 위해 각 군집별 토지이용을 확인한 결과 TOC 고농도 그룹의 경우 대지, 농경지 비율이 높아 인구 밀집과 산업활동 비율이 높은 지역이 TOC 농도가 높음을 확인할 수 있었다. 그러나 남강유역의 B그룹의 경우 산림지가 91.9~99.9%를 차지하고 있고, 대지와 농경지 등 비율이 매우 낮은 것으로 보아 해당 그룹의 경우 산림 발생 TOC 관리가 필요할 것으로 판단되어, 일괄적인 관리 방안을 찾는 기보다는 각 유역별 특성에 맞는 TOC 관리가 필요할 것으로 판단된다.;The purpose of this study is to identify the current status of organic pollutants by total amount system unit watersheds in Kumho and Nam rivers, TMLD pilot areas of TOC (total organic carbon) concentration, and to establish machine learning that can predict TOC concentration using BOD (bio-chemical oxygen demand) emission loads to identify major factors affecting TOC concentration changes and to prepare optimal management measures. Since the Nakdong river basin supplies various water demands in the basin by relying on the main stream rather than separate dam water, it was very important to manage the pollution source of the water system in order to supply water at a level suitable for the purpose. Starting with Daegu Metropolitan City in 2004, the BOD concentration, an indicator of the concentration of biodegradable organic substances has been steadily decreasing as the total amount of water pollution in the Nakdong River system was introduced but TOC has been increasing due to industrial development and increased use of chemicals. TOC is an index that can accurately measure the concentration of organic substances including non-degradable organic substances. Non-degradable organic substances can increase disinfection costs by reducing film filtration and agglomeration effects during the disinfection process of water purification plants, and can cause problems that harm the human body by generating large amounts of trihalomethane (THM), a disinfectant byproduct and one of the precursors of barcinogens. Therefore, the BOD-centered management method has reached its limit to the overall management of organic pollutants in the water system. Therefore, this study attempted to understand the correlation between the trends of pollutants such as BOD, TOC, and COD and pollutants from 2011 to 2023 for each unit watershed of the Nam and Geumho rivers, which occupy many watersheds of the Nakdong River system. In order to derive the factors that affect the TOC concentration by pollutant source, a machine learning-based TOC prediction model was constructed by using the BOD emission load and TOC concentration by pollutant source. XGBoost was used to construct a machine learning model, and the BOD emission load used each local government's total pollution implementation evaluation report and the national pollutant survey report. As a result of trend analysis, most of the BODs tended to decrease in the unit watersheds, and TOC tended to increase. It was confirmed that the correlation coefficient between BOD and TOC was 0.48 to 0.78, and the correlation coefficient between COD and TOC was 0.68 to 0.87. As a result of TOC prediction using the XGBoost prediction model, the coefficient of determination R2 was training 0.73 and testing 0.76, showing excellent prediction performance. After that, for the constructed model analysis it was confirmed that the main pollutants that affect the TOC concentration were the living, industrial, and land systems by using the Feture Importance method. K-means clustering was performed based on the discharge characteristics of the main pollutant sources for each unit watershed, and the unit watershed was divided into three groups, and the average TOC concentration for each group was 5.00 mg/L in Group A, 2.68 mg/L in Group B, and 3.18 mg/L in Group C, indicating the difference in TOC concentration in the watershed by group. Based on the grouped results, the TOC concentration level and land use characteristics of each group basin were examined, and based on the results, TOC priority management area was derived, and possible interpretations of machine learning model results were found and presented. Large sewage and wastewater livestock excrement treatment facilities were located near Group A's water quality measurement network, which was a TOC high concentration area, and in Group C, there were many small sewage treatment plants. It is judged that it is necessary to manage the concentration of TOC effluent in basic environmental facilities. As a result of checking the land use by each cluster for detailed analysis, in the case of the TOC high concentration group, it was confirmed that the TOC concentration was high in the area with a high population density and a high ratio according to industrial activities. However, in the case of Group B in the Namgang River basin, forest land accounts for 91.9 to 99.9%, and the ratio of land and agricultural land is very low. Therefore, TOC management suitable for the characteristics of each watershed is necessary rather than finding a collective management plan.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 환경공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE