View : 500 Download: 0

Developing Data-driven Models to Estimate Photovoltaic Energy Based on Weather Variables

Title
Developing Data-driven Models to Estimate Photovoltaic Energy Based on Weather Variables
Other Titles
기상・기후정보를 기상・기후정보를 기상・기후정보를 활용한 데이터 기반의 태양 광 발전량 예측 모델 개발
Authors
Khatun, Mariam Mst
Issue Date
2022
Department/Major
대학원 기후·에너지시스템공학과
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
박선기
Abstract
Renewable energy (RE) like solar and wind is evolving for growing the energy-mix. To feasibly harvest electricity, numerical and data-driven models significantly facilitate RE forecasts. Notable variables, such as global solar radiation (GSR), temperature, cloud cover (CC), relative humidity (RH) and precipitation are vital for photovoltaic (PV) generation and estimation. Therefore, this research develops a generalized data-driven model to estimate PV by weather variables and diurnal temperature range (DTR). After assessing climate trends for weather datasets, statistical: linear regression (LR), polynomial at 3rd order (P3), multi-LR (MLR) and machine-learning: support vector regression (SVR) are tested for DTR, direct normal irradiance (DNI), and temperature at 2-meter (T2M) as single and multiple inputs with meteorological variables to train, evaluate, and predict PV particularly for Bangladesh. The study sites are administrative cities (stations): Dhaka, Chittagong, Barishal, and Khulna for southern region, and Rajshahi, Rangpur, Sylhet, and Mymensingh are northern region. Datasets are from NINJA (2001─2019; hourly) and National Aeronautics and Space Administration (NASA) ─Prediction of Worldwide Renewable Energy Resources (POWER) with daily and monthly (1982─2020) timescales for PV and weather variables, respectively. RH and CC at pressure levels are obtained from the European center for medium range weather forecast (ECMWF) reanalysis 5th generation (ERA5) particularly for climate trends. Surface observations from the Bangladesh meteorological department (BMD) are also com-pared for 15 years (2003─2017; 03-hourly). Global Solar Atlas (GSA; averaged over 1999─2020) is considered for referring to modeled PV. For PV output, predictors can be single input including DNI, DTR, and T2M and/or multiple inputs includes GSR, CC, total rainfall, RH and air density. For LR, P3, MLR, and SVR, the experiment includes 80% (samples: 21912) for training and 20% (samples: 7304) for testing from 2001 to 2010 to evaluate model parameters. During data-preprocessing, NINJA and the BMD surface data are averaged to daily se-ries. Exclusive linear and nonlinear relationships among PV and weather variables are also found to scrutinize data-driven models with single and multiple inputs and compared with the NINJA observations. The performance is assessed by coefficient of determination (R2), Pearson correlation, root mean square error (RMSE), and mean absolute percentage error (MAPE). After averaging over four training and testing periods, the statistical analyses in-clude R2 (0.94; 0.68; 0.4), RMSE (0.35; 0.967; 1.122), MAPE (7.9; 19.44; 24.54), and cor-relation (0.976; 0.74; 0.53) by utilizing DNI, DTR, and T2M that can be regarded as high, medium, and low for data-driven model (LR, P3, MLR, and SVR) performances to estimate PV. With DNI, chosen models execute well with the lowest RMSE and MAPE; the model performance was in the order of SVR> MLR> P3>LR based on model errors, stability, and accuracy. Since model performance (errors) with DNI and DTR are consistent with NINJA (MAPE ≤20%), annual energy production (AEP) for each region and city is predicted for 2019. On the average, the AEPs (in kilowatt) from the data-driven models showed higher PV production in northern regions (1704 by DNI and 1715 by DTR) than southern region (1699 by DNI and 1621 by DTR) whereas NINJA showed 1733 and 1589 for northern and southern regions, respectively. Compared with GSA (1405 and 1400 for northern and south-ern region, respectively), however, both NINJA and data-driven models overestimate by 250 to 300. These research findings are stable estimating PV at real-time. The results also suggest PV is more suitable to small-scale and off-grids than national gridlines under the uncertain future climate and weather conditions. In conclusions, this research will encourage reasona-ble investments in shaping solar applications and operations in Bangladesh. ;지속가능한 에너지 체제로의 전환 및 에너지원의 다양화(energy-mix)를 위해 태양광과 같은 재생 에너지(Renewable energy)를 늘리는 것은 세계적인 추세이다. 재생에너지를 통한 안정적인 전력공급을 위해서는 다양한 기상, 기후정보(태양복사, 온도, 운량, 강수량 등)와 수치모델 및 데이터 기반 모델을 활용한 발전량에 대한 정확한 예측이 필요하다. 따라서 본 연구에서는 기상 변수, 특히 일교차(Diurnal Temperature Range)를 사용하여 방글라데시아 주요 지역 별 태양광 발전량을 추정하기 위한 데이터 기반 모델을 개발하였다. 통계 분석 방법인 선형 회귀(linear regression; LR), 3차 다항식(polynomial at 3rd order; P3), 다중선형회귀(multi-LR; MLR)와 기계 학습 방법인 서포트 벡터 회귀(support vector regression; SVR)를 사용하여 DTR을 계산하였으며, 직달 일사량(direct normal irradiance; DNI) 및 기온(temperature at 2-meter; T2M) 정보를 사용하여 모델을 훈련하였다. 연구 지역은 총 8개의 행정 도시로, 남쪽 지역의 Dhaka, Chittagong, Barishal, Khulna와 북쪽 지역의 Rajshahi, Rangpur, Sylhet, Mymensingh을 선정하였다. 연구에서 사용한 자료의 경우, NINJA Renewables및 National Aeronautics and Space Administration의 세계 재생에너지 자원 예측(Prediction of Worldwide Renewable Energy Resources; POWER)로부터 2001년부터 2019년까지의 태양광 발전량과 기상 변수 자료를 획득하였고, Global solar atlas로부터 모델의 검증을 위한 기상 변수와 전력 평균 자료(1999-2020년)를 획득하였다. 또한, 기상 변수는 방글라데시 기상청으로부터 총 15년(2003-2017년) 동안의 3시간 간격 자료를 획득하였으며, 모든 자료는 일 평균하여 연구에서 사용하였다. 태양광 자료 및 기상변수는 모두 일 평균하여, 태양광과 기상변수들의 선형 및 비선형 관계 비교에 활용하였다. PV예측을 위한 단일 입력변수로 DNI와 DTR, T2M를 사용하였으며, 다중 입력변수로 GSR와 CC, 총 강우량, 상대습도, 공기밀도가 사용되었다. LR, P3, MLR 및 SVR모델의 경우, 2001 년부터 2010 년까지의 자료를 사용하였으며, 모델 훈련을 위해 자료의 80 % (표본 수: 21912)를 사용하였고, 나머지 20%(표본 수: 7304)를 사용하여 모델 성능을 평가하였다. 자료 전처리 과정에서 NINJA와 BMD는 일평균을 하여 사용하였다. PV와 날씨변수간의 독립선형 또는 비선형관계 분석을 위해서 데이터기반모델과 NINJA 자료를 관측 자료로 가정하여 비교하였다. 모델 성능은 상관계수(R^2)와 피어슨 상관계수, 평균 제곱근오차(root mean squared error; RMSE), 평균 절대비오차(mean absolute percentage error; MAPE)등을 통해 평가하였다. 모델 성능은 서로 다른 입력자료로 훈련한 후 평가하였으며, DNI, DTR, T2M순으로 모델 성능이 좋은 것으로 나타났다. 각 입력자료 별 평균 모델 성능은 R^2 기준 0.94, 0.68, 0.4, RMSE기준 0.35, 0.967, 1.122, MAPE 기준 7.9, 19.44, 24.54, 피어슨 상관 계수 기준 0.976, 0.74, 0.53이다. 모든 연구 지역에서, DNI와 DTR를 활용한 연간에너지생산(annual energy production; AEP) 예측량과 실제 관측량을 비교해 보았을 때, RMSE 0.417, 0.999, MAPE 7.88, 20.37, 피어슨 상관계수 0.958, 0.733의 값을 갖는다. AEP의 경우, 북부 지역(~1700 kW)은 남부 지역(~1690 kW)보다 약간 높게 예측되었으며, 본 연구에서 사용한 모델은 GSA와 비교하여 평균 ~250 to 300 kW를 과대 모의하는 것으로 평가되었다. 평균 월간 용량 계수(%)는 남부지역(19.225)보다 북부지역(19.775)에서 약간 높게 나타난다. 이러한 연구 결과는 실시간으로 태양력을 작동하고 추정하는데 적합하다. 본 연구의 결과는 방글라데시에서의 태양광발전은 PV가 불확실한 기상 조건 내에서, 대형(Large-scale) 시스템 보다는 소규모의 독립 형(off-grid), 또는 소형(mini-grid) 시스템이 적합하다는 것을 제안한다. 이와같이, 본 연구는 방글라데시와 같은 개발도상국에서의 태양 에너지 활용을 위한 기초자료 및 정책결정을 위한 데이터를 제공한다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 기후·에너지시스템공학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE