View : 447 Download: 0

영과잉 가산 자료 예측력 향상을 위한 회귀모형 및 표본추출 연구

Title
영과잉 가산 자료 예측력 향상을 위한 회귀모형 및 표본추출 연구
Other Titles
The study of regression model and sampling algorithm for excess zero
Authors
김보민
Issue Date
2022
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이은경
Abstract
본 연구의 목적은 영과잉 데이터를 회귀모형과 표본추출 알고리즘을 통해 정확하게 예측하는 방법론을 구축하는 것이다. 회귀모형은 영에 대한 확률까지 추정하는 영과잉 회귀모형과 영변환 회귀모형을 사용했다. 표본추출 알고리즘은 분류 문제에 사용되는 과대표본추출 방법론인 SMOTE 알고리즘을 회귀 문제에 적합하도록 변형된 SMOTER 알고리즘을 이용했다. 본 논문에서는 영과잉 회귀모형과 영변환 회귀모형을 SMOTER 알고리즘과 함께 적용하는 새로운 방법론을 적용하였다. Lastfm의 음악 재생 데이터를 이용하여 방법론의 성능을 비교했으며, 그 결과 기존의 일반적인 회귀모형에 비해 예측 성능이 향상되었다.;The purpose of the study is to establish a methodology that accurately predicts count data with excess zeros through a regression model and a sampling algorithm. As for the regression model, we use zero inflated model and hurdle model that estimate the probability for zero. We apply the SMOTER algorithm as the sampling algorithm, modified the SMOTE algorithm to solve the regression problem. In this paper, we propose a new methodology to apply the zero inflated model and hurdle model together with the SMOTER algorithm. We compare the performance of the methodology using Lastfm music data. As a result, the new methodology has improved predictive performance compared to the existing general regression model.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE