View : 496 Download: 0

Predictive Analysis based on the Synthesized Data using Variational Auto Encoder

Title
Predictive Analysis based on the Synthesized Data using Variational Auto Encoder
Authors
김효정
Issue Date
2021
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
안재윤
Abstract
In the case of personal medical information or insurance data, it may be difficult to access or share the data due to the privacy claims. Therefore, there is a need for a way to reproduce the replicated data from the original dataset without including sensitive information. The purpose of this paper is to obtain synthetic dataset that has the same property with the original data set in a way of excluding the sensitive information by using a variational autoencoder, a deep learning model equivalent of dimensional reduction with stochastic components. Variational autoencoder is composed of an encoder, and a decoder. Especially the encoder and decoder is linked with stochastic components adding Gaussian noise which makes difference between autoencoder and variational auto encoder. Especially, in case of insurance data, predictive analysis of claim amounts is important, and we analyze the performance of predictive analysis induced by the model which is estimated from the synthetic data.;개인 의료 정보 나 보험 정보의 경우에는 개인 정보를 취급하고 있어 열람 및 공유가 어려울 수 있다. 따라서 민감한 정보를 포함하지 않고 원본 데이터 세트에서 복제된 데이터를 재현할 수 있는 방법이 필요하다. 본 논문의 목적은 확률적 구성 요소를 이용한 차원 축소에 사용되는 딥 러닝 모델인 변이형 오토 인코더를 사용하여 원본 데이터 세트와 동일한 속성을 갖지만 민감한 정보를 포함하지 않고 원래 데이터 세트와 구조와 확률분포가 동일한 합성 데이터 세트를 얻는 것이다. 변이형 오토 인코더는 오토 인코더와 마찬가지로 인코더와 디코더로 구성되어 있지만 특히 인코더와 디코더에 가우시안 노이즈를 추가하는 확률적 구성 요소와 연결되어 있다는 점에서 오토 인코더와 차이가 있다. 특히 보험 자료의 경우 청구 금액에 대한 예측 분석이 중요하다는 점을 고려하여 합성된 자료로부터 추정된 모델에 의해 유도된 예측 분석의 성과를 분석하고자 한다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE