View : 823 Download: 0

Bayesian modeling for domestic bestseller book prediction

Title
Bayesian modeling for domestic bestseller book prediction
Other Titles
국내 베스트셀러 도서 예측을 위한 베이지안 모델링
Authors
김은지
Issue Date
2018
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
오만숙
Abstract
성인의 연간 독서량이 지속적인 감소 추세에 있는 상황과 맞물려 출판사의 경영 현황에서 출판 관련 매출액 역시 전년대비 대부분 비슷하거나 감소하였다. 이러한 상황을 극복하기 위해 도서 마케팅 전략이 역시 다양화될 필요가 있다. 본 논문에서는 분야별 도서에 대하여 작가의 특성, 출판사의 특성, 책의 특성과 관련된 변수에 대하여 베이지안 분위 회귀모형을 이용하여 베스트셀러 여부를 살펴보았다. 분석하기에 앞서 베스트셀러인 책과 그렇지 않은 책의 데이터 비율이 불균형한 것을 맞추기 위해 오버샘플링을 실시하였다. 반응변수의 조건부 평균에 초점을 맞춰 분야 별로 대략적인 분석을 시행한 결과, 작가의 특성과 관련된 변수인 외국작가 여부와 베스트셀러 작가 여부가 주요한 변수로 채택되는 것을 파악할 수 있었다. 베이지안 분위 회귀모형의 결과, 높은 분위 수에서는 작가와 출판사, 책의 특성을 설명하는 변수가 고르게 채택되었으나, 낮은 분위 수에서는 작가의 특성과 관련된 변수가 베스트셀러 여부에 가장 큰 영향을 미치는 것을 세부적으로 확인하였다.;In steady decline in the annual reading volume of adults, publishing-related sales in the publishing company’s business also showed a similar or decline from the previous year. To overcome this situation, the book marketing strategy needs to be diversified as well. In this paper, we use the Bayesian Probit model to predict the best sellers for variables related to the characteristics of the author, characteristics of the publisher, and characteristics of the book. Section 1 introduces the background of this study and brief summary of the research. Section 2 explains data collection process with response variables and explanatory variables. Section 3 mentions the oversampling with cross-validation method, which is an unbalanced data preprocessing method, and the Bayesian Probit model, which introduces latent variables as a modeling method of this study. In addition, Bayesian quantile regression was added to explain variable influence with probability. In Section 4, the data processed with the modeling results are analyzed by Bayesian Probit model, and the results for Bayesian quantile regression. In the conclusion of the Section 5, It is confirmed that the Bayesian Probit model has a better predictive power, and the variables related to the characteristics of the writer have the greatest influence on the best sellers.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE