View : 823 Download: 0
Bayesian modeling for domestic bestseller book prediction
- Title
- Bayesian modeling for domestic bestseller book prediction
- Other Titles
- 국내 베스트셀러 도서 예측을 위한 베이지안 모델링
- Authors
- 김은지
- Issue Date
- 2018
- Department/Major
- 대학원 통계학과
- Publisher
- 이화여자대학교 대학원
- Degree
- Master
- Advisors
- 오만숙
- Abstract
- 성인의 연간 독서량이 지속적인 감소 추세에 있는 상황과 맞물려 출판사의 경영 현황에서 출판 관련 매출액 역시 전년대비 대부분 비슷하거나 감소하였다. 이러한 상황을 극복하기 위해 도서 마케팅 전략이 역시 다양화될 필요가 있다. 본 논문에서는 분야별 도서에 대하여 작가의 특성, 출판사의 특성, 책의 특성과 관련된 변수에 대하여 베이지안 분위 회귀모형을 이용하여 베스트셀러 여부를 살펴보았다. 분석하기에 앞서 베스트셀러인 책과 그렇지 않은 책의 데이터 비율이 불균형한 것을 맞추기 위해 오버샘플링을 실시하였다.
반응변수의 조건부 평균에 초점을 맞춰 분야 별로 대략적인 분석을 시행한 결과, 작가의 특성과 관련된 변수인 외국작가 여부와 베스트셀러 작가 여부가 주요한 변수로 채택되는 것을 파악할 수 있었다. 베이지안 분위 회귀모형의 결과, 높은 분위 수에서는 작가와 출판사, 책의 특성을 설명하는 변수가 고르게 채택되었으나, 낮은 분위 수에서는 작가의 특성과 관련된 변수가 베스트셀러 여부에 가장 큰 영향을 미치는 것을 세부적으로 확인하였다.;In steady decline in the annual reading volume of adults, publishing-related sales in the publishing company’s business also showed a similar or decline from the previous year. To overcome this situation, the book marketing strategy needs to be diversified as well. In this paper, we use the Bayesian Probit model to predict the best sellers for variables related to the characteristics of the author, characteristics of the publisher, and characteristics of the book.
Section 1 introduces the background of this study and brief summary of the research. Section 2 explains data collection process with response variables and explanatory variables. Section 3 mentions the oversampling with cross-validation method, which is an unbalanced data preprocessing method, and the Bayesian Probit model, which introduces latent variables as a modeling method of this study. In addition, Bayesian quantile regression was added to explain variable influence with probability. In Section 4, the data processed with the modeling results are analyzed by Bayesian Probit model, and the results for Bayesian quantile regression. In the conclusion of the Section 5, It is confirmed that the Bayesian Probit model has a better predictive power, and the variables related to the characteristics of the writer have the greatest influence on the best sellers.
- Fulltext
- Show the fulltext
- Appears in Collections:
- 일반대학원 > 통계학과 > Theses_Master
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML