View : 88 Download: 0

Full metadata record

DC Field Value Language
dc.description.abstractWith the growth of e-commerce at an unprecedented rate, we often meet a lot of information with ratings and review texts when buying things or choosing a restaurant. Reviews can help customers in making decisions and elicit information on many aspects, but they are hard to grasp at a glance. As a way of summarizing review, the ratings on a discrete scale are easy to perceive, so users commonly used to compare the items. However, the rating is one-dimensional and just summarizes the polarity of whether the user's opinion is positive or negative, so existing sentiment analysis or opinion mining has a limitation. In this study, we introduce a sentiment analysis to identify several latent topic weights from given an overall rating. For each perspective of the topic, we try to define the sources of the rating and to measure the strength and sign of the meaning of the review. By using the real examples of online reviews in the accommodation business, we apply the proposed method to cluster the relevant topics to users who choose accommodation. Furthermore, we illustrate how to estimate multivariate ratings according to each latent topic and suggest an efficient way to compare them without a huge pile of reviews ;전자 상거래가 활성화되면서 물건을 살 때, 음식점을 고를 때 우리는 하루에도 수많은 평점과 리뷰를 접한다. 평점은 파악이 쉽고 상품끼리 비교하기 용이하지만, 평점 도출 배경을 알 수 없기 때문에 구체적이지 않다는 단점이 있다. 리뷰는 평점만으로 파악하기 힘든 여러 측면의 정보를 도출할 수 있지만 한눈에 파악하기 힘들다. 감성 분석(sentiment analysis) 또는 오피니언 마이닝(opinion mining)은 이러한 문제를 해결할 수 있는 연구이다. 하지만 기존 연구는 사용자의 의견이 긍정적인지, 부정적인지에 대한 극성을 두 가지로 분류한 후 요약하는 데에 그친다. 따라서 본 연구는 전체 평점을 형성하기 위해 고려하는 잠재적 주제 가중치를 식별하고자 한다. 즉, 평점 도출 배경을 파악하고 해당 리뷰가 의미하는 긍정 혹은 부정의 강도를 파악하고자 한다. 결과적으로 사람들이 숙소를 고를 때 중요하게 생각하는 주제를 파악한 후 각 주제에 따른 점수를 매겨, 모든 리뷰를 읽어보지 않고도 효과적으로 숙소를 비교할 방법을 제안한다.-
dc.description.tableofcontentsI. Introduction 1 II. Methodology 3 A. LDA (Latent Dirichlet Allocation) 3 B. Sentiment Analysis 5 C. Elastic Net 6 D. Analysis Procedures 8 III. Data Description 9 A. Collecting data 9 B. Data Pre-processing 11 IV. Results 13 A. LDA based aspect extraction 13 B. Sentiment dictionary by using Elastic Net 15 C. Latent aspect ratings 18 V. Conclusion 21 Bibliography 22 Appendix 1 23 Appendix 2 24 Appendix 3 25 Appendix 4 26 Abstract(in Korean) 27-
dc.format.extent1210928 bytes-
dc.publisher이화여자대학교 대학원-
dc.titleA study on Sentiment Analysis with Multivariate ratings in Online Reviews-
dc.typeMaster's Thesis-
dc.format.pageiv, 27 p.-
dc.identifier.major대학원 통계학과- 2-
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.