View : 731 Download: 0

Two-stage 콘텐츠 선호 모형을 결합한 행렬 분해 기반 영화 추천시스템

Title
Two-stage 콘텐츠 선호 모형을 결합한 행렬 분해 기반 영화 추천시스템
Other Titles
Two-stage Contents Preference Model Combined with Matrix Factorization for Movie Recommendation
Authors
백서인
Issue Date
2021
Department/Major
대학원 빅데이터분석학협동과정
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
민대기
Abstract
인터넷 기술의 발달 및 미디어 시장의 성장으로 영화, 음악, 동영상 등의 서비스를 제공하는 기업에서는 사용자를 만족시키기 위한 다양한 콘텐츠를 제공하고 있다. 또한 스트리밍 서비스가 보편화되면서 사용자들은 영화, 음악 등을 사용하는 기기에 저장해 두지 않아도 시공간의 제약 없이 네트워크에 연결만 되어 있으면 원하는 콘텐츠를 접할 수 있게 되었다. 이러한 변화에 따라 사용자들은 더욱 풍부한 콘텐츠를 즐길 수 있게 되었지만, 넘쳐나는 콘텐츠 중 자신에 취향에 맞는 콘텐츠를 찾기 위해 이전보다 훨씬 많은 시간을 할애해야 한다는 것이 새로운 문제로 대두되었다. 기업들은 이러한 문제를 해결하기 위해 사용자의 콘텐츠 시청 혹은 구매 이력을 바탕으로 사용자의 선호도를 파악하여 취향에 맞는 콘텐츠를 추천해주는 추천시스템 알고리즘을 적용하여 사용자의 만족도를 높이고 있다. 추천시스템 알고리즘은 크게 협업 필터링(Collaborative filtering), 콘텐츠 기반 필터링(Content-based filtering), 그리고 두 방법을 결합한 하이브리드 추천 방법(Hybrid recommendation)이 있다. 본 연구에서는 협업 필터링 방법론이 일반적으로 콘텐츠 기반 필터링에 비해 좋은 성능을 낸다고 알려졌지만, 두 가지 방법론을 결합하면 사용자의 선호를 더욱 정교하게 파악할 수 있다는 가정에 기반하여 두 가지 방법론을 결합할 수 있는 새로운 알고리즘을 제안하였다. 본 연구는 영화 추천 도메인에 한정하여 협업 필터링의 한 가지 방법론인 행렬 분해(Matrix Factorization) 방법론에 사용자의 선호를 예측하는 데 도움이 될 수 있는 다양한 메타 데이터(배우, 감독, 장르)를 변수별 특성에 따라 적용한 Two-stage 콘텐츠 선호 모형을 결합한 CPMF(Two-stage Contents Preference model combined with Matrix Factorization) 방법론을 제안하였고, 이를 기본 행렬 분해 방법론과 비교 검증하였다. Stage 1 에서는 사용자의 개인화된 선호를 정교하게 파악하기 위해 배우와 감독 선호도를 사용하였고, 시그모이드(Sigmoid) 함수를 가중치 함수(Weight function)로 활용하여 사용자의 아이템 선호도 점수를 보정할 수 있는 최적의 가중치를 도출하고자 하였다. Stage 2 에서는 사용자의 일반적인 선호를 파악하기 위해 장르 선호도를 반영하여 사용자의 선호와 전혀 맞지 않는 장르의 영화가 추천 리스트에 올라왔을 때 이를 필터링하였다. 실험을 통해 본 연구에서 제안하는 방법론이 사용자의 아이템 선호도를 더욱 정교하게 모델링하고 추천시스템의 성능을 높이는 데 기여함을 확인하였다.;With the development of Internet technology and the growth of the media market, companies that provide services such as movies, music, and video are providing various contents to satisfy users. Also, as streaming services have become more common, users can access the contents they want as long as they are connected to the network without any restrictions on time and space without having to store them on their personal devices. While these changes have allowed users to enjoy richer content, a new problem has emerged that they have to spend much more time than before to find contents that suit their taste among the overflowing contents. To solve these problems, companies are increasing user satisfaction by applying a recommendation system algorithm that identifies users' preferences based on their history of viewing or purchasing contents. Recommendation system algorithms include Collaborative Filtering, Content-based Filtering, and Hybrid Recommendation that combines the two methods. In this study, although collaborative filtering methodology is generally known to perform better than content-based filtering, a new algorithm was proposed to combine two methodologies based on the assumption that combining the two methodologies would provide a more sophisticated understanding of users' preferences. This study proposed a two-stage contents preference model with Matrix Factorization(CPMF), which combines two-stage contents preference models using a variety of meta-data (actors, directors, and genres) that can help predict users' preference, limited to movie recommendation domains, and compared the performance with a basic matrix factorization method. In stage 1, we used actor and director preferences to fine-tune the user's personalized preference, and derived the optimal weight to revise the user's item preference score by utilizing the sigmoid function as a weight function. In stage 2, to apply the user's general preference, we used the user’s genre preference. When a movie of a genre that does not match the user's preference was placed on the recommended list, it was filtered using genre preference. Experimental results show that the model architecture proposed in this study contributes to more sophisticated modeling of users' item preferences and improves the performance of the recommendation system.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 빅데이터분석학협동과정 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE