View : 86 Download: 0

LSTM을 활용한 여행 카테고리별 선호관광지 분석

Title
LSTM을 활용한 여행 카테고리별 선호관광지 분석
Other Titles
Analysis of foreign tourists' region of attraction through LSTM-based text classification
Authors
이혜진
Issue Date
2020
Department/Major
대학원 사회과교육학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
강영옥
Abstract
다양한 분야에서 소셜미디어 데이터를 활용한 연구가 증가하고 있으며, 특히 관광지에 대한 여행객의 직접적인 선호 요인 및 트렌드를 발견할 수 있다는 장점 때문에 관광 부문에서의 중요성도 강조되고 있다. 소셜미디어 중에서도 플리커는 사진 공유 소셜 네트워크 서비스로 위치정보를 함께 수집하여 분석할 수 있어 공간정보 분석의 측면에서 신뢰성있으며 댓글, 제목 등의 텍스트 정보를 통해 관광지의 매력요소를 발견할 수 있다는 점에서 분석 가치가 높다. 그러나, 국내 관광 부문에서 플리커의 텍스트 데이터를 활용해 여행 주제에 따라 관광지를 분석한 연구가 거의 이루어지고 있지 않다. 본 연구의 목적은 플리커의 사진 및 텍스트 정보를 통해 여행 카테고리를 생성하고 이에 기반하여 대한민국을 방문한 외국인 관광객의 여행 특성 및 매력요소를 분석하는 것이다. 이를 위해 먼저, 2016년부터 2018년까지의 국내 전체의 텍스트 데이터를 수집 및 전처리하여 LDA 기반 토픽모델링 기법을 활용하여 9개의 여행 카테고리(시장/음식거리, 문화유산/역사적 명소, 전망/조망 명소, 문화/축제 명소, 공원/자연경관 명소, 종교적 장소, 쇼핑/도심경관 명소, 해안경관 명소, 문화마을)를 생성하였다. 플리커 데이터 건당 어떤 여행 카테고리에 속하는지 분류하기 위해 텍스트 각각에 대해 카테고리에 따른 라벨링을 하였다. 최적의 하이퍼파라미터를 적용하여 분류 모델을 생성하여 정확도 평가 결과 약 94%로 확인되었다. 다음으로, 행정구역 중 가장 사진 수가 많은 서울을 범위로 하여 플리커 사진의 위치정보를 활용하여 DBSCAN 분석을 통해 여행 카테고리별 관심 지점을 도출하였다. 관광 명소별 텍스트의 빈도 분석을 통해 여행 특성 및 매력요소를 발견하였고 워드클라우드로 시각화하였다. 서울 내 관광 특성 분석 결과 빈도 수가 높은 상위 3개의 여행 카테고리는 문화유산/역사적 명소, 쇼핑/도심경관 명소, 시장/음식거리였다. 서울에서는 해안경관에 해당하는 데이터가 없어 이를 제외한 8개의 카테고리에 대한 관심 지점을 분석했으며 카테고리별로 2~4개의 클러스터가 형성되었다. 클러스터는 관광 명소로 판단하여 키워드를 통해 어떤 컨텐츠와 특성이 외국인 관광객들의 관심요인이 되었는지 해석하였다. 또한 한국관광공사의 외래관광객 실태조사와 비교하여 본 연구의 의의와 제안점을 시사하였다. 본 연구는 관광 명소의 주제에 따른 여행 카테고리를 생성하였고, 이의 카테고리에 따라 딥러닝 기반의 텍스트 분류 기법을 활용하였다. 또한 데이터의 밀집지역 분석 및 빈도 분석 결과 한국관광공사 및 기존 관광 부문 연구들과 비교하여 여행 카테고리에 따른 맥락적 해석이 가능하고 특정한 관광 체험을 즐길 수 있는 관광지 정보를 제시하였으며 더 세부적인 여행 특성을 확인하였다.;Research using social media data is increasing in various fields and in particular, the importance of research in the tourism sector is being emphasized due to the advantages of discovering direct preferences and trends of tourists for tourist attractions. Among social media, Flickr is a photo sharing social network service that can collect and analyze location information together, so it is reliable in terms of spatial information analysis, and it is analyzed in high value that it can discover attractive elements of tourist spots through text information such as comments and titles. However, few studies have been conducted in the domestic tourism sector to analyze tourist destinations according to travel themes using Flickr text data. The purpose of this study is to create a travel category through Flickr's photo and text information and to analyze the travel characteristics and attractive elements of foreign tourists visiting Korea based on this. To this end, this study collected and pre-processed text data from 2016 to 2018 to create nine travel categories(Market/Food Street, Heritage/Historic Spot, View/View Spot, Culture/Festival Spot, Park/Nature Landscape Spot, Religious Place, Shopping/Cityscape Spot, Coastal Spot Spot, Culture Village) using the LDA-based topic modeling technique. And to classify which travel category belongs to each flickr data, each text was labeled according to category. The classification model was created by applying the optimal hyperparameters, and the accuracy evaluation result confirmed that it was about 94%. Next, the location of interest in each travel category was derived through DBSCAN analysis using the location information of Flickr photos, with Seoul as the range with the largest number of photos in the administrative area. Through the analysis of the frequency of text for each tourist attraction, the travel characteristics and attractive elements were found and visualized with a word cloud. As a result of analyzing the characteristics of tourism in Seoul, the top three travel categories with high frequency were cultural heritage/historic attractions, shopping/cityscape attractions, and markets/food streets. In Seoul, there was no data corresponding to coastal scenery, so we analyzed the points of interest for 8 categories except this, and 2-4 clusters were formed for each category. The cluster was judged as a tourist attraction and analyzed what content and characteristics became the interest of foreign tourists through keywords. In addition, the significance and suggestions of this study were suggested in comparison with the survey by the Korea Tourism Organization. In this study, travel categories were created according to the theme of tourist attractions, and deep learning-based text classification was used according to the categories. In addition, as a result of analyzing the dense areas of the data and analyzing the frequency of the data, compared with the Korea Tourism Organization and existing tourism sector studies, contextual interpretation according to the travel category is provided and information on tourist attractions to enjoy a specific tourism experience is presented. Also, I confirmed the more detailed travel characteristics.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 사회과교육학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE