View : 39 Download: 0

서울시 상권 데이터의 시각화에 기반한 매출액 예측

서울시 상권 데이터의 시각화에 기반한 매출액 예측
Other Titles
A Study on Sales of Trade Areas in Seoul based on Visualization of Spatial-temporal Data
Issue Date
대학원 통계학과
이화여자대학교 대학원
본 연구의 목적은 서울시 상권 자료를 다양한 방식으로 시각화한 후, 그 결과를 바탕으로 매출액을 예측하고 중요 변수를 파악하는 데 있다. 효율적인 분석을 위하여 전체 자료를 하나의 모형으로 적합시킨 경우와 업종 분류별로 각각 모형을 적합시킨 경우의 예측력을 비교하여 최적 모형을 선택하였다. 사용한 모형은 선형 회귀, Ridge 회귀, Lasso 회귀, 랜덤 포레스트, 익스트림 그래디언트 부스팅이며, 최종적으로 전체 자료를 하나의 익스트림 그래디언트 부스팅 모형으로 적합시켰을 때 RMSE를 기준으로 가장 예측력이 좋았다. 매출액에 영향을 미치는 요인으로는 상권 내 동일 업종 점포 중 프랜차이즈 점포의 비율, 업종, 주거인구의 밀도 순으로 중요한 것으로 나타났다. 시·공간 자료의 효과적인 시각화를 통해 상권에 대한 다양한 정보를 정확하게 파악할 수 있을 뿐 아니라, 위치, 업종 등에 따른 매출액을 예측하고 영향을 미치는 요인을 분석함으로써 상권을 활성화하는 데 기여할 수 있을 것이다.;The purpose of this study is to predict the sales and find out meaningful variables on the basis of visualization of spatial-temporal data about trade areas in Seoul in various ways such as maps. For efficient analysis, we try to fit a single model to the whole dataset and fit individual models for each type of business, and then select the more predictive model. The methodologies used in analysis are linear regression, ridge regression, Lasso regression, random forest, and extreme gradient boosting. The optimal model by RMSE is a single model to the whole dataset using extreme gradient boosting. The important variables for sales are the proportion of franchises among stores of the same type of business in the trade area, the type of business, and the density of living population in sequence. We can figure out various and accurate information about trade areas in Seoul through the effective visualization. In addition, we are able to contribute to revitalization of trade areas by predicting sales and analyzing influential factors.
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.