View : 715 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor강영옥-
dc.contributor.author박재희-
dc.creator박재희-
dc.date.accessioned2016-08-26T03:08:15Z-
dc.date.available2016-08-26T03:08:15Z-
dc.date.issued2013-
dc.identifier.otherOAK-000000080836-
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/204770-
dc.identifier.urihttp://dcollection.ewha.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000080836-
dc.description.abstractWith explosion of numerous data, it came to be an issue to find out valuable information from the existing data. SNS including twitter, which many people are recording their present day, is being used for inspecting their concern or response to the issue in regard to huge amount of data that is generated as many as several hundred million a day and users' voluntary posting of opinions. On the other hand, necessity of the urban policy indicator has been raised for diagnosing present urban conditions and establish efficient policies. Seoul City has evaluated conditions of Seoul from various aspects through Seoul Survey since 2003. However, structured questionnaires like Seoul Survey are easy to grasp a general tendency by presenting the 1-5 points scale but have a limit to acquiring a concrete reason or an active opinion. Based on such backgrounds, taking notice of the fact that there's information on the 'present' posed by users on twitter, this study intends to conduct a spatial analysis by extracting tweet containing evaluation on the residential environment among twitter data. Also it aims at inspecting whether it's possible to use tweet analysis for complementing the urban policy indicators like Seoul Survey. Therefore, as key words indicating the residential satisfaction, 3 items of safety, amenity and convenience were selected through survey of related studies. As for data collected from 30th, Nov., 2012 to 10th, Jan., 2013, the total 516 tweets containing selected key words were abstracted. After parsing time information, contents and coordinate value of twitter data, this study conducted mapping of tweets using ArcGIS Desktop 10.1, examined a spatial distribution by city ·province·district and made an analysis by time zone and day of the week to discover a distributional pattern. And then, it conducted comparison· analysis of the relative distribution of tweets by district and key word within Seoul with 'City Safety Grade' and 'Residential Environment Satisfaction' of Seoul Survey along with tweet contents analysis. Research findings are as follows. First, this study abstracted tweets containing evaluation of the residential environs from twitter data, and identified spatial distributions of every tweet collected during data collection periods and of tweet including key words. 3 items of key words indicating safety, amenity and convenience of the residential environs were selected referring to the related literature and mapping was done for tweets to identify their spatial distribution. Tweets happened mainly from large cities like Seoul and Busan, showing that most tweets happened mainly from Gangnam-Gu, Jung-Gu, Mapo-Gu at Seoul. Tweets including key words also happened intensively from Gangnam-Gu with spatial bias of data. Second, this study analyzed a distributional pattern of key words containing tweets by time zone and day of the week. In case of tweets containing a key word of 'amenity', inconvenience of 'parking' was shown mainly in the afternoon movement is frequent and inconvenience of 'noise' at night. In other words, they distributed at time zone fitting for a key word according to the general life pattern. There was no significant pattern by day of the week. Third, comparing the rate of the entire tweets of each district of Seoul with that of tweets mentioning 'Residence Unsafety' and 'Residence Dissatisfaction', this study identified regions felt relatively more insecure and dissatisfactory than any other region and compared them with Seoul Survey findings. The top 3 regions, showing higher sensitivity to 'Residence Unsafety' on tweet data, were Eunpyeong-Gu, Gangdong-Gu and Dobong-Gu and there was no correlation with the result of Seoul Survey 'City Grade'. Regions showing higher sensitivity to 'residence dissatisfaction' were Jongno-Gu, Gwanggin-Gu, Seongbuk-Gu, Geumcheon-Gu. Considering that regions of lower 'Residential Environment Satisfaction' of Seoul Survey are around downtown area, it shows that people feel more dissatisfaction with the residential region in downtown area. Fourth, as the result of analyzing tweet contents of regions that tweets containing 'Residence Unsafety' and 'Residence Dissatisfaction' were most posted, this study identified that repetitive anxiety or dissatisfaction is shown from the certain region on the same problem. It means that regional difference within a district can be read from twitter data and evaluation of a region from twitter data can have objectivity as opinions of majority rather than an individual subjective opinion if huge amount of data can be analyzed. In addition, as data were collected during the winter, there were many things related to accidents on an icy road in terms of 'safety'. As twitter contains the 'present', it's expected to examine difference by season if data are collected and analyzed for a long time. This study has significance in that it attempted a spatial analysis firstly through twitter data unlike domestic existing studies. It aims at abstracting information containing residential environment evaluation from twitter taking notice of the fact that twitter contains information on the 'present' and using for complementing urban policy indicators. Hereafter, further study is required to increase objectivity and accuracy when selecting a key word and abstracting tweet including a key word. In case of selecting and analyzing key words of various fields contained in the present urban policy indicator in addition to the residential environment, it's expected to be used for supplementing the existing urban policy indicators.;규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 가운데, 기존의 데이터로부터 가치 있는 정보를 찾는 것이 화두가 되었다. 다양하고 방대한 규모의 데이터로부터 의미를 읽어내고, 새로운 가치를 창출하는 것이 미래 경쟁력을 좌우하는 중요한 ‘자원’으로 활용될 수 있다는 점에서 주목받고 있기 때문이다. 많은 사람들이 자신의 현재를 기록하고 관심사를 공유하는 트위터와 같은 SNS는 하루에도 몇 억건씩 발생할 정도로 데이터 양이 방대하다는 점과 이용자들이 자발적으로 참여하여 의견을 올린다는 점에서 사람들의 관심사나 이슈사항에 대한 반응을 살피는 데에 활용이 되고 있다. 한편, 도시정책지표는 도시의 현재 상태를 진단하고 효율적인 정책을 수립하는 데에 참고하고자 그 필요성이 제기되어 왔고, 서울시에서는 2003년부터 서울서베이를 통해 서울시의 상태를 다양한 측면에서 평가해 왔다. 그러나, 서울서베이와 같은 구조적인 설문의 경우, 1-5점 척도 등을 제시하여 응답하도록 함으로써 전반적인 경향을 파악하기에는 용이하나, 구체적인 이유나 적극적인 의견을 얻기에는 한계가 있다. 이러한 배경을 바탕으로 본 연구는 트위터에 이용자들이 올리는 ‘현재’에 대한 정보가 있다는 점에 주목하여 트위터 데이터 중 주거환경에 대한 평가를 담은 트윗을 추출하여 공간적 분석을 수행하고, 도시정책지표를 보완하는 데에 트윗 분석이 활용될 수 있는지 그 가능성을 보는 것을 목적으로 한다. 이를 위하여 주거환경에 대한 평가를 나타낼 수 있는 주제어들을 관련 연구들을 조사하여, 안전성, 쾌적성, 편리성의 3가지 항목으로 선정하였다. 2012년 11월 30일~ 2013년 1월 10일까지 수집 된 데이터 중 선정한 주제어들을 포함하는 트윗을 추출하였으며, 총 516개의 트윗이 추출되었다. 트위터 데이터가 가진 시간 정보, 내용, 좌표값을 파싱한 후 ArcGIS Desktop 10.1을 이용하여 트윗을 지도화 하고 시도별·구별 공간적 분포를 보았으며, 분포 패턴을 찾고자 시간대별, 요일별 분석을 하였다. 이후 서울시 내 구별 주제어별 트윗의 상대적 분포와 서울서베이의 ‘도시 안전도’, ‘주거환경만족도’를 비교·분석하고, 트윗의 내용을 분석하였다. 연구 결과는 다음과 같이 요약할 수 있다. 첫째, 본 연구는 트위터 데이터로부터 주거환경에 대한 평가를 담은 트윗을 추출하고, 데이터 수집기간 동안 수집한 모든 트윗의 공간적 분포와 주제어를 포함한 트윗의 공간적 분포를 확인하였다. 주거환경에 대한 안전성, 쾌적성, 편리성 3가지 항목의 주제어를 관련 문헌을 참고하여 선정하고, 트윗을 지도에 나타내어 그 공간적 분포를 확인하였다. 전체 트윗은 서울과 부산 등의 대도시에서 주로 발생하였으며, 서울시 내에서 트윗은 강남구, 마포구, 중구 일대에서 주로 많이 올라오는 것으로 나타났다. 주제어를 포함하는 트윗 역시 강남구 일대에서 데이터가 공간적으로 편향되어 집중적으로 발생하고 있었다. 둘째, 시간대별, 요일별로 각 주제어를 포함한 트윗의 분포 패턴을 분석하였는데 ‘쾌적성’을 나타내는 주제어를 포함한 트윗의 경우 ‘주차’에 대한 불편은 이동이 많은 오후 시간대에, ‘소음’에 대한 불편은 밤 시간대에 더 많이 나타나는 등 대체로 주제어별로 그에 맞는 일반적인 생활패턴에 따라 맞는 시간대에 분포하고 있음을 확인하였다. 요일별로는 유의미한 패턴이 나타나지 않았다. 셋째, 서울시 내 각 구별 전체 트윗의 비율과 ‘주거지 불안전’, ‘주거지불만족’에 대해 언급하는 트윗의 비율을 비교하여, 상대적으로 다른 지역보다 더 불안하게 느끼고, 불만족하는 지역을 확인하고, 서울서베이의 결과와 비교하였다. 트윗 데이터의 ‘주거지 불안전’ 민감도가 높게 나타난 상위 3개 지역은 은평구, 강동구, 도봉구였으며, 서울서베이의 ‘도시안전도’ 결과와 별 상관이 없었다. ‘주거지 불만족’의 민감도가 높게 나타난 지역은 종로구, 광진구, 성북구, 금천구였으며, 서울서베이의 ‘주거환경만족도’가 낮게 나타난 지역이 도심권역 일대임을 볼 때 도심권 일대에서 주거지역에 대해 불만족을 보다 더 느끼는 것을 알 수 있었다. 넷째, ‘주거지 불안’과 ‘주거지 불만족’에 대한 내용을 포함하는 트윗이 가장 많이 올라온 지역의 트윗 내용을 분석한 결과, 특정 지역에서 반복적으로 같은 문제에 대해 불안을 느끼거나 불만을 나타내는 것을 확인할 수 있었다. 이는 트위터 데이터로부터 구 안에서의 지역별 차이를 읽을 수 있음과 방대한 양의 데이터를 분석할 시, 트위터 데이터에서 얻을 수 있는 한 지역에 대한 평가가 한 개인의 주관적 의견에 그치지 않고 다수의 의견으로 보다 객관성을 가질 수 있음을 의미한다. 또한, 데이터 수집기간이 겨울이었기 때문에 ‘안전성’ 측면에서 주로 겨울철 빙판길의 사고와 관련된 내용이 많았는데, 트위터가 ‘현재’를 담고 있으므로 장기간 동안 데이터를 수집하여 분석할 시 계절에 따른 차이도 확인할 수 있을 것으로 기대되었다. 본 연구는 국내의 기존 연구들과 달리 트위터 데이터를 통해 공간적 분석을 처음으로 시도하였다는 데에 의의가 있으며, 트위터가 ‘현재’에 대한 정보를 포함하는 것에 주목하여 트위터로부터 주거환경에 대한 평가를 담은 정보를 추출하고, 도시정책지표를 보완하는 데에 활용될 수 있는지 보고자 하였다. 향후 주제어 선정 및 주제어를 포함한 트윗을 추출하는 데에 객관성 및 정확성을 높이기 위한 추가적인 연구가 필요하며, 주거환경 뿐 아니라 현재의 도시정책지표가 포함하고 있는 다양한 분야의 주제어들을 선정하고 분석 할 때에 실제로 기존의 도시정책지표를 보완하는 데에 활용될 수 있을 것으로 기대된다.-
dc.description.tableofcontentsⅠ. 서론 1 A. 연구의 배경 및 목적 1 B. 연구 내용 4 C. 연구 방법 5 Ⅱ. 이론적 배경 및 선행연구 7 A. 빅데이터와 SNS분석 7 B. SNS분석을 위한 비정형 데이터 마이닝 12 C. 선행연구 15 Ⅲ. 주제어 선정 및 시각화 21 A. 분석 대상 21 B. 주제어 선정 25 C. 해당 주제어의 분석 31 Ⅳ. 트윗의 분포 및 서울서베이 47 A. 서울서베이 47 B. 주제어별 트윗 분포 및 서울서베이와 비교 51 C. 내용 분석 60 Ⅴ. 요약 및 결론 63 참고문헌 67 ABSTRACT 71-
dc.formatapplication/pdf-
dc.format.extent2319842 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc300-
dc.titleSNS데이터의 도시정책지표로서의 활용 가능성 연구-
dc.typeMaster's Thesis-
dc.title.subtitle트윗 데이터의 주거환경 만족에 대한 공간적 특성-
dc.title.translatedA study on the Applicability of SNS Data for the Urban Policy Indicator : Tweet data on the Spatial Characteristics of the Residential Environment Satisfaction-
dc.creator.othernamePark, Jae Hee-
dc.format.pagexi, 73 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 사회과교육학과-
dc.date.awarded2013. 8-
Appears in Collections:
일반대학원 > 사회과교육학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE