View : 234 Download: 0

동시출현단어분석을 통한 국내외 빅데이터 분야 연구동향 비교에 관한 연구

Title
동시출현단어분석을 통한 국내외 빅데이터 분야 연구동향 비교에 관한 연구
Other Titles
A Comparative study of Research Trend in the Field of Big Data Using Co-Word Analysis
Authors
김수연
Issue Date
2016
Department/Major
대학원 문헌정보학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
정은경
Abstract
본 연구에서는 빅데이터를 주제로 한 국내외 문헌을 수집하여, 동시출현단어 분석을 실시하여 빅데이터의 지적구조를 파악하고 국내외 연구동향을 비교하였다. 분석 대상 데이터베이스로 국내는 한국학술지인용색인(KCI), 국외는 Web of Science core collection를 선정하였다. 관련 문헌을 검색하기 위해 KCI에서는 논문제목과 키워드, 초록 필드에서‘빅데이터’란 질의어로 검색하였으며, WoS에서는 Topic 검색에서‘big data’라는 키워드를 사용하여 검색을 진행하였다. 검색 대상 기간은 2009년 1월 1일부터 2015년 12월 31일까지로 설정하였다. 수집된 문헌에서 중복 문헌을 제외한 최종 분석대상 문헌은 국내 778건, 국외 2,135건이다. 분석 대상 키워드로 KCI에서는 저자 키워드, Web of Science에서는 저자 키워드와 키워드 플러스에 부여되어 있는 키워드를 선정하였으며, 저자키워드가 부여되어 있지 않은 경우 제목과 초록에서 키워드를 추출하였다. 추출된 키워드들의 정규화 작업 후 국내는 문헌 빈도수 4회 이상의 키워드 83개, 국외는 문헌빈도 15회 이상의 키워드 86개를 최종 분석 키워드로 선정하였다. 선정된 키워드들의 동시출현단어 행렬과 코사인 계수 행렬, 피어슨 상관계수 행렬을 산출하였다. 이후 피어슨 상관계수 행렬을 대상으로 네트워크 분석과 군집분석, 다차원척도분석을 실시하였다. 네트워크 분석에서 패스파인더 네트워크와 병렬 최근접 이웃 클러스터링 알고리즘을 통해 형성된 군집은 국내 22군집, 국외 20군집이다. 중심성 분석을 통해 전역중심성, 지역중심성, 매개중심성이 높은 키워드를 확인하였으며, 이를 통해 국내외 빅데이터 분야의 핵심 주제어, 군집 내에서 영향력이 높은 주제어, 군집의 매개가 되는 주제어를 확인하였다. 군집분석을 통해 국내는 5군집, 국외는 6군집으로 주제 영역을 분류하였으며, 다차원분석을 적용하여 MDS 지도에 키워드 사이의 관계를 시각화하였다. 국내외 빅데이터의 연구 동향을 비교한 결과는 다음과 같다. 첫째, WoS 주제 분야 분류를 통해 빅데이터와 관련된 연구는 공학, 컴퓨터학, 과학 및 기술, 경영 및 경제, 수학, 정보통신 분야에서 활발하게 이루어지는 것을 확인하였다. 둘째, 국내외 빅데이터 분야에서 공통으로 나타난 핵심 주제어는 빅데이터분석, 데이터마이닝, 소셜네트워크, 맵리듀스인 것으로 나타났다. 국내 빅데이터 분야에서 핵심 주제어로 나타난 키워드는 정보보호, 사생활, 개인정보보호법이었으며, 국외에서 나타난 핵심 주제어는 Prediction, Cloud Computing, Internet이었다. 셋째, 군집분석을 통해 공통적으로 나타난 하위 주제 영역은‘빅데이터 저장 및 처리 기술’과‘데이터마이닝’으로 나타났다. 넷째, 군집분석을 통해 국내와 국외에서 특정 주제 분야가 출현하는 현상을 확인할 수 있었다. 국내는 정보보호 군집, 국외는 의료와 생물정보학 군집이 출현하는 것을 확인하였다. 본 연구의 결과는 국내외 빅데이터 분야의 최근 연구 동향을 파악할 수 있도록 해주며, 향후 연구 방향성을 모색하고자 하는 연구자들에게 유용한 정보를 제공해 줄 것이다.;The purpose of this study is to compare the research trend of domestic and international in the field of Big data research by using Co-word Analysis. Data was collected from KCI for domestic analysis and Web of Science for foreign analysis during the period of 2009 to 2015. For retrieving the related articles of Big Data field, query keyword‘big data’were used. Keywords were extracted from author keyword field of KCI and author keyword, keyword plus fields from WoS. 83 keywords with occurrence frequency 4 or higher for KCI and 86 keywords from occurrence frequency 15 or higher for WoS were selected as core keywords after standardizing keywords. Co-occurrence matrix was constructed and transformed into the cosine similarity matrix and Pearson’s correlation matrix. Using the Pathfinder network and Parallel nearest neighbor clustering techniques, 22 clusters for Korea and 20 clusters for foreign country were identified. The centrality analysis in the weighted networks were employed to find out the top global keyword, top betweenness centrality keyword and top local centrality keyword. The result of hierarchical cluster analysis has shown 5 clusters for Korea, 6 clusters for foreign country. By applying multidimensional analysis, relationships between keyword were visualized on MDS maps. The results of comparative study in the field of Big data Research are as follows. First, Big data research has been done actively in ‘Engineering’, ‘Computer Science’, ‘Science & Technology’, ‘Business & Economics’, ‘Mathematics’, “Telecommunications’field. Second, Common core keywords appeared in both country are ‘Big data analysis’, ‘Data Mining’, ‘Social Network’, ‘MapReduce’. The core keywords of Korea are ‘Information Security’, ‘Privacy’, ‘Privacy Protection Act’. The core keywords of foreign country are ‘Prediction’and ‘Data Mining’. Third, ‘Big data storage & processing techniques’ and ‘Data Mining’ were identified on both clusters. Fourth, emergence of specific sub-disciplines in a comparison were found through cluster analysis. Information security cluster emerged in domestic field, Healthcare and Bioinformatics clusters emerged in international field. This study provides current research trends in Big Data field. The result of this study could be utilized to seek the research direction in Big Data field.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 문헌정보학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE