동시출현단어 분석에 의한 오픈 액세스 분야 지적구조에 관한 연구

Other Titles
A Study on the Intellectual Structure Using Co-Word Analysis in the Field of Open Access
Issue Date
대학원 문헌정보학과
이화여자대학교 대학원
최근 정보기술의 발전과 학술자료 구입·구독의 문제점, 공공기금에 의한 연구 성과물에 대한 비상업적인 무료 공유 등에서 비롯된 학술 커뮤니케이션의 위기를 해소할 수 있는 대안으로 오픈 액세스에 대한 관심이 고조되고 있다. 이와 같은 학술 정보 유통의 새로운 패러다임인 오픈 액세스의 움직임은 전 세계의 지지 성명 발표와 더불어 연구자뿐만 아니라 학회, 도서관, 출판사에서 자발적으로 동참하고 있으며, 이에 따른 발전과 그 변화의 폭에 주목할 필요가 있다. 계량정보학에서는 학술 문헌을 대상으로 정량적인 분석을 실시하여 그 학문 분야의 지적구조를 파악할 수 있으며, 동시출현단어 분석은 이러한 지적구조 분석의 도구 중 하나이다. 동시출현단어 분석은 특정 연구 영역 안에서 단어 또는 명사구 쌍이 동시에 출현하는 패턴을 측정하고 분석함으로써 서로 관련된 키워드 간의 유사성을 바탕으로 주제의 관계를 직접적으로 확인 가능하게 한다. 따라서 본 연구의 목적은 국외의 오픈 액세스를 주제로 한 연구 문헌들을 수집하여, 동시출현단어 분석을 실시함으로써 국외 오픈 액세스 연구 경향을 반영하는 지적구조를 분석 하고자 하였다. 분석 대상은 국외 데이터베이스인 WoS에서 저널 범주를 문헌정보학범주로 제한하고, 관련 문헌들을 수집하기 위한 키워드를 “open access”, “open access journal”, “institutional repositor*”으로 검색하였다. 검색기간 1998년 1월 1일부터 2012년 7월 31일까지의 Topic 검색을 통하여 순수 연구 논문 464건과 리뷰 15건으로 총 479건을 수집하였다. 분석 대상 키워드는 제목과 초록에서 단어들을 추출하였으며, 추출된 키워드들의 정규화 작업 후 문헌 빈도수 6회 이상의 키워드 84개를 최종 분석 대상 키워드로 선정하였다. 선정된 84개의 키워드들의 동시출현단어 행렬을 산출하였으며, 이 과정에서 코사인계수와 피어슨 상관계수를 적용하여 행렬을 작성하였다. 이후 네트워크 분석을 실시하여, 키워드들 간의 관계를 패스파인더 네트워크로 시각화하고, 병렬 최근접 이웃 클러스터링 군집으로 형성하여 오픈 액세스 분야의 세부 주제 영역을 살펴보았다. 이와 함께 중심성 분석을 통해 전역 중심의 키워드와 지역 중심의 키워드, 매개 중심의 키워드를 확인하였다. 또한, 군집분석을 실시하여 네트워크 분석을 보완하였고, 군집분석의 결과를 MDS 지도상에 함께 나타내어 2차원 공간상의 키워드지도를 작성하였다. 이를 통해 국외 오픈 액세스 분야의 지적구조를 제시하고, 세부 주제 영역의 구성을 파악하였다. 네트워크 분석으로 오픈 액세스 분야 키워드들의 지적구조를 시각화하여 얻은 결과는 다음과 같다. 첫째, 패스파인더 네트워크와 병렬 최근접 이웃 클러스터링 기법으로 키워드들 사이의 관계를 시각화 하고 군집을 형성한 결과, 18개의 군집으로 구성되었다. 둘째, 오픈 액세스 분야의 네트워크 중심성 분석 결과, 전역중심성이 가장 높은 키워드는 open access였으며, 그 다음으로는 open access journals, institutional repositories, scholarly communication등의 순으로 나타났다. 전역중심성이 높은 키워드들은 대부분 제 1군집 오픈 액세스에 속해 있었다. 셋째, 오픈 액세스 분야의 네트워크 중심성 분석 결과, 지역중심성이 가장 높은 키워드는 open access였으며, 그 다음으로 oa article, research article, scholarly journals등의 순으로 나타났다. 넷째, 오픈 액세스 분야의 네트워크 중심성 분석 결과, 매개중심성이 가장 높은 키워드는 open access였으며. institutional repositories, scholarly communication, open access journals등의 순으로 나타났다. 군집분석을 실시하고, 키워드들의 지적관계를 MDS 지도에 시각화하여 얻은 결과를 정리하면 다음과 같다. 첫째, 군집분석 결과 총 4개의 군집으로 분류되었으며, 형성된 군집은 제 1군집 Institutional Repositories, 제 2군집 Informetric Analysis on Open Access, 제 3군집 Open Access Journals, 제 4군집 Scholarly Publishing이다. 이들 각 군집은 오픈 액세스 분야의 세부 연구 영역을 나타냈다. 둘째, 다차원척도법으로 2차원 지도상에 84개의 키워드들을 나타낸 결과, 각 키워드들의 위치는 키워드들 간의 상관관계에 따라 나타났다. 셋째, 군집분석 결과를 MDS 지도에 표시하여 해석한 결과, MDS 지도상에서 군집분석에 의해 형성된 제 1군집과 제 2군집의 세부 키워드들이 확연하게 분리되어 위치하였다. 지도상의 중심부에는 제 3군집과 제 4군집에 해당하는 키워드들이 위치하고 있으며, 이는 이 두 군집의 키워드들이 다른 모든 연구와 상관관계가 높으며, 오픈 액세스 분야 연구의 중심축에 위치하고 있음을 보여준다. 넷째, 네트워크 기반의 지적구조와 군집분석과 MDS 지도에 나타낸 지적구조의 결과를 비교하면 다음과 같다. 네트워크 분석에 의해 구분되는 18개의 연구 영역과 군집분석에 의해 구분되는 4개의 연구 영역을 비교할 때, 전체 오픈 액세스 분야의 연구 경향에 따른 세부 주제 키워드는 약 60퍼센트 일치한다. 이는 두 분석 기법의 알고리즘에 의한 차이로 판단되며, 그 해석에 관하여 융통성을 가질 필요가 있다. 이상과 같이 본 연구는 동시출현단어 분석을 통해 국외 문헌정보학 기반 오픈 액세스 분야의 연구 영역을 나타내는 지적구조를 규명하였다. 본 연구는 국외 문헌정보학 범주 오픈 액세스 분야의 지적구조를 나타낼 수 있다는 점에서 의의를 가지며, 이 연구는 국내 오픈 액세스 분야의 연구 방향성 모색에 유용하게 사용될 수 있을 것이다. 또한 키워드들 사이의 세부 주제 네트워크가 어떻게 형성되었는지 확인하고자 하는 연구자들에게 도움이 될 수 있을 것이다.;Open Access has been recognized as the paradigm shift of the traditional subscription-based model for print and electronic scholarly publishing. It is considered the most hopeful solution to the problems, such as i)“pricing crisis”, that is caused by high rates imposed by publisher, ii)“permission crisis”, that is caused by constraints of the copyright law in scholarly communication. Also, some academic world has voiced an opinion which makes publicly funded research output freely accessible. In response to the above crisis of scholarly publication, many authors, its societies, institutions, libraries, and even governments have begun to support the Open Access. Discussion about Open Access has dominated in Library Information Science. It is a comprehensive notion with the wide range of complex issues that are involved such as copyright, policy, business models, archiving and many others. Therefore, the aim of this paper is to identify the international research paradigms on Open Access via Informetric Analysis. The co-word analysis is a content analysis technique that counts and analyzes the co-occurrence of keywords in the publications on a given subject. Thus, the result of co-occurrence keywords relationships could provide an immediate cognitive and intellectual structures of the actual content of the specific field. For this reason, the co-word analysis has been used to reveal the patterns of Open Access field in international research. Data was collected from WoS database during the period of 1998.01.01.-2012.07.31. For retrieving the related articles of Open Access field, query keywords, “open access”, “open access journal”, and “institutional repositories*” in LIS category, were used. A total of 479 documents were collected and the keywords were extracted from titles and abstracts as a noun phrase format. Such noun phrases were standardized and for selecting keywords to be analyzed. I selected 84 unit keywords occurred at least 6 documents among 479 documents. 84-by-84 co-occurrence matrix was constructed and transformed into the similarity matrix and correlation matrix by using Cosine coefficient and Pearson’s correlation coefficient. Pathfinder network(PFNet) was applied to visualize intellectual interchanges among keywords, and Parallel Nearest Neighbor Clustering(PNNC) was applied to make clusters in network analysis. The centrality analysis in the weighted networks was employed to find out the top global centrality keyword and the top local centrality keyword. Additionally, hierarchical cluster analysis was conducted to examine subject structure and clusters displayed as a dendrogram and indicated keyword clusters onto Multi-Dimensional Scaling(MDS) map. The results of intellectual structure by network analysis in the field of Open Access are as follows. First, the result of intellectual structure analysis by PFnet & PNNC has shown 18 clusters reflecting core subject areas. Second, the result of centrality analysis in the weighted networks has shown that the top keyword of global centrality, which is the most core keyword in Open Access, is ‘open access’ followed by ‘open access journals’, ‘institutional repositories’, ‘scholarly communication’, etc. Third, the result of centrality analysis in the weighted networks has shown that the top keyword of local centrality, which is the most influential keyword in Open Access, is ‘open access’ followed by ‘oa article’, ‘research article’, ‘scholarly journals’, etc. Fourth, the result of centrality analysis in the networks has shown that the top keyword of betweenness centrality which is the most role of gatekeeper-keyword in Open Access is ‘open access’ followed by ‘institutional repositories’, ‘scholarly communication’, ‘open access journals’, etc. The results of intellectual structure by hierarchical cluster analysis in the field of Open Access are as follows. First, the result of intellectual structure analysis by hierarchical cluster analysis has shown 4 clusters reflecting core subject areas and each cluster were circled in the two-dimensional map by MDS. The name of these clusters are Cluster 1(Institutional Repositories), Cluster 2(Informetric Analysis on Open Access), Cluster 3(Open Access Journals), and Cluster 4(Scholarly Publishing). Second, the result of MDS mapping has shown that keywords were mapped in the two-dimensional space based on the correlation among keywords. Third, the keywords of the Cluster 2 and Cluster 1 were comparatively and separately arranged on the MDS map from the left to the right. And the keywords of the Cluster 3 and Cluster 4 were arranged on the center of the MDS map from the bottom to the top. Also, it could be seen in the map that these keywords in both Cluster 3 and Cluster 4 are highly correlated to the other research topics and significant themes in Open Access research field. Fourth, In compared with the 18 clusters that are divided by PFnet & PNNC analysis and the 4 clusters that are divided by hierarchical cluster analysis, detailed keywords are approximately 60 percent matched according to research trends in the field of full open access. It seems to be that the algorithm of two different methods causes the difference of cluster units and it is necessary to have the flexibility in the reasonable analysis results of Open Access field. The results of intellectual structure of international studies in Open Access field were achieved using the co-word analysis, including relationship between research topics. This study has significant finding of the general overview and current research trends in Open Access field of LIS. The result of this study could be utilized to seek the research direction in domestic studies in Open Access field.
