View : 279 Download: 0

시간적 공저 네트워크의 구조 분석에 관한 연구

Title
시간적 공저 네트워크의 구조 분석에 관한 연구
Other Titles
An analysis on the structure of temporal co-authorship networks
Authors
서선경
Issue Date
2023
Department/Major
대학원 문헌정보학과
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
정은경
Abstract
시간적 네트워크(temporal network)는 네트워크 과학 영역의 하위 분야로서 그동안 물리학, 컴퓨터 과학, 신경과학, 생태학, 다학제 분야 등 여러 연구 영역에서 다각한 측면으로 연구가 활발하게 수행되고 있다. 시간적 네트워크에서 노드와 링크는 그 자체로 동적 개체들이고, 시간적 네트워크와 그 동작에 대한 적절한 설명에는 시간적 네트워크의 구조적 및 동적 개체들의 통합적인 모델링이 필요하다(Masuda & Lambiotte, 2016). 공저 네트워크에서는 문헌의 출판연도 정보로부터 시간이 지남에 따라 공저 관계가 형성되고 해체되는 것을 확인하여 시간적 네트워크를 구축할 수 있다. 이에 본 연구의 목적은 계량정보학 측면에서 시간적 네트워크 모델링을 목표로 데이터논문과 학술논문의 전체적인 연구 협업 현황을 진화적 관점으로 분석하고, 시간적 공저 네트워크의 구조적 특성을 규명하는 것이다. 이를 위해 분석 대상으로 데이터 출판을 위한 새로운 기제를 제안한 생물다양성 분야의 혼합형 데이터학술지 Biodiversity Data Journal을 선정했다. 그리고 분석 데이터세트 기간을 2015년부터 2021년까지로 하여 2인 이상 연구자가 참여한 공저 문헌 885건(데이터논문 247건+학술논문 638건)의 서지레코드를 수집하고 저자레코드를 추출했다. 생물다양성 분야의 시간적 공저 네트워크 분석을 위해 동적 공저 네트워크 분석과 시간적 공저 네트워크 중심성 분석 그리고 시간적 공저 네트워크 시각화로 구분하여 연구를 진행했다. 동적 공저 네트워크 분석은 다시 네트워크 수준과 노드 수준, 하위집단 수준 그리고 네트워크에 내재된 속성으로 구분하고 시계열로 분석하였다. 먼저, 생물다양성 분야 데이터논문과 학술논문의 동적 공저 네트워크에서 확인된 구조적, 진화적 특성을 정리하면 다음과 같다. 첫째, 네트워크 수준에서 분석한 결과, 데이터논문과 학술논문 동적 공저 네트워크는 시간과 네트워크 크기가 증가함에 따라 네트워크 밀도가 감소하는 점점 더 성기게(sparsely) 연결되는 네트워크임을 확인했다. 생물다양성 분야 데이터논문과 학술논문 동적 공저 네트워크는 모두, 시간이 경과 할수록 네트워크 밀도가 증가하는 조밀한 네트워크 구조가 아니라 파편화된 네트워크 구조를 유지하는 것으로 확인됐다. 둘째, 노드 수준에서 분석한 결과, 데이터논문과 학술논문 동적 공저 네트워크는 시간이 지남에 따라 네트워크가 성장할수록 평균 경로거리와 직경이 증가하는 경향임을 확인했다. 또한 시간 경과에 따른 연결정도 분포 추이를 파악하여 생물다양성 분야 데이터논문과 학술논문 동적 공저 네트워크에서 네트워크가 진화하는 동안 멱함수 분포를 따르는 무척도 네트워크 속성이 나타남을 확인했다. 셋째, 하위집단 수준에서 분석한 결과, 데이터논문과 학술논문 동적 공저 네트워크는 네트워크가 성장할수록 연결 컴포넌트 수가 증가함을 확인했다. 또한 데이터논문과 학술논문의 동적 공저 네트워크에서 파당의 비율이 70% 이상 유지됨을 확인했으며, 이를 통해 국지적으로 응집된 저자들의 관계 구조가 시간이 경과 되어도 지속되고 있음을 파악했다. 넷째, 네트워크에 내재된 속성을 분석한 결과, 생물다양성 분야 데이터논문과 학술논문 동적 공저 네트워크는 저자들의 유유상종 현상이 나타나고 좁은 세상 현상이 나타나며 네트워크가 진화하는 동안 이 구조적 특성이 유지되고 있음을 확인했다. 다섯째, 동적 접근으로 시간적 공저 네트워크를 시각화 한 결과, 생물다양성 분야 데이터논문과 학술논문 시간적 공저 네트워크에서 드러나는 구조적 차이를 확인했다. 데이터논문 시간적 공저 네트워크는 진화하면서 비교적 크기가 큰 저자 집단들이 여러 개 존재하는 것이 확인됐으며, 이는 데이터를 다루는 연구자 집단의 협업 구조에 대한 특성으로 해석할 수 있다. 반면에 학술논문 시간적 공저 네트워크는 데이터논문 시간적 공저 네트워크보다는 가장 큰 컴포넌트에 연결의 연결을 통해 이어진 형태로 나타났다. 본 연구에서는 시간적 공저 네트워크 중심성 분석을 위해 데이터논문과 학술논문의 각 서지레코드의 출판연도를 통해 시간적 네트워크에 대한 교신 시점의 중요성을 강조하는 시간적 매개중심성 지수인 TTBC(Temporal Triadic Betweenness Centrality, 시간적 삼각매개중심성)를 개발하고 분석을 수행했다. TTBC를 적용하여 도출된 결과를 정리하면 다음과 같다. 첫째, TTBC를 산출하여 시점별 등장하는 저자들과 새로운 공저 관계를 형성해서 그들 사이에 매개가 되는 저자들이 식별됐다. 구현된 TTBC를 통해 생물다양성 분야 데이터논문과 학술논문 시간적 공저 네트워크에서 시간에 따른 중요한 노드들을 시점별로 확인하고 그 변화 추이를 파악했다. 둘째, 생물다양성 분야 데이터논문과 학술논문 시간적 공저 네트워크에서 강한 연결과 약한 연결의 네트워크 구조가 나타나는 것을 발견했다. TTBC 수치를 동적 접근으로 시각화 한 결과, 저자 간 공저 관계에 대한 시간 차원이 추가되어도 약한 연결의 힘이 발현된다는 것이 명시적으로 규명됐다. 셋째, TTBC는 공저 네트워크뿐만 아니라 시간이 경과 하면서 진화하는 네트워크에서 최초 연결 시점을 파악하여 분석 대상, 단위를 설정해서 네트워크 분석에 바로 적용할 수 있는 시간 순서 영향이 고려된 새로운 측면의 전역중심성임이 확인됐다. 본 논문은 교신 시점 순서를 반영하여 흐름 역학의 측면과 시간이 지나서 노드와 링크가 재배선 되는 위상(토폴로지) 역학의 측면을 모두 고려해서 시간적 네트워크의 메트릭스를 개발한 문헌정보학 분야의 초기 연구이다. 또한 분석 대상을 데이터학술지로 하여 진화적 관점에서 데이터논문과 학술논문 저자들의 시간적 공저 네트워크의 구조적 차이를 발견하고 역동적인 공저 관계에서 발현되는 현상을 규명했다. 본 논문의 연구 결과는 향후 진행되는 후속연구들에게 유용한 기초자료로 활용되고 다양한 연구 영역에서 시간적 네트워크에 대한 통찰력을 제공하는데 기반이 될 것이다. ;Temporal network is a sub-discipline of network science that has been intensely studied in many research areas, including physics, computer science, neuroscience, ecology, and multidisciplinary fields. In temporal networks, nodes and links are dynamic entities in themselves, and an appropriate description of temporal networks and their behavior requires an integrated modeling of their structural and dynamic entities. In co-authorship networks, temporal networks can be modeled by identifying the formation and dissolution(linking and removing) of co-authorship relationships over time from the publication year information of the papers. Therefore, this study seeks to analyze the overall research collaboration status of data papers and articles from an evolutionary perspective for modeling the temporal network in terms of informetrics and investigating the dynamic and structural mechanisms of the temporal co-authorship network. For that purpose, Biodiversity Data Journal, a mixed data journal in the biodiversity domain was used as the unit of analysis in this study as this domain had proposed data paper as a new mechanism for data publication. In addition, bibliometric records of 885 publications (247 data papers + 638 articles) involving 2 or more researchers were collected from Web of Science from 2015 to 2021, and author records were extracted using BibExcel. To analyze the temporal co-authorship network in the biodiversity domain, the study was performed by dividing the approach into three parts, namely, dynamic co-authorship network analysis, temporal co-authorship network centrality analysis, and temporal co-authorship network visualization. The dynamic co-authorship network analysis was performed via approaching time series according to four aspects: the network level, node level, subgroup level, and features seen in the networks. This study has derived some observed structural and evolutionary properties of the dynamic co-authorship network in the biodiversity domain, as below. First, the main finding of the analysis at the network level was that the dynamic co-authorship networks of data papers and articles in the biodiversity domain were increasingly sparse connected networks whose density decreases as time and network size increase. It means that the dynamic co-authorship networks of both data papers and articles in the biodiversity domain maintain a fragmented network structure instead of a denser network structure even with the lapse of time. Second, at the node level, it was found that the dynamic co-authorship networks of data papers and articles in the biodiversity domain tended to increase the average path length and diameter as the network grew over time. This section also derived that by observing degree distribution changes over time, the dynamic co-authorship networks of data papers and articles in the biodiversity domain obey power-laws and possess the scale-free property of a complex network during the network evolution. Third, at the subgroup level, the analysis has shown that the number of connected components increased in the dynamic co-authorship networks of data papers and articles in the biodiversity domain as the network grew. In addition, the ratios of cliques were maintained at 70% or more in both networks during their evolution. The results indicate that the dynamic co-authorship networks of data papers and articles in the biodiversity domain kept the structure of locally cohesive author groups over time in the networks. Fourth, for the features seen in the networks, it was observed that the dynamic co-authorship networks of data papers and articles in the biodiversity domain exhibited the homophily phenomenon and the small-world property in the Watts-Strogatz sense. Notably, these structural characteristics were retained in both networks during the network evolution. Fifth and last, visualization with a dynamic approach enabled a more effective identification of analysis results, such as the exhibited structural difference in the temporal co-authorship networks of data papers and articles in the biodiversity domain. Several relatively large components comprised of a large number of co-author groups were identified in the temporal co-authorship networks of data papers as the network evolved. The presence of such components in time implies the structural properties of the networks among collaborative researchers dealing with data. In contrast, the temporal co-authorship network of articles has one relatively large and several small disjoint connected components. This finding agrees with previous studies, which state that the size of the largest connected component steadily increases over time, thereby leading to the emergence of the giant connected component in the temporal co-authorship networks as the network evolves. In this study, the TTBC(Temporal Triadic Betweenness Centrality) metric, which highlights the importance of the contact time point based on the publication year of the papers for the temporal network, was implemented and used to analyze the temporal network centrality in the temporal co-authorship networks of data papers and articles in the biodiversity domain. The findings were derived by applying TTBC and are summarized as follows. First, the TTBC metric calculation has identified the arrival of new authors added each year and the bridge authors among co-authorship relationships made(with links created) by those new authors. The implementation of TTBC has allowed for the examination and tracking of the evolutionary trends of important or influential time-dependent authors(nodes) by the target year. Second, the results of the cumulative(evolutionary) snapshots reflecting the TTBC metric values with a dynamic approach have intuitively shown the community structure. This means that the strength of weak ties, the feature shown in the networks as static graphs, is specifically revealed even when the temporal dimension was incorporated into the temporal co-authorship networks of data papers and articles in the biodiversity domain as an additional ingredient. Third and last, the TTBC metric enabled further analysis by measuring the global temporal betweenness centrality as a modern technique, with the new aspect of considering the effect of contact sequence that can be applied immediately not only to temporal co-authorship networks but also to other temporal networks by setting an object or unit and identifying the first contact point in the evolving networks. This study is the initial entry point in the library & information science domain into the study of implementing temporal network metrics with approaching flow dynamics and topology dynamics. In particular, from an evolutionary perspective, the results have shown noticeable differences in the structures of the dynamic co-authorship network between data papers and articles in the biodiversity domain. Moreover, it has investigated the properties and trends of the temporal co-authorship network of data papers and articles in the biodiversity domain. Ultimately, this study is expected to highlight how temporal network analysis using TTBC can be applied to other research areas, yielding excellent insights for further research on temporal networks.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 문헌정보학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE