데이터 출판의 동기 요인과 활성화 방안 연구

A Study on Motivations of Data Publishing and a Plan for its Promotion
대학원 문헌정보학과
이화여자대학교 대학원
A new channel called the data journal has emerged in the background of the ongoing demand for data sharing and data publishing. A data journal is a journal that publishes data paper, which contains information about data, but does not develop hypotheses or discussions. Data journals facilitate the reuse of data and provide credits to researchers. However, research on researchers' perception of data journals and data paper and their publishing experience is still insufficient, and the studies conducted so far have been mainly addressed from the perspective of publishers and funding agencies, not from the positions of data producers and authors. Therefore, this study analyzed the data publishing experience of the authors of the data journal to explore the advantages and limitations of the data journal and to find ways to promote data publishing. For the purpose of this research, this study examined the concepts related to data sharing and publication through literature research and analyzed eight data journals to investigate the data journal policy, which is classified into submission process, review process and after acceptance and publication. Next, the survey was conducted on correspondent authors of eight data journals to investigate the motivation for data publishing and to suggest ways to promote data publication. Through the literature study, this study investigated the concept of data sharing and explored the benefits of data sharing and the reasons why researchers were reluctant to share data. The concepts and components of data publishing, a form of data sharing, were also explored. Through the workflow of data publishing, this study also explored the differences between traditional and data journals. Based on an understanding of the concepts of data sharing and data publishing underlying the data journal, the mechanism of the data journal was identified. Further literature studies were conducted on the concept of the data journal and the status of the data journal policy was investigated. The eight data journals are Data in Brief, Scientific Data, Earth System Science Data, Geoscience Data Journal, Journal of Open Archaeology Data, Data, Biodiversity Data Journal, and GigaScience. This study investigates the general information and submission process, review process, after acceptance and publication process of these eight data journals. The survey was conducted on corresponding authors from eight data journals. Through the survey, this study investigated data journal authors’ perception of the data journal and opinions on the experience and satisfaction of the authors, the advantages and limitations of the data journal, at the submission process, review process, after acceptance and publication process. A total of 453 responses including 283 responses from Data in Brief, 79 responses from Scientific Data, 20 responses in Earth System Science Data, 25 responses from Data, 6 responses in Geoscience Data Journal, 20 responses in GigaScience, 16 responses in Biodiversity Data Journal were received and analyzed for this study. The survey asked about the authors' experience in the submission process of data publishing, and found that the repository should ensure long-term preservation of data, and most of authors were satisfied with the journal’s data repository guidelines, data paper templates and guidelines, and the submission system. However, in the preparation of the contribution, the authors were found to have suffered from the lack of expertise of the reviewers and editors, inconsistency in screening, unfamiliarity with the data journal, expensive publishing costs, unfriendly templates and template formats. At the review process, the authors considered the validity of the data as the most important criteria for peer-review, and the preferred peer review method was double blind peer review. Satisfaction with peer review processes in the data journal was high. However, the authors could see that they had difficulty in review process due to long review periods, problems with the expertise of the reviewers and inconsistencies in the criteria of the review, the confusion caused by the inadequateness of the template guidelines, and unfamiliarity with the data journal. The authors' satisfaction was also high during the after acceptance and publication process. The service that the authors most expect from the Data Journal was rapid online publishing. When asked about the advantages and limitations of data journals, the authors cited data re-use and use availability, rapid review processes, more citations, improved transparency and validity in data sharing as advantages of data journals, and cited expensive article processing charges, slow publishing processes, and low understanding of data journals by reviewers and editors as disadvantages. There was a significant difference between frequency of publishing data journals and familiarity of the data journal publications. Also this study analyses the impact of authors' experiences in the data submission process, the peer-review process, and the after acceptance and publication process on the resubmission intention. The following are suggestions on how to promote data publishing for data journal authors through the results of statistical analysis. In the submission process, data journals need to help authors understand the role of repository and motivate them to publish data journals. Data repositories are a key component of the data publishing process and important distinction between traditional journals and data journals. Therefore, it is necessary to increase accessibility of the repository information to the authors by presenting the repository guidelines within the author guidelines. In addition, it was suggested that a detailed list of recommended repositories should be provided. Peer review of data journals should be different from that of traditional papers. Data journals should provide appropriate peer review criteria such as validity of data, consistency of data, and appropriateness of methodology behind the creation of data and these criteria should be classified into adequate category and should continue to discuss about open peer review to ensure transparency of the review. In the after acceptance and publication process, this study indicates that improving the speed of online publishing, which many authors said was a limitation of the data journal, would also improve the authors' perception of re-submission. It will also be necessary to improve services such as Usage statistics (e.g., the number of downloads, views, tweets, etc.), Bidirectional links between data in a data repository and a data paper, Link to published data paper shared on social media. This study is meaningful in that it analyzed the experience of the data publishing process from the perspective of the authors of the data journal and further suggested ways to promote data publishing for the authors. Through the analysis of data publishing experience from the perspective of data journal authors, the promotion of data publication can be expected.;데이터 공유에 대한 지속적인 요구와 데이터 출판이라는 배경 속에서 데이터 저널이라는 새로운 채널이 등장했다. 데이터 저널은 데이터 페이퍼를 출판하는 저널로 데이터 페이퍼는 데이터에 대한 정보를 담되 가설이나 논의를 전개하지는 않는다. 데이터 저널은 데이터의 재이용을 촉진하고 연구자에게 추가적인 업적을 제공한다. 그러나 데이터 저널 및 데이터 페이퍼에 대한 연구자들의 인식과 출판 경험에 대한 연구는 아직 미흡한 실정이며, 지금까지 진행된 연구들도 데이터 생산자 및 저자의 입장이 아닌 출판사 및 연구비 지원 기관의 입장에서 주로 다루어지고 있었다. 따라서 본 연구는 데이터 저널 저자들의 데이터 출판 경험을 분석하여 데이터 저널의 장점과 한계점을 알아보고 데이터 출판 활성화 방안을 찾고자 하였다. 먼저 문헌연구를 통해 데이터 공유 및 출판 관련 개념들에 대해 살펴보고 8 개 데이터 저널을 선정하여 각 저널의 투고 단계, 동료심사 단계, 게재 확정 및 출판 후 단계의 데이터 저널 정책 사례를 조사하였다. 다음으로 8개 데이터 저널의 교신저자들을 대상으로 설문조사를 진행하여 데이터 출판의 동기요인을 조사하고 데이터 출판 활성화 방안을 제시하였다. 문헌연구를 통해 데이터 공유의 개념에 대해 조사하고 데이터 공유의 이점과 연구자들이 데이터 공유를 꺼리는 이유들에 대해 알아보았다. 데이터 공유의 한 형태인 데이터 출판의 개념과 구성요소에 대해서도 파악하였다. 데이터 출판의 워크플로우를 통해 기존의 전통적인 저널과 데이터 저널의 차이점에 대해서도 알아보았다. 데이터 저널의 기반이 되는 데이터 공유와 데이터 출판의 개념에 대한 이해를 바탕으로 데이터 저널의 매커니즘을 파악하였다. 데이터 저널의 개념에 대해 추가적인 문헌연구를 진행하고 데이터 저널정책 현황을 알아보았다. 8 개 대상 데이터 저널은 Data in Brief, Scientific Data, Earth System Science Data, Geoscience Data Journal, Journal of Open Archaeology Data, Data, Biodiversity Data Journal, GigaScience들로, 문헌연구를 통해 추출한 24 개 데이터 저널 중 전체 논문 수 대비 데이터 페이퍼 비율이 20% 이상을 만족하는 저널들이 선정되었다. 이들 8 개 데이터 저널의 일반적인 정보 및 투고 단계, 동료심사 단계, 게재 확정 및 출판 후 단계에서 실시하는 정책을 조사하였다. 선정된 8 개 데이터 저널의 교신저자들을 대상으로 설문조사를 진행하였다. 설문조사를 통해 데이터 저널 저자들의 데이터 저널에 대한 인식을 조사하고 투고 단계, 동료심사 단계, 게재 확정 및 출판 후 단계에서 저자들의 경험 및 만족도, 데이터 저널의 장점 및 한계에 대한 의견을 수렴하였다. 설문조사는 배포 전 전문가의 자문을 받아 일부 문항을 수정한 후 배포 완료하였다. 설문조사 진행 결과 총 453 부의 설문 응답을 받았다. 설문조사를 통해 데이터 출판의 투고 단계에서의 저자들의 경험을 질문한 결과, 리포지터리 선택 시 데이터를 안전하게 장기간 보존할 수 있는가가 가장 중요했으며 데이터 저널에서 제공하는 리포지터리 관련 가이드라인, 데이터 페이퍼 템플릿 및 가이드라인, 투고 시스템에 대부분 만족하는 것을 알 수 있었다. 그러나 투고 준비 과정에서 저자들은 심사자 및 편집자의 전문성 부족과 비일관적인 심사, 데이터 저널에 대한 생소함, 비싼 출판비용, 불친절한 템플릿 그리고 템플릿 포맷 문제로 고충을 겪은 것으로 나타났다. 동료심사 단계에서, 저자들은 데이터의 타당성을 가장 중요한 심사기준으로 생각하였으며 선호하는 동료심사 방법은 더블 블라인드 동료심사였다. 데이터 저널의 동료심사 과정에 대한 만족도는 다소 높게 나타났다. 그러나 저자들은 긴 심사 기간, 심사자들의 전문성 및 심사 기준의 비일관성 문제, 템플릿 가이드라인의 불친절함으로 인한 혼란, 그리고 데이터 저널에 대한 생소함으로 심사의 어려움을 겪었음을 알 수 있었다. 게재 확정 및 출판 단계에서 저자들의 만족도도 높게 나타났다. 저자들이 데이터 저널에 가장 기대하는 서비스는 신속한 온라인 출판이었다. 데이터 저널에 대한 장점과 한계에 대한 질문에서 저자들은 데이터 (재)이용 가능성, 빠른 심사 과정, 더 많은 인용, 데이터 공유의 투명성 및 연구 타당성 향상 등을 데이터 저널의 장점으로 꼽았으며, 비싼 논문 출판 비용, 느린 출판 과정, 심사자 및 편집자들의 낮은 데이터 저널 이해도 등을 단점으로 꼽았다. 추리통계 분석을 통해 데이터 저널 게재 횟수와 익숙도 간에 유의미한 차이가 있음을 확인하였으며 데이터 투고 단계, 데이터 동료심사 단계, 그리고 게재 확정 및 출판 이후 단계에서의 저자들의 경험이 재투고 의향에 미치는 영향에 대해 살펴본 결과, 데이터 저널 게재 횟수와 익숙도 간, 데이터 저널 익숙도와 재투고 의향 차이 간, 데이터 리포지터리 가이드라인과 재투고 의향 간, 데이터 템플릿 및 가이드라인 유용도와 재투고 의향 간, 데이터 투고시스템 만족도와 재투고 의향 간, 동료심사 과정 만족도와 재투고 의향 간, 게재 확정 및 출판 후 만족도와 재투고 의향 간에는 유의한 차이가 나타났음을 확인하였으나 데이터 저널 게재 횟수와 재투고 의향 간에는 유의미한 관계가 없음을 확인하였다. 통계 분석 결과를 통해 데이터 저널 저자들을 위한 데이터 출판 활성화 방안에 대한 제언은 다음과 같다. 데이터 출판의 투고 단계에서, 데이터 저널은 저자 가이드라인 내 리포지터리 가이드라인을 제시하여 저자들에게 리포지터리 정보에 대한 접근성을 높일 필요가 있다. 그리고 추천 리포지터리 목록을 상세하게 제시하여 리포지터리에 대한 상세한 정보를 제공해야 한다. 투고 준비 과정에서 템플릿의 불친절함과 포맷 문제에 대한 저자들의 고충을 해결하기 위하여 데이터 저널들은 LaTeX 시스템과 같이 저자 친화적인 데이터 템플릿 및 집필 프로그램을 제공해야 한다. 동료심사 과정에서 데이터 저널 저자들은 심사자들의 심사 기준이 일관적이지 않고 전문성이 부족하다고 토로하였다. 이에 저널은 Scopus Hirsch-Index(HI)를 이용하여 심사자의 전문성을 확보할 필요가 있다. 게재 확정 및 출판 단계에서는 많은 저자들이 데이터 저널의 한계점이라고 응답하였던 온라인 출판 속도를 개선을 위해 심사기간에 제한을 두고 저자와 심사자 간의 커뮤니케이션 통로를 제공해야 한다. 또한 저자들은 데이터 저널을 출판하더라도 이를 학계로부터 인정받지 못하는 점을 한계로 꼽았다. 이를 해결하기 위해서 데이터 저널은 시니어 연구자들을 대상으로 한 데이터 저널 홍보를 진행할 필요가 있다. 본 연구는 데이터 저널 저자들의 입장에서 데이터 출판 과정 경험을 분석하고 더 나아가 저자들을 위한 데이터 출판 활성화 방안을 제시했다는 점에서 의의를 가진다. 본 연구의 데이터 저널 저자 입장에서의 데이터 출판 경험 분석을 통해 저자 중심의 데이터 출판 활성화를 기대할 수 있을 것이다.
