View : 909 Download: 0

국내 사회과학 학술연구자의 데이터 재이용 행위와 데이터요구 연구

국내 사회과학 학술연구자의 데이터 재이용 행위와 데이터요구 연구
Other Titles
A study on Data Reuse Behaviors and Data needs of Academic Researchers in the Korean Social Science Field
Issue Date
대학원 문헌정보학과
이화여자대학교 대학원
In the data-intensive current academic setting, data has become a foundation for scholarly communications as outcomes rather than by-products of research. The sharing and openness of data, the core of scientific discovery and technological innovation, has been facilitated by governments and research institutions. However, the mere expansion of data supply and the availability of accessibility cannot always lead to practical data reuse; due to the data deluge, the data management and utilization ability of individual researchers or research institutes has failed to follow their production capacity. Therefore, the data reuse behaviors and the relevant data needs should be understood in depth. In this regard, this study aimed to explore the characteristics and values ​​of data reuse in academic research activities and examine the core data needs of academic researchers with an assumption of reuse, thereby identifying the data attributes that enabled data reuse. For this purpose, the literature review of this study discussed the theoretical basis. The statistical analysis and in-depth interviews of this study investigated data reuse behaviors and data needs of Korean academic researchers in the fields. The literature review addressed the concepts and types of data reuse behaviors, and explored the ideas and types of data as a digital information resource and the attributes that guaranteed reuse. In order to examine the current data reuse status of Korean researchers, 'Documentation Usage Literature DB' provided by Korea Social Science Data Archive (KOSSDA) was used. Of the 1,546 data reuse documents produced during the last five years (2014 to 2018), a total of 626 KCI-listed academic papers produced by Korean researchers were selected for analysis. Also, statistical analysis was conducted on data reuse documents and reuse data to derive annual and thematic characteristics. Firstly, regarding the status of data reuse documents by year, it is confirmed that the ratio of the subjects of analysis increased compared to the total data reuse documents. Next, based on the KCI subject classification standard, the subjects of analysis were frequently distributed in the order of social science, medical science, and interdisciplinary studies in the major classification level. In the mid-classification level, they were frequently distributed in sociology, social science in general, and economics. Next, the distinct characteristics of reuse data by year were not found. However, based on the KOSSDA subject classification standard, the subjects of analysis were frequently distributed in the order of the economic area, general area, society and culture area. In the minor classification level, they were frequently distributed in the employment and labor area, general area, and industries and companies area. On the other hand, most of the reuse data was produced by institutions such as research institutes, government administrative agencies, and university affiliated research institutes. Moreover, by using in-depth interviews with 12 researchers who had produced KCI-listed academic papers with reused data for the past three years (2016 to 2018), this study identified the data reuse behaviors and data needs. With regard to data reuse behaviors, the data reuse factors, data reuse types, data reuse identification and acquirement paths, and data reuse processes in academic research activity cycles were discussed. With regard to data needs, seven aspects were analyzed: producer, country of production and language, type and method of collection, scale, processing level, access and use control, and up-to-dateness. The study results in terms of data reuse behaviors are as follows. First, the factors for consideration of data reuse were influenced by personal, economic, technical, and social aspects. The individual aspect included ease of research and data accessibility, and the economic aspect included research efficiency. The data reuse was conducted in a basis of changes in the information technology environment for the technological aspect, and in a basis of change in the academic atmosphere and the nature of research field and subject for the social aspect. Second, the types of data reuse were identified according to data reuse purposes; data was reused mainly as research subjects. On the other hand, according to the data reuse purposes, the number of processing levels or types of data required varied. Third, the main paths of identifying and acquiring data were web-based sources of information and informal communications within academic communities. Fourth, the process of data reuse within the academic research activity cycle was different from the general scientific research process. To specify, the stages of identifying and acquiring data were different among individual researchers, which interacted and circulated with other research stages. On the other hand, data understanding and selection, data verification, and data reorganization in a basis of data attributes was found as common research steps. The study results in terms of data needs are as follows. First, due to the appropriateness of topics, comparability, and reliability of data, institution-based producers were preferred rather than individual producers. Second, data produced in the United States or written in English was preferred, because the understandability of data was guaranteed. Third, due to data quality issues such as representativeness and reliability, quantitative data, especially data through in-person surveys filled by survey instructors, was preferred. Fourth, original materials were preferred due to availability, and various efforts were made to obtain as much metadata as possible. Also, data with identifying information of demographic and sociological characteristics within the legal limit was preferred. Fifth, although the researchers did not favor restricted-use data, they were willing to invest considerable amount of time and money in data reuse depending on their values and needs. Sixth, no clear data needs related to scale and up-to-dateness were found, since there were not enough variations of data that leads to actual preference. As such, the researchers made the most of limited range of options of data reuse. Shedding light on the potentials of data as a digital information resource and the values created through data reuse in academic research, this study focuses on the data reuse behaviors, researchers who are the subjects of the behaviors, and data that are the objects of the behaviors. It is hoped that the study contributes to archivists playing a crucial role as information management experts in the data-centered information setting and their data collection, selection, evaluation policy establishment and implementation, and user-oriented utilization services.;오늘날 점차 데이터 집약적으로 변모하는 학문 환경 속에서 데이터는 연구부산물이 아닌 연구성과물로써 학술 커뮤니케이션의 기반으로 자리 잡아가고 있다. 이와 같이 데이터는 과학적 발견과 기술적 혁신의 핵심으로써 정부나 연구기관에 의해 그 공유와 개방이 활성화되고 있다. 그러나 데이터 공급의 확대나 접근가능성의 확보만으로는 실제적인 데이터 재이용을 담보하는데 한계가 있으며 오히려 데이터 홍수(data deluge)로 인해 연구자 개인이나 연구기관의 데이터 관리 및 활용능력이 생산능력을 따라가지 못하는 상황에 놓이게 되었다. 이를 극복하기 위해서는 데이터 재이용 행위와 그를 유발하는 데이터요구를 심층적으로 파악할 필요성이 있다. 따라서 본 연구는 학술연구 활동에서 데이터 재이용이 지니는 특성 및 가치를 규명하고 재이용을 전제로 한 학술연구자의 핵심 데이터요구를 살펴봄으로써 데이터 재이용을 가능하게 하는 데이터 속성을 도출하고자 하였다. 이를 위하여 문헌연구를 통해 이론적 기반을 마련하고 통계분석과 심층면담을 통해 실제 국내 학술연구자의 데이터 재이용 행위와 데이터요구를 살펴보았다. 문헌연구를 통해 데이터 재이용 행위의 개념과 유형을 파악하였으며 디지털 정보자원으로서 데이터의 개념과 유형 그리고 재이용을 보장하는 속성을 살펴보았다. 국내 학술연구자의 데이터 재이용 현황을 알아보기 위하여 한국사회과학자료원(Korea Social Science Data Archive, 이하 KOSSDA)에서 제공하는 ‘자료이용문헌 DB’를 활용하였으며 최근 5개년(2014년~2018년) 간 생산된 데이터 재이용문헌 총 1,546건 가운데 국내 학술연구자가 생산한 KCI 등재 학술논문 626건을 분석대상으로 선정하였다. 연도별·주제별 특징을 도출하기 위한 데이터 재이용문헌과 재이용 데이터에 대한 통계분석을 실시하였다. 먼저 데이터 재이용문헌 현황을 연도별로 살펴보았을 때 분석대상은 전체 데이터 재이용문헌 대비 그 비율이 증가하고 있음이 확인되었다. 다음으로 KCI 주제분류 기준으로 분석대상을 살펴보면 대분류 수준에서는 사회과학 분야, 의약학 분야, 복합학 분야 순으로 높은 분포도를 보였으며 중분류 수준에서는 사회학, 사회과학일반, 경제학 순으로 높은 분포도를 보였다. 다음으로 재이용 데이터 현황을 연도별로 살펴보았을 때 뚜렷한 특징은 파악되지 않았다. 그러나 KOSSDA 주제분류 기준으로 분석대상을 살펴보면 경제 영역, 일반 영역, 사회와문화 영역 순으로 높은 분포도를 보였으며 소분류 기준으로 고용과노동 영역, 일반 영역, 산업과기업 영역이 높은 분포도를 보였다. 한편 재이용 데이터 대부분은 기관에서 생산되었으며 연구기관, 정부행정기관, 대학부설연구소 등으로 나타났다. 이와 더불어 최근 3개년(2016년~2018년) 간 데이터를 재이용한 KCI 등재 학술논문을 생산한 경험이 있는 학술연구자 12명을 대상으로 심층면담을 실시하여 데이터 재이용 행위와 데이터요구를 파악하고자 하였다. 데이터 재이용 행위는 데이터 재이용 요인, 데이터 재이용 유형, 데이터 재이용 파악 및 습득 경로, 학술연구 활동 주기 내 데이터 재이용 과정을 중심으로 살펴보았으며 데이터요구는 생산자, 생산국가 및 언어, 유형 및 수집방법, 규모, 처리수준, 접근 및 이용통제, 최신성이라는 7가지 측면에서 분석되었다. 우선 데이터 재이용 행위와 관련하여 도출된 결과는 다음과 같다. 첫째 데이터 재이용이 고려되는 요인은 개인적, 경제적, 기술적, 사회적 차원에서 영향을 받았다. 개인적 차원에서는 연구 상의 용이성과 데이터 접근성으로 나타났으며 경제적 차원에서는 연구 상의 효율성으로 확인되었다. 기술적 차원에서는 정보기술 환경의 변화이었으며 사회적 차원에서는 학술적 풍토의 변화와 연구분야 및 주제의 특성에 의해서 데이터 재이용이 이루어졌다. 둘째 데이터 재이용 유형의 경우 재이용의 목적에 따라 구분되었는데 주로 연구대상으로 데이터를 재이용하였다. 데이터를 재이용하고자 하는 목적에 따라 요구하는 데이터의 처리수준이나 종수가 상이하게 나타났다. 셋째 데이터를 파악하고 습득하는 주요 경로는 웹 기반의 정보원과 학술공동체 내 비공식적 커뮤니케이션으로 확인되었다. 넷째 학술연구 활동 주기 내에서 데이터 재이용 과정은 일반적인 과학적 조사연구 과정과는 차이를 보였다. 즉 데이터에 대한 파악 및 습득이 이루어지는 단계가 개인 연구자마다 상이하게 나타났으며 다른 연구단계와 상호작용하며 순환하는 특성을 보였다. 데이터 속성을 기반으로 한 데이터 이해 및 선정, 데이터에 대한 검증, 데이터 재구성은 공통적인 연구단계로 도출되었다. 다음으로 데이터 요구와 관련하여 다음과 같은 내용이 파악되었다. 첫째 데이터의 주제적 적합성, 비교가능성과 신뢰성으로 인해 개인보다는 기관 단위의 생산자가 선호되었다. 둘째 미국에서 생산되거나 혹은 영어로 기술되어진 데이터를 선호하였는데 이는 데이터의 이해가능성이 보장되기 때문이었다. 셋째 대표성과 신뢰성과 같은 데이터의 품질로 인해 양적 데이터 가운데 조사자료 특히 조사원 기입식 대인면접 조사를 통해 생산된 데이터를 선호하였다. 넷째 활용가능성으로 인해 원자료가 선호되었으며 가능한 풍부한 메타데이터를 얻고자 여러 방식의 노력을 기울이는 것으로 확인되었다. 또한 법적 한도 내에서 인구사회학적 특성을 파악할 수 있는 수준으로 식별정보가 포함된 데이터를 선호하였다. 다섯째 접근 및 이용이 통제된 데이터는 선호도가 낮았으나 그 가치나 필요도에 따라 일정 수준의 금전적·시간적 투자를 통해 재이용하고자 하였다. 여섯째 규모와 최신성과 관련해서는 뚜렷한 데이터요구를 확인하기가 어려웠는데 그 이유는 선호가 발생할 수 있을 만큼 다양한 데이터가 제공되고 있지 않았기 때문이다. 이처럼 선택의 폭이 제한된 상태에서 학술연구자는 제공되는 자료를 최대한 재이용하고 있었다. 본 연구는 디지털 정보자원으로서 데이터가 지니고 있는 잠재성과 학술연구 측면에서 데이터 재이용을 통해 창출 가능한 가치에 주목하여 데이터 재이용 행위, 데이터 쟁용 행위의 주체인 학술연구자, 재이용 대상이 되는 데이터를 주요하게 다루었다. 이를 기반으로 아키비스트는 데이터 중심으로 변화하는 정보환경에서 정보관리전문가로서 효과적인 역할을 수행하고 데이터 아카이브는 데이터의 수집, 선별, 평가 정책의 수립 및 시행 그리고 이용자 중심의 활용 서비스를 제공할 수 있으리라 기대된다.
Show the fulltext
Appears in Collections:
일반대학원 > 문헌정보학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
