데이터 큐레이터 직무 요건 분석 연구

A Study on Analysis for Job Requirements of Data Curators
대학원 문헌정보학과
이화여자대학교 대학원
A large scale dataset as a result of the outcomes of work and research activities incorporated into various data management systems is considered as an asset that can be reused. The issue of data reuse in the case of increase of interdisciplinary research and disclosure of government data requires high-quality dataset obtained through the process of systematic selection, ingestion, preservation and evaluation from the data management planning step. Highly interoperable dataset can be established and managed by data curator that can perform corresponding tasks. For ensuring consistent curation activities, however, there are significant differences that exist in the area of major, path of inflow and career path of staff. Therefore there is a necessity for taking precedence for clear definition of data curation and data curator. This study was conducted with the objective of presenting core job requirements of data curator that can be used as work guidelines for performing data curator work in our country. Based on literature research, this study examined the theoretical background of data curation. As for the present condition of overseas job requirements, this study analyzed 255 cases of data curator related job advertisements in other countries and conducted in-depth interview and analysis with 5 data management personnels from 4 different organizations in Korea. In regards to the data curator job advertisements in other countries, the findings are as follow. First, job titles that include data service were frequently posted. Second, as for the type of organizations that hire data curator, 83% of them were being posted by cultural heritage related organizations such as library, archive and museum. The findings also showed that research library related work experience and 3-5 years of work experience were preferred the most. Third, among 7 job requirements presented by Kim, Warga, & Moen (2013), curation related technology application requirement, communication & interpersonal skill requirement, curation and preservation activity requirement, and planning·management·evaluation requirement showed a high level of frequency. Fourth, as for curation related technology, web-based markup language, database management system language, scripting and programming language knowledge requirements, along with repository platform use, open source software, data analysis tool use were being required. Fifth, effective oral & written communication skills, an ability to independently work in a dispersed work environment, and a collaboration skill were increasingly being required each year. Sixth, 63% of the total were knowledge of curation principle & strategy for preservation activity, and metadata standard compliance, thereby being required most importantly each year. Seventh, along with the requirement of collecting and analyzing the latest trend of curation issues and technological changes, requirement of planning, managing, evaluating related projects, programs and services were being required in high level of frequency. Eight, requirement of providing user service such as education & training was being additionally required. The results of in-depth interview with data management personnel in Korea is as follows. First, it is necessary for the personnel to recognize that their job is data curation activity. However, the result of understanding data curation strategy to perform applied duties were low. Second, it is necessary to form a consensus on the need for systematic data management for organization both internally and externally through effective communication among various stake-holders. Third, it is necessary for data curator to have the knowledge on information technology and data curation strategy to establish infrastructure including standardized data management system. Fourth, it is necessary to understand the demand for information by data producers and users to improve existing services and develop new services. Fifth, it was found that there were some trends with ongoing interest in the latest data curation services and practices. Sixth, it was found that education and promotional activities on management and reuse were being performed for stake-holders of data curation. Based on a research on the overseas cases and domestic practical work status summarized earlier, this study deduced core job requirements of data curator. As for the core job requirements of data curator in Korea presented in this study, they are communication requirement, data management requirement, data curation strategy implementation requirement, and user education and promotion activities in four types. The communication requirements are as follow. First, it is necessary to perform tasks through which a consensus can be formed based on oral and written resources with both internal and external stake-holders to establish data curation systems and policies within the organization. Second, it is necessary to perform the task of analyzing the latest issues and trends related to user demand and data curation. The data management requirements are as follow. First, it is necessary to perform the task of constructing and operating data management system within the organization based on information technology knowledge. Second, it is necessary to provide analytical tools required in the area of field for data producer and content service for external users. The data curation strategy requirements are as follow. First, it is necessary to clearly define the data curation strategy concept and activity suitable for the organization. Second, it is necessary to perform data standardization activity within the organization by designing metadata schema based on understanding of data type. The user education and promotion activity requirements are as follow. First, it is necessary to provide education on data format, description, copyright, and personal information and data management plans for researchers, data management system users and data producers. Second, it is necessary to perform promotional activities to verify the value of data curation and increase its need. This study can be used as basic information in identifying and analyzing data curator jobs in Korea, and it is expected to be used as reference information in establishing data management system by organizations in Korea.;업무와 연구 활동의 결과들은 다양한 데이터 관리 시스템에 구축된다. 이렇게 축적된 대규모 데이터는 재사용 가능한 자산으로 인식된다. 학제 간 연구 증가, 정부데이터 공개 같은 데이터 재사용에 관한 논의는 데이터 관리 계획 단계부터 체계적으로 선별, 입수, 보존, 평가 과정을 요구한다. 이러한 환경 변화로 인해 데이터 관리 업무를 수행하는 데이터 큐레이터의 중요성이 높아지고 있다. 그러나 효율적인 큐레이션 활동이 이루어지기에는 데이터 큐레이터들 사이에 전공 분야, 유입 경로, 경력 경로 등에서 많은 차이가 존재한다. 따라서 효과적인 데이터 큐레이션을 위해서는 데이터 큐레이션 및 데이터 큐레이터의 개념과 핵심 직무 요건 규명이 선행되어야 한다. 본 연구는 국내 데이터 큐레이터 직무 수행에 참조 가능하도록 핵심 직무 요건을 제안하고자 수행되었다. 문헌 연구를 통해 데이터 큐레이션의 이론적 배경을 살펴보고, 국외의 데이터 큐레이터 관련 구인 공고 255건 분석과 국내 4개 기관 5명의 데이터 관리 실무자 심층 면담을 진행해 국내외 직무 사례와 현황을 분석했다. 국외 데이터 큐레이터 구인 공고 내용을 분석한 결과는 다음과 같다. 첫째, 데이터 서비스를 포함하는 직무명이 높은 빈도로 게시되었다. 둘째, 데이터 큐레이터를 채용하는 기관 유형은 도서관, 아카이브, 박물관 등 문화유산 기관 영역에서 83%를 게시하고 있었고, 연구도서관 관련 경력과 3~5년의 경력 기간을 가장 선호하는 것으로 나타났다. 셋째, Kim, Warga와 Moen(2013)이 제시한 7개의 직무 요건 중 큐레이션 관련 기술 요건, 의사소통 및 대인관계 요건, 큐레이션 및 보존 활동 요건, 계획·관리·평가 요건이 상위 빈도를 나타냈다. 넷째, 큐레이션 관련 기술은 웹기반 마크업 언어, 데이터베이스 관리 시스템 언어, 스크립팅 및 프로그래밍 언어 지식에 대한 요구와 함께 리포지터리 플랫폼 활용과 오픈소스 소프트웨어, 데이터 분석 도구 활용이 요구되었다. 다섯째, 원활한 구술 및 기술 커뮤니케이션 활동과 분산적 업무 환경 속에서 독립적으로 업무할 수 있는 능력, 협업할 수 있는 능력에 대한 요구가 매년 증가하고 있었다. 여섯째, 큐레이션 및 보존 활동을 위해서 큐레이션 원칙 및 전략 지식과 메타데이터 표준 지식이 매년 가장 중요하게 요구되었다. 일곱째, 큐레이션 논의사항 및 기술 변화에 대한 최신 동향을 수집하고 분석하는 요건과 함께, 프로젝트와 프로그램, 서비스를 계획·관리·평가하는 요건이 높은 빈도로 요구되었다. 여덟째, 교육 등의 이용자 서비스를 제공하는 업무 수행이 추가적으로 요구되었다. 국내 데이터 관리 실무자 심층 면담 내용을 분석한 결과는 다음과 같다. 첫째, 실무자들은 본인의 직무가 데이터 큐레이션 활동임을 인지하고 있었다. 그러나 데이터 큐레이션 전략을 이해하고 이를 실무에 적용하는 정도는 낮았다. 둘째, 다양한 이해관계자들과 원활한 의사소통을 통해 기관 내부 및 외부에 체계적인 데이터 관리 필요성에 대한 공감대를 형성할 필요가 있다. 셋째, 데이터 관리 시스템을 포함한 인프라 구축을 위해, 데이터 큐레이터는 정보기술과 데이터 큐레이션 전략에 대한 지식이 필요하다. 넷째, 데이터 생산자 및 이용자들의 정보 요구를 파악하고, 이를 토대로 기존의 서비스를 개선하고 새로운 서비스를 개발하는 업무를 수행하는 것으로 나타났다. 다섯째, 최신 데이터 큐레이션 서비스 및 실무 사례에 지속적인 관심을 갖고 동향을 파악하는 것으로 나타났다. 여섯째, 데이터 큐레이션 이해관계자를 대상으로 관리 및 이용에 관한 교육과 홍보 활동을 수행하는 것으로 나타났다. 본 연구는 앞서 요약한 국외의 구인 공고 분석과 국내 실무 현황에 대한 조사를 바탕으로 데이터 큐레이터의 핵심 직무 요건을 도출했다. 본 연구에서 제시한 국내 데이터 큐레이터 핵심 직무 요건은 커뮤니케이션 요건, 데이터 관리 요건, 데이터 큐레이션 전략 수행 요건, 이용자 교육 및 홍보 활동 요건으로 총 네 가지 범주이다. 커뮤니케이션 요건은 다음과 같다. 첫째, 안정적인 데이터 큐레이션 체계와 제도 구축을 위해 기관 내부 및 외부의 이해관계자와 공감대를 형성하는 업무를 수행해야 한다. 둘째, 이용자의 요구 및 데이터 큐레이션 관련 최신 논의사항과 동향을 분석하는 업무를 수행해야 한다. 데이터 관리 요건은 다음과 같다. 첫째, 정보기술 지식을 바탕으로 기관 내 데이터 관리 시스템을 구축하고 운영하는 업무를 수행해야 한다. 둘째, 외부 이용자를 위한 콘텐츠 서비스를 제공하고, 데이터 생산자를 위한 주제 분야에서 요구하는 분석 도구를 제공해야 한다. 데이터 큐레이션 전략 요건은 다음과 같다. 첫째, 기관에 적합한 데이터 큐레이션 전략 개념 및 활동을 명확하게 정의해야 한다. 둘째, 데이터 유형에 대한 이해를 바탕으로 메타데이터 스키마를 설계해 기관 내 데이터 표준화 활동을 수행해야 한다. 이용자 교육 및 홍보 활동 요건은 다음과 같다. 첫째, 데이터 관리 시스템 이용자이자 데이터 생산자인 연구자들을 대상으로 데이터 포맷, 기술, 저작권 및 개인정보, 데이터 관리 계획에 대한 교육이 필요하다. 둘째, 데이터 큐레이션의 가치를 증명하고 필요성을 제고하려는 홍보 활동을 수행해야 한다. 본 연구는 향후 국내 데이터 큐레이터 직무를 식별하고 분석하는 데 기초 자료로 활용할 수 있을 것이며, 국내 기관에서 데이터 관리 체계를 수립하는 데 참고할 수 있을 것이다.
