국내 학술지 논문의 DOI기반 연계시스템 구축에 관한 연구
Other Titles
A Study on the development of referencelinking system based on digital object identifier for Korean journal articles
Issue Date
대학원 문헌정보학과
이화여자대학교 대학원
The function of hyperlinking in electronic journal articles makes it possible for scholars to read not only a certain document but also other subsequent articles that have been cited in the document. Recently, major international STM(Science, Technical, and Medicine) publishers have been developing the prototype systems that can provide the reference linking of journal articles within the scholarly literature on a cross-publisher basis using the URN(Universal Resource Name). In Korea, extensive efforts on the digitalization of Korean journal articles have been made by several information service providers including academic institutes and libraries for several years. Yet, it is hard to find the efforts to link the scattered digitalized documents to an individual user through a unified web. It is thus necessary to develop a prototype system for the reference linking from an online journal article to others. In this study, a linking model for an integrated gateway from bibliographic information to full text has been designed and Electronic Research Resources Reference Linking System (E3R/LS) has been developed as a prototype for centralized static reference linking system for the domestic documents. For this, the definition, characteristics and components of foreign linking systems have been examined thoroughly by the literature review and case study. The examination of several linking systems for the foreign articles and the literature review suggests that there are three major components for constructing reference linking systems. Those are persistent identifier, metadata, and a resolution system of an identifier. The first component, the effective persistent identifier, is substituted for URLs. Here, the Digital Object Identifier(DOI), one type of IETF URN, is introduced as the public identifier intended to be applied wherever the item needs to be identified. For identifying Korean journal articles, the extended SICI(Serial Item and Contribution Identifier) has been newly defined in this study and is used as a suffix on DOI. Lookup in a centralized reference database is required to receive a query from users and to return the identifier associated with that query. The reference database contains the second component, metadata, linked to identifiers for digitalized journal articles. The Dublin Core(DC) element set is defined to support most queries and to be implemented by all information providers. After getting a DOI among results from querying the metadata database for resource discovery, resolution mechanism is utilized to locate and access the resources corresponding to the DOI, and returns to the user the web page. The CNRI resolution system is used for resolving a DOI into a URL as the third component. Also, for hyperlinking from the references to the original articles, a DOI is inserted into the citation resolved into a corresponding URL and is served for retrieving the item. The newly developed E3R/LS in this study is composed of four subsystems: Collection Service Center, Data Repositories, DOI Server, and User Interface. These subsystems in the E3R/LS can handle data gathering, querying and link generation. The E3R/LS provides users with a rather easier way to access the full-text journal articles that they need in the scattered systems and to link the references from one journal article to others. In other words, users can find content online only if they have the bibliographic information without an online address and find online information hyperlinked to one or more sources of the cited content as well. The reason why the E3R/LS can provide the more convenient way is that it uses a static linking model, where all identifiers are pre-computed and a link is resolved precisely to a valid item. By using a static model, instability of linking caused by change of URL location can be avoided. In addition, at the phase of calculating identifiers and uploading metadata into the metadata database, the information about intellectual property rights can be added in DOI or in metadata if necessary. In recent years, linking projects have been carried out with many publishers and it is required that publishers should have bilateral agreement between services. In order to meet the trends in scholarly information services, the future linking system should be equipped with a managing function of the intellectual property right and a handling function of electronic trading of scholarly materials. The results presented here clearly demonstrate that the E3R/LS can provide a prototype for centralized static reference linking system for the full-text services of domestic journal articles. Moreover, this demonstration suggests that the model for serving audio, audio-visual, or multimedia materials can be available by the extension of this study in the near future. ; 전자저널이 제공하는 하이퍼링크 기능은 학술 연구자들이 학술지 논문을 읽으면서 관련된 다른 논문까지도 연속적인 참조를 가능하게 한다. 최근 해외 주요 학술지 출판사들은 해당 출판사 발행 학술지 논문들간의 연계 뿐 아니라, 연계 제공 도구로서 URN(Universal Resource Name)을 이용하여 타 출판사가 발행하는 학술지 논문의 통합 검색은 물론 관련 주제분야의 논문에 대한 참조연계(reference linking)를 시도하고 있다. 국내에서는 대학도서관, 학회, 그리고 정보서비스 기관의 생산 저작물 및 보유 학술자료에 대한 디지털 원문을 기관별로 구축하여 서비스하고 있는 상황이어서 궁극적으로는 기관간 협력적인 학술정보 연계서비스를 가능하게 하는 방안의 모색이 필연적으로 요청되리라 예상된다. 본 연구는 학술지 논문 연계시스템의 구성요소 및 구현사례를 검토하여 국내 분산된 학술지 논문의 통합 검색, 원문의 식별 그리고 원문간 참조연계 서비스에 적합한 모델을 연구하였다. 이를 위하여 국내 원문연계 서비스를 제공하기 위한 중앙집중식 모델인 학술지 논문 연계시스템 (Electronic Research Resources Reference Linking System: E3R/LS)을 설계·구현하고 추후 실제 시스템에 적용할 수 있는 방안을 제시하는데 목적을 두었다. 연구방법으로는 문헌연구와 사례연구를 사용하였다. 관련 문헌연구에서는 연계에 관한 전반적인 개념, 학술지 논문 연계시스템 구축시 필요한 구성요소를 고찰하였다. 이와 함께 학술지 논문 연계시스템에서 제공하는 서비스를 통하여 이용자들이 원하는 학술지 논문에 대한 접근, 원문 획득과정을 검토하였으며 학술지 논문내 참고문헌으로부터 인용논문의 원문으로 연계하는 방안을 도출하기 위한 기술과 사례를 연구하였다. 이와 같은 문헌연구와 사례연구를 기초로 국내 학술지 논문 연계서비스의 시스템 구축을 위한 중요한 구성요소로서, 디지털 형식으로 표현된 학술지 논문의 확인을 위한 식별자, 연계서비스를 가능하게 하는 핵심요소인 통합 데이터베이스 검색에 필요한 메타데이터, 하나의 학술지 논문의 식별자를 위치정보로 변환하고 선별하는 변환 메커니즘을 제시하였다. 인터넷 자원에 대한 연계 기능과 인터넷상에 존재하는 자원의 식별자로서는 IETF URN의 한 종류인 DOI(Digital Object Identifier)를 이용하였고, 기존 연속간행물 식별자인 SICI(Serial Item Contribution Identifier)를 DOI의 접미부로 활용하였다. 그러나 국제 표준인 SICI는 영문자 문화권에서 개발되었으므로 국내 학술지에 적용하기 위한 한글 문자를 허용하는 확장된 개념의 구문법을 새롭게 정의하여 적용하였다. 메타데이터는 별도의 훈련받지 않은 웹문서 이용자라도 쉽게 활용할 수 있도록 Dublin Core(DC)를 사용하여 기술하였다. 학술지 논문의 데이터 요소로서는 논문의 식별이 가능하고 SICI의 각 구성요소와 일치하는 항목을 선정하여 SICI 코드가 없는 경우, 추후 자동생성이 가능하도록 지원하는 형식을 사용하였다. DOI가 포함된 메타데이터 데이터베이스를 대상으로 통합 검색을 수행하여 원하는 원문의 DOI 번호를 얻은 후, 이 DOI 번호에 상응하는 URL을 확인함으로써 해당 URL에 위치한 최종 저작물의 원문이 이용자 화면에 나타나는 변환 메커니즘을 활용하였다. 즉, 하나의 DOI를 원문의 위치정보인 URL로 변환하는 작업은 CNRI 변환기를 활용하였다. 또한 학술지 논문내 참고문헌의 인용원문으로 곧바로 연계할 수 있도록 인용정보에 식별자 번호를 삽입하고 이 번호를 DOI 변환기로 송부, 변환과정을 거쳐 원문소장기관의 URL로 연결함으로써 이용자 화면에 곧바로 원문을 보여주도록 하였다. 시스템 구현을 위하여 구축된 E3R/LS는 중앙집중기관, 원문제공기관, DOI 변환기, 그리고 이용자 시스템의 구조로 구성하였다. E3R/LS는 중앙집중기관에 통합된 서지정보 검색부터 분산 구축된 원문의 위치확인 및 연계 기능과 디지털 학술지 논문의 참고문헌내 인용정보를 통한 인용원문으로의 연계 기능이 구현 가능하도록 설계하였다. 본 연구에서는 연계에 필요한 DOI 번호를 미리 계산하여, 분산체계로 구축된 원문의 통합 검색과 원문 식별기능이 작동되는 시점에 이 번호 정보를 기반으로 연계가 발생되는 정적연계방식을 이용하였다. 이러한 정적연계방식은 연계에 대한 결과가 항상 정확하므로 기존 URL의 위치정보 변경에 의한 불안정한 연계방식을 보완할 수 있다. 또한 디지털 학술지 논문의 식별을 위한 DOI는 디지털 학술지 논문의 소장위치가 변경되더라도 이용자가 원하는 학술지 논문을 영구적으로 고유하게 식별하여 제공할 수 있다는 장점이 있다. 원문내 인용정보에 삽입된 식별자 정보를 통해 타기관의 웹사이트에 위치한 인용원문을 찾아내어 연결하는 참조연계 기능은 원문에 쉽게 즉각적으로 접근할 수 있으므로, 디지털 학술지 논문이 전통적 학술정보 교환 도구인 인쇄물 학술지 논문의 대체물로서 중요한 역할을 하게 된다. 본 연구에서 구현한 시스템은 학술지 논문 연계서비스에 초점을 맞춘 프로토타입이며 DOI 체제를 기반으로 개발한 응용 사례이다. DOI는 기존 인쇄물 위주의 식별자 및 기타 신규 매체 창작물의 식별자를 모두 포괄하여 사용할 수 있으므로 식별자간 연결 고리를 형성할 수 있다. 즉, DOI는 디지털 환경에서 지적 저작물의 권리보유자와 이를 이용하는 이용자를 연결하므로 지적 재산물의 관리를 위한 핵심 요소로 활용할 수 있다. 상호운용성이 있는 식별자 DOI를 기반으로 앞으로 저작권 관리와 전자상거래 시스템까지 연구 범위를 확대하는 것이 가능하다. 또한 디지털 형태의 텍스트 정보는 물론 음악 저작물, 영상 저작물, 혹은 다양한 멀티미디어 저작물을 포함하는 광범위한 산업 분야의 정보서비스에도 응용할 수 있으며 그 연구영역도 확대할 수 있다.
