View : 610 Download: 0

탐색용어선택시스팀을 위한 의미네트웍 설계 및 구현에 관한 연구

탐색용어선택시스팀을 위한 의미네트웍 설계 및 구현에 관한 연구
Other Titles
Issue Date
대학원 도서관학과
이화여자대학교 대학원
정보의 탐색은 문제를 분석하고 관련된 사실을 규명하여 많은 연관자료와 견해 중에서 가장 적합한 정보를 선택하는 것에 궁극적인 목적이 있다. 이를 위하여 정보사서는 요구된 문제와 관련된 모든 중요한 측면을 밝혀내어야 하는데, 이 때 그의 전문적 지식 및 기술, 자료, 활용가능한 장치들을 최대한으로 이용하여야 할 것이다. 이것은 곧 정보에 대한 접근 및 분석에서 보다 심층적인 연구의 필요성을 의미하는 것이기도 하다. 본 연구에서는 컴퓨터를 이용하는 탐색시스템에서 탐색용어와 관련된 제한점을 해결하는 방안의 하나로서 의미네트웍을 설계하였다. 이것은 탐색전략에서 주제분야의 용어 및 용어간의 어의적 관계에 대한 지식을 확장이용하였을 때 검색의 실제적 효율을 높이는 데에 촛점을 두었다. 이를 위해서 정보의 탐색과 표현에 관한 문헌들을 고찰하였으며, 실제로 한글문헌의 화학공학분야에서 색인어 실험을 통하여 '유체의 흐름'과 '연소'에 관한 의미네트웍을 설계하였다. 실시된 실험내용은 다음과 같다. ① 복수포아슨분포모형에 의한 색인어 실험 한국화학공학회에서 계간으로 발행되는 화학공학지에 1977∼1986년 까지 10년동안 발표된 학술논문으로서, '유체의 흐름'과'연소'분야에 관한 논문 30건을 선정하였다. 그리고 이 논문의 표제와 초록으로부터 색인어 299개를 추출하여 이 단어들에 대해서 복수포아슨분포모형에 의한 실험을 하였다. 각 파라미터값 계산을 위해 컴퓨터는 VAX-11/780/VMS를 사용하였으며, 표집된 단어 299개에 대한 □,□,□의 값을 산출하였다. 그리고 선행실험에서 주제어, 비주제어 분리기준으로 제시된 Z의 값을 구하여 색인어의 Z치 분포를 조사하였다. ② 주제어의 색인작성 주제어와 관련하여 기술된 표본문헌 내의 모든 문장들을 초록과 표제로부터 추출하였고, 이것은 연관색인기법에 의하여 색인으로 작성하였다. 색인어간의 관계를 나타내는 개념영역은 9가지의 관계기호로서 표현되었다. ③의미네트웍의 설계 및 구현 255개의 색인어에 대한 의미네트웍이 설계되었으며 데이터구조로 링크드리스트(linked list)구조와 배열 (array)을 사용하였다. 총 노드수는 255개이며, 한 노드당 링크수는 최소 1종류에서 최대 8종류로 구성되었다. 의미네트웍의 구현을 위해 네트웍프로그램과 탐색프로그램이 작성되었고, 사용된 프로그램 언어는 PASCAL이며, 사용기종은 IBM 5550이다. 탐색방법은 두 가지 방법으로 구분되어 용어에 관한 탐색, 질문식과 관련된 문헌검색 등으로 실시되었다. 색인어 실험의 결과와, 의미네트웍을 이용한 탐색결과를 요약하면 다음과 같다. 첫째, 확률기법에 의한 색인어 실험에서 복수포아슨분포모형의 한글문헌에 대한 적용성은 선행 실험결과와 검색의 정확율의 측면에서 비슷하였다. 그러나 주제어, 비주제어 분리기준이 되는 Z의 값이 1미만인 경우는 상이한 결과로 나타났다. 둘째, 시스템에서 의미네트웍을 활용하였을때, 탐색자가 용어에 관하여 모호한 개념을 갖고 있거나 불충분한 정보를 갖고 있는 경우 질문식을 구성할 수 있는 색인어 및 그 관계를 제공받을 수 있다. 세째, 특정용어에 관한 탐색에서, 제공받은 단어 및 의미관계에 대한 지식은 탐색자의 탐색요구를 명확하고 구체적이게 하는데 중요한 역할을 한다. 따라서 정확한 탐색용어 및 관계기호로 구성된 질문식으로 문헌검색을 하였을 때 검색의 정확율이 높다.;The ultimate goal of search behavior is to retrieve the best right information related to the query requirement through the accurate analysis and identification between the information and the need of user. For this purpose, professional librarian should utilize useful tools and capabilities as well as his knowledge and infallible skills. It means that the further study is necessary to organize and to approach knowledge in specific fields. This paper is purposed to improve the search effectiveness by applying the semantic knowledge in the computer-based search system. This study is developed in three stages as follows. 1. 2-Poisson Distribution Model in Korean indexing terms is experimented. This model concerning 299 index terms in the sample papers is tested on a set of 30 abstracts and titles of the articles of 'Fluid Flow' and 'Combustion'. These abstracts was published in the Korean Journal of Chemical Engineering from 1977 to 1986. A computer program was written for the calculation of the parameters, λ^_(1), λ^_(2), π^ for each word and the values of z are calculated also. 2. 255 words and their relations are indexed. This work is based on the theory and practice of Relational Indexing System. Nine relational codes and categories of concepts are used. 3. Semantic network has been designed and implemented in the fields of 'Fluid Flow' and 'Combustion'. This network has 255 kinds of nodes and nodes have from 1 to 8 link types per node. Computer programs were written in PASCAL for network design and search. For the implementation, IBM 5550, in the System Engineering Center in the KAIST, has been used. The results of this research are summarized as follows. First, 2-Poisson Distribution Model is tested experimentally in the Korean index terms and find to be comparatively similar to the results of the precedent experiments in the Agriculture and Psychology. The precision ratio, 71.8%, is similar to the ratio, 70%, of Agriculture for the range z≥1. But the values of z are different from the preceding studies for the range z<1.0. Second, When a searcher utilized the semantic network in the system, he could get the information of the search terms and their relations. Finally, he could select the right terms related to the need. Third, Precision ratio in retrieval is improved when a search is done with an explicit search terms and their link types provided by the semantic network.
Show the fulltext
Appears in Collections:
일반대학원 > 문헌정보학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
