워드투벡터를 이용한 법률용어의 연관성 분석

Other Titles
Association Analysis on the Legal Terminology Using Word2Vec
Issue Date
대학원 컴퓨터공학과
이화여자대학교 대학원
데이터 마이닝(Data mining)의 분야 중, 정보의 연관성을 찾아내고 분석하여 가치 있는 정보로 의사결정에 활용하는 연관성 규칙 분석은 다양한 분야에서 연구가 활발히 진행되어왔다. 본 논문에서는 법률용어간의 연관성을 분석하고자한다. 법의 분야 중에서도 기업에 관한 사항을 규정하는 특별 사법인 상법(Commercial law)과 사람이 사회생활을 영위함에 있어서 지켜야 할 일반 사법인 민법(Civil law)의 법조문을 데이터로 이용하여 법률용어의 연관성을 분석하는 것을 목적으로 한다. 딥 러닝을 텍스트 학습에 적용한 기술인 워드투벡터(Word2Vec) 모델을 이용한다. 법률용어의 연관성 분석을 위해 빈도수를 기반으로 한 주요 법률용어를 바탕으로 벡터 대수학(Vector Algebra)을 이용하여 법률용어의 연관성을 찾고, 수백차원의 벡터 값으로 표현된 법률용어들을 2차원 공간상의 도표로 시각화하여 법률용어의 연관성을 분석한다. 본 연구에서 워드투벡터를 이용하여 법률용어의 연관성을 분석한 결과 텍스트 데이터의 전처리 과정을 거치지 않았지만 법조문의 문맥과 법률용어들의 연관성을 찾아 분석할 수 있었고, 해당 법률용어가 민법에 해당하는지 상법에 해당하는지를 이해하여 관련 법률용어들이 2차원 공간상의 도표에 시각화하였을 때 군집 형태로 나타났다. 따라서 본 연구에서 법조문 데이터의 학습에 이용한 워드투벡터 기술과 연관성 분석의 접목이 방대한 분량의 정보가 축적되어있는 법 분야에서의 활용가능성과 법을 공부하는 사람들에게 법률용어의 연관성 분석 결과가 도움을 줄 수 있을 것으로 기대된다.;The purpose of the study is to analyze the association between legal terms using Word2Vec, an algorithm that applies deep learning to text learning. The legal field contains vast amounts of information such as national laws, law books, precedents, and statutes. But it requires expertise about a principle of law. Therefore, it is possible to connect with artificial intelligence technology that can help the general public, not experts. Also, this research is one of the infinite fields. In this paper, The data used the provisions of the Commercial and Civil law. This data was trained using Word2Vec. We estimated the main legal terms based on frequency for the association of legal terms. We used terms to build the equation expression of Vector Algebra to find the relevance of the terms of the law. After that, the legal terms expressed in hundreds of thousands of vectors were visualized as a graph of two-dimensional space. As a result, we found the association of legal terms using Word2Vec and Word2Vec understood the context of the provisions of the law and showed the clustering of the legal terms. Future works show that the case study analyzes the relevance of cases and trials by studying case data with Word2Vec. It is hoped that ordinary citizens, not experts, will be able to gain the results of an analysis that is easily understandable.
