View : 996 Download: 0

BERT를 이용한 학습용 판례 데이터셋 자동구축 및 판례 유사도 분석

Title
BERT를 이용한 학습용 판례 데이터셋 자동구축 및 판례 유사도 분석
Other Titles
A study on Dataset for training and Similarities of Labor Legal Precedents using BERT-based Approach
Authors
조희진
Issue Date
2022
Department/Major
대학원 빅데이터분석학협동과정
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
강윤철
Abstract
본 연구의 목적은 법률 인공지능 연구 활성화에 필수적인 학습용 판례 데이터셋 구축을 위한 자동 라벨링 방안을 마련하고, 학습용 판례 데이터셋을 활용한 판례 유사도 분석 방법을 검증하는 데에 있다. 문장의 의미적 인식을 높이기 위해 단어의 순서까지 학습할 수 있는 BERT를 사용하여 연구의 목적을 달성하였다. 학습 데이터로는 해고무효확인소송 등 고용관계 종료와 관련된 판례 데이터(1962.2 ~ 2021.2)를 사용하였다. 판결문은 판례 전문을 활용하였다. 학습용 판례 데이터셋 구축 방안의 성능 비교 실험을 위해 판결문의 특정 부분 간에 비교하였고, 판결문에서 추출한 사실관계로 주제를 분류하였다. 평가 척도로는 정확도(Accuracy)를 사용하였다. 판례 유사도 분석 실험은 빈도 기반의 자카드분석, 확률 기반의 Doc2Vec, 딥 네트워크 기반의 BERT 모델로 성능 비교하였고, 평가 방법으로는 정략적 방법의 코사인 유사도(Cosine Similarity)와 정성적 방법으로 의미적 분석을 선택하였다. 연구 결과에서 보이는 바와 같이, 학습용 판례 데이터셋 구축 시 판결 결과 라벨링에는 당사자 및 주문 정보를 활용하는 것이 효과적이고, 판례에서 뽑아낸 사실관계 문장으로 주제를 분류할 수 있었다. 또한 판례 유사도 분석 시 확률 기반의 Doc2Vec 보다는 BERT 모형의 결과가 의미적 관점에서 효과적이었다. 본 연구에서는 판결문에서 데이터셋 구축에 필요한 정보 유형을 확인하고, 주제분류를 통해 학습용 판례 데이터셋을 구축하였다. 또한 판례내용(판례전문)을 이용한 판례 유사도 분석 방안을 연구했다는 점에서 기존 연구와 차별성을 지닌다. ;Unlike other countries, there is no publicly available training dataset in Korea. That is why there is less legal artificial intelligence research. In the legal domain, the task of finding existing precedents similar to the factual findings is essential in predicting the expected legal issues and conclusions of the case. However, since the existing keyword-based precedent search system requires specialized expertise to select keywords and derives results only with the presence or absence of a search term, it is difficult to determine whether it is a precedent with similar factual findings. In this study, we propose a framework for creating a training dataset and deriving similar precedents of labor legal documents with BERT-based approach by considering the semantic similarity between factual findings and precedents.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 빅데이터분석학협동과정 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE