View : 518 Download: 0

Computational Models for Document Classification of Literatures in Mathematical Reviews Database

Title
Computational Models for Document Classification of Literatures in Mathematical Reviews Database
Authors
장희정
Issue Date
2021
Department/Major
대학원 수학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이준엽
Abstract
As more and more papers are published these days, it is hard to classify them all manually. This thesis provides an automatic classifier for mathematical literature that uses the title and Mathematics Subject Classification (MSC) codes of the document as input and output, respectively. For our work, we build a new dataset of mathematical literature labeled with 63 mathematics subjects. In this thesis, we address two main challenges: text mining and document classification. The challenge in text mining is to propose a global lexicon of mathematical literature by unifying words and removing meaningless words. The challenge in document classification is to compare three models, such as a linear model, simple deep learning model, and multi-label classification model.;논문이 점점 더 많이 출판되면서 모두 수동으로 분류하기가 어렵다. 본 학위 논문은 문서의 제목과 수학 주제 분류 코드를 각각 입출력으로 사용하는 수학 문헌을 위한 자동 분류기를 제공한다. 우리는 연구를 위해 63개의 수학 주제를 라벨로 가진 새로운 수학 문서 데이터 집합을 구축한다. 본 논문에서는 텍스트 마이닝과 문서 분류라는 두 가지 과제를 다룬다. 텍스 트 마이닝 과제는 단어를 통일시키고 의미 없는 단어는 제거하여 수학 문헌에 대한 사전을 제안한다. 문서 분류 과제는 선형 모델, 단순 딥러닝 모델 및 다중 레이블 분류 모델과 같은 세 가지 모델을 비교한다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 수학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE