View : 1311 Download: 0

이미지 모멘트 기반 한글 전자문서의 폰트이미지 감정 방법

이미지 모멘트 기반 한글 전자문서의 폰트이미지 감정 방법
Other Titles
Digital Examination for Hangul Word e-Document by using Image Moment
Issue Date
대학원 컴퓨터공학과
이화여자대학교 대학원
본 연구는 법과학의 한 분야인 문서감정 분야의 한글 워드 문자 감정에 활용하기 위한 것이다. 문서감정의 대상인 전자문서는 컴퓨터의 사용이 대중화되고 전자문서의 법적효력이 제도화되면서부터 다양한 붑법 사례가 발생하고 있다. 문서감정의 과학적인 과정을 분석하고 검증하는 일은 감정인의 전문성을 높여 주어 업무의 생산성을 얻어내고 감정결과의 신뢰성을 갖게 한다. 연구 내용은 패턴인식, 이미지 분류나 분석 등에서 광범위하게 사용되는 크기, 회전, 위치 변화에 구애받지 않고 대상물과 문자를 인식하는 이미지 모멘트 알고리즘을 적용하여 스캔된 문서의 한글 폰트 이미지에서 이미지 모멘트 값을 추출하여 폰트의 특징점을 도출하는 방법 및 그 유효성을 검증하는 것이다. 이미 결정된 표준 한글 폰트 이미지 간의 유사도를 판단할 수 있는 특징점을 도출하는데 이미지 모멘트 값 추출 방법이 유효한지를 모색하기 위하여 여러 한글 폰트(글꼴) 중 많이 사용되고 있는 바탕체, 휴먼명조체, 굴림체 세 종류의 폰트를 정한다. 또한 각 폰트에 대한 실험을 위해 한글 글자의 사용 빈도 자료 및 다양한 글자조합 형태를 고려 각 10자씩 20자를 선정하였다. 선정된 세 종류의 폰트와 20자의 글자에 대한 이미지 모멘트 값 추출을 위하여 글자 이미지의 이진화 처리 및 이미지의 정규화 과정을 거친다. 그후, 각 이미지로 표현된 글자를 가로 세로 각 10칸씩 분할하여 총 100개의 셀(cell)로 분할하여 이미지 모멘트의 값인 9개의 이미지 특징 값을 추출하면 전체 이미지에 대한 9개의 특징 값을 포함 총 909개의 이미지 특징 값이 얻어진다. 그 결과, 바탕체, 휴먼명조체, 굴림체를 비교했을 때 굴림체는 대부분 상이한 개수의 특징 값이 얻어지고, 인식률 계산 결과에서도 유효할 만한 차이점을 얻을 수 있다. 그러나 선정된 글자에 대한 실험을 통해 적용가능성을 본 논문에서 확인하였지만 모든 폰트에 적용해보는 과정이 필요하다. 실제 감정에 적용하기 위해서 더 다양한 폰트의 스캔 이미지에 대한 추가 연구를 진행하려고 한다.;This study proposes an examination method for Hangul Word e-Document by utilizing theoretical computer algorithm in forensic science, especially in digital document examination fields. The main purpose of this study is to find the systematic method for Hangul word e-Document fonts by using Image moment. And then we could find its validity. An Image Moment is a certain particular weighted average of the image pixels' intensities, or a function of such moments, usually chosen to have some attractive property or interpretation in image processing, computer vision and related fields. To validate the use of Image Moment for examination method for Hangul word e-Document fonts, first of all, the selection of 3 fonts is needed. Selected 3 kinds of korean fonts are Batang, Humanmyungjo, and Gulim. Also, the selection of 20 korean letters are needed. 20 korean letters are composed of the most frequently used 10 letters and 10 letters with various associated forms. To get all the value of Image Moment for 20 korean letters of 3 kinds of fonts, binary digitization from letter image to binary image is needed. Also, the resizing of letter size by weight 500 pixels is needed. Height size is also decided by maintaining same portion of weight 500 pixels. Each korean letter is divided by 100 times with same size of 10x10. From these divided sector, 9 image moment values per each sector are evaluated. Among Batang, Humanmyungjo and Gulim, the number of values of Gulim is different from two. Also, the result of calculation of values validates proposed algorithm in this paper. Finally, digital examination method for Hangul Word e-Document by using Image moment shows good results in our experiments, but the more test for other fonts and letters is needed to apply real document which is used in digital forensics.
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
