View : 544 Download: 0

ART를 이용한 혼재 문서의 이진화

Title
ART를 이용한 혼재 문서의 이진화
Other Titles
Binarization of Text-Image Mixed Documents using ART
Authors
김금주
Issue Date
1994
Department/Major
대학원 전자계산학과
Keywords
ART혼재문서이진화Text-Image
Publisher
이화여자대학교 대학원
Degree
Master
Abstract
In this thesis, we implemented conventional method of binarization and suggested a new method of binarization of text-image mixed documents using ART-2 model. The proposed method is to produce binary image in high quality. This overcomes an ambiguous problem in two parts: text parts and image parts. The conventional method divides the documents into text parts and image parts and the transformation of documents using binary segmentation is applied to text parts and dithering is applied to image parts. To get the higher image quality, proposed method begins with appropriate subdivision of gray image. Secondly the input vectors for given image are normalized, and learned using ART-2 model. Finally binary dithered patterns to each input vectors are generated using local adaptive thresholding. The experimental results of proposed method give us clearer binary image than BAT. The more text portion of image is enlarged, the higher image quality is achieved. But conversion problem in gray tone image still remains. This problem will be overcomed by applying supervised neural network with ART-2.;계조 영상(gray image)을 정교하게 출력하기 위한 여러가지 인쇄 장비들이 개발되고 있지만,이러한 장비들의 표시가능한 계조도(gray level)는 한정되어 있다. 그러므로 한정된 계조수로 계조 영상을 충실하게 표현하기 위한 여러가지 이진화(binarization) 방법들이 고안되어 왔다. 특히 문자와 영상이 혼재된 문서의 이진화를 살펴보면, 영상 부분과 문자 부분을 분리하여, 영상 부분에는 디더링(dithering) 방법을 사용하고, 문자 부분에는 이치 분할법(binary segmentation)을 사용하여 이진화하는 방법들이 사용되어 왔다. 그러나 문서를 블럭 단위로 처리할 경우, 한 블럭 안에 문자 부분과 영상 부분이 혼합되어 존재할 수 있기 때문에, 오분류의 가능성이 있고, 문자 부분의 특성을 가진 영상 부분과 영상 부분의 특성을 가진 문자 부분에 대해 잘못 처리할 수 있다. 그러므로, 본 논문에서는 신경망 모델을 이용한 학습을 통하여, 문자와 영상이 혼재된 문서의 이진화 방법을 제안하고자 한다. 제안한 방법에서는 문서를 블럭 단위로 처리하기는 하지만, 문자 부분과 영상 부분으로 분리하지 않기 때문에 오분류의 가능성을 제거할 수 있다[1][9]. 구현해 본 결과 계조 영상의 이진화에 필요한 적당한 이진화된 패턴을 선정하는것이 신경망 학습을 통해 가능함을 알수 있었고, 학습을 통해 얻어진 이진 영상을 기존의 방법으로 처리된 이진 영상과 비교해 볼 때, 영상 부분의 섬세함은 다소 떨어지지만, 그 선명도와 처리 단계면에서는 향상되었음을 알 수 있다. 고속 팩스 모뎀의 개발로 컴퓨터와 팩시밀리를 연결하여 사용하고자 하는 요구가 나타나고 있는 요즈음, 영상의 빠른 전송과 고질의 영상 출력에 대한 필요성은 더욱 증가하고 있다. 이진 영상은 계조 영상에 비해 전송이 빠르고,기억 용량을 적게 차지하므로, 보다 나은 이진 영상의 출력을 위한 방법들은 더 많이 개발되고 연구되어야 할 것이다.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE