View : 818 Download: 0
쿼드트리로 표현된 한글 문서 영상에서 문자의 추출
- Title
- 쿼드트리로 표현된 한글 문서 영상에서 문자의 추출
- Other Titles
- EXTRACTING CHARACTERS FROM THE HANGEUL DOCUMENT IMAGE REPRESENTED BY A QUADTREE
- Authors
- 백은경
- Issue Date
- 1992
- Department/Major
- 대학원 전자계산학과
- Keywords
- 쿼드트리; 한글; 문서 영상; 문자
- Publisher
- 이화여자대학교 대학원
- Degree
- Master
- Advisors
- 조동섭
- Abstract
- 본 논문에서는 문서의 자동 인식을 위한 시스템에서 입력된 문서 영상을 쿼드트리(quadtree) 기법으로 표현하고, 구성된 쿼드트리로부터 연결 자획과 개별 문자를 추출하는 방법을 제안한다.
쿼드트리는 반복적인 분할을 기본으로 하는 계층적 데이타 구조로서 효율적으로 컴퓨터에 영상을 표현하는 기법이다. 본 논문에서는 2진 코드화된 쿼드트리로 문서 영상을 저장하고, 쿼드트리의 단말 노드(leaf node)들의 상호 인접을 조사하여 연결 자획을 추출한다. 연결 자획은 이를 구성하는 단말 노드들의 자식 노드 유형(son type)과 깊이(depth)에 의하여 문서 영상 내에서의 위치가 결정되며, 이들 사이의 위치 관계로부터 개별 문자를 추출해 낼 수 있다. 이 방법에 의하여 영상의 모든 화소를 순회(traverse)하지 않고도 개별 문자를 추출할 수 있으며, 기억 장소와 실행 시간도 절약된다.;This thesis proposes the method of extracting connected strokes and characters in a Hangeul document image represented by a quadtree.
Connected strokes are extracted by examining adjacency for each node of a black region to the side of east and south. Then, each character is extracted by the sizes and the relations of connected strokes. This is done by iterative vertical and horizontal manipulation. The result shows all characters are extracted in the same sequence as that of context with space and time effiency.
- Fulltext
- Show the fulltext
- Appears in Collections:
- 일반대학원 > 컴퓨터공학과 > Theses_Master
- Files in This Item:
There are no files associated with this item.
- Export
- RIS (EndNote)
- XLS (Excel)
- XML