274 0

인쇄체 한영 혼용문서 인식을 위한 문자 인식 알고리즘에 관한 연구

Title
인쇄체 한영 혼용문서 인식을 위한 문자 인식 알고리즘에 관한 연구
Other Titles
A Study on the Character Recognition Algorithm in order to Recognize Printed Mixed Documents
Author
김종대
Alternative Author(s)
Kim, Jongdae
Advisor(s)
신현철
Issue Date
2009-02
Publisher
한양대학교
Degree
Master
Abstract
최근 카메라 기술의 발달 및 디지털 카메라의 대중화로 인하여 카메라 문자 인식 및 편집기술의 시장수요가 증대되고 있으며, PDA나 휴대폰과 같은 모바일 기기에 카메라 기능을 내장시켜 정보 획득의 수단으로 활용함으로써 일반 사용자의 편의를 위한 카메라 문자 자동인식 기술 및 비즈니스를 위한 명함인식에 대한 요구가 증대되고 있다. 주변 조명 영향, 카메라 렌즈의 특성 및 다양한 문자종류로 인하여 카메라로 획득한 문자영상을 인식하는 것은 매우 어려운 일이다. 따라서 주변 환경 요인에 덜 민감하면서 복잡한 배경에서 문자를 추출하고 다양한 문자 종류에 대해서도 비교적 안정된 인식률을 보장할 수 있는 영상 전처리 기술, 문자 추출 기술 및 문자 인식 기술 구현이 절실히 요구된다. 본 연구를 통해 개발 및 적용된 기술은 전처리 기술, 각각의 글자를 인식할 수 있는 한글 문자 인식 기술, 그리고 영문/숫자/기호 인식 기술 등 크게3가지로 구분할 수 있다. 첫 번째, 전처리 기술은 기본적으로 명함이나 문서의 각각의 글자들을 인식하기 쉽도록 가져오기 위한 기술로서, 글자와 배경을 구분하기 위한 이진화 기술, 연속적으로 기록된 문서영상을 각각의 글자로 분할하기 위한 문자분할 기술, 분할된 글자를 일정한 크기로 바꾸기 위한 정규화 기술, 각각의 글자들을 한글/영문/숫자/기호로 분류해주는 기술, 가로 및 세로 라인 이미지 제거기술, 이미지 잡음 제거 및 보강기술이 이에 해당된다. 두 번째, 한글 인식 기술은 한글을 6타입으로 분류하는 기술, 자소 분리기술, 해당 자소 인식 기술 등으로 이루어져있으며 한글의 구조적 특징과 통계적 특징을 모두 이용하였다. 마지막으로 영문/숫자/기호 인식기술의 개발이다. 영문/숫자/기호 인식기술은 원형비교 방법을 사용하였으며 속도개선을 위한 타입분류 기술이 사용되었다.; Today, as digital camera and multimedia devices are used widely, many customers needs image recognition techniques for perceiving the printed characters from business cards and photos. It is difficult to recognize the character from digital images. Therefore, we need to develop recognition systems which is not affected from environmental noise factor and has stable recognition ratio. In this research, we achieved techniques which are character recognition pre-processing, Korean character recognition, English/Arabic numerals/Symbols recognition. First, character recognition pre-processing techniques manage the document to easy to perceive the character. That is binaryzation for separating between background and character, segmentation for continuous sequence of sentences, normalization for uniform character's size, classification to Korean/English/Arabic numerals/Symbols, horizontal/vertical wrong line removal, image noise cancelation, and image quality enhancement techniques. Second, Korean character recognition is composed of classifying the six type of Korean language, partitioning consonants/vowels, recognizing target consonants/vowels. Third thing is English/Arabic numerals/Symbol recognition. we used original image comparing techniques for English/Arabic numerals/Symbol recognition and type classification techniques for recognizing speed.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/144714http://hanyang.dcollection.net/common/orgView/200000411474
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ELECTRONIC,ELECTRICAL,CONTROL & INSTRUMENTATION ENGINEERING(전자전기제어계측공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE