잡담: Capture2Text - OCR 인터페이스

OCR(Optical Character Recognition)은 인쇄된 글자 또는 손으로 쓴 글자를 읽어 들이는 기술이다. 이를 위해 일단 이미지파일로 만든 후 이 이미지파일을 텍스트로 전환하는 두 단계로 진행될 것 같다. 그런데 컴퓨터 모니터에 쓰여져 있는 글자는 어떻게 읽을 수 있을까?

읽을려고 하는 대상이 윈도우즈상에서 텍스트로 표시된 것이라면 스크린텍스트를 읽어 내는 툴을 사용하면 된다. 하지만 텍스트로 표시된 것이 아니라 그림으로 그려진 것이라면 어떻게 할 것인가. 일단 화면상에 표시된 내용을 이미지로 저장한다. 그 후 OCR 도구를 사용하면 될 것이다. Capture2Text는 이 두 단계를 엮어 주는 툴이다.

Capture2Text는 다음과 같은 순서로 실행된다.

1. 지정된 화면을 이미지 파일로 만든다.

Output\screen_capture.bmp

2. 인식율을 높이기 위해 leptonica_util.exe를 이용해서 이미지파일 크기를 두배로 키우고 흑백 이미지파일로 바꾼다.

Utils\leptonica_util\leptonica_util.exe Output\screen_capture.bmp Output\screen_capture_scaled.bmp 3

3. OCR도구인 tesseract.exe를 이용해서 이미지를 텍스트로 바꾼 후 인식된 텍스트를 클립보드에 복사한다.

Utils\tesseract\tesseract.exe Output/screen_capture_scaled.bmp Output/ocr -l eng -psm 3

-l eng : 영문모드

-psm 3 : 페이지 자동 인식모드

잡담

2015년 2월 20일 금요일

Capture2Text - OCR 인터페이스

댓글 없음 :

댓글 쓰기