읽을려고 하는 대상이 윈도우즈상에서 텍스트로 표시된 것이라면 스크린텍스트를 읽어 내는 툴을 사용하면 된다. 하지만 텍스트로 표시된 것이 아니라 그림으로 그려진 것이라면 어떻게 할 것인가. 일단 화면상에 표시된 내용을 이미지로 저장한다. 그 후 OCR 도구를 사용하면 될 것이다. Capture2Text는 이 두 단계를 엮어 주는 툴이다.
Capture2Text는 다음과 같은 순서로 실행된다.
1. 지정된 화면을 이미지 파일로 만든다.
Output\screen_capture.bmp
2. 인식율을 높이기 위해 leptonica_util.exe를 이용해서 이미지파일 크기를 두배로 키우고 흑백 이미지파일로 바꾼다.
Utils\leptonica_util\leptonica_util.exe Output\screen_capture.bmp Output\screen_capture_scaled.bmp 3
3. OCR도구인 tesseract.exe를 이용해서 이미지를 텍스트로 바꾼 후 인식된 텍스트를 클립보드에 복사한다.
Utils\tesseract\tesseract.exe Output/screen_capture_scaled.bmp Output/ocr -l eng -psm 3
-l eng : 영문모드
-psm 3 : 페이지 자동 인식모드
댓글 없음 :
댓글 쓰기
참고: 블로그의 회원만 댓글을 작성할 수 있습니다.