무료 OCR 프로그램 이미지 문자인식 (텍스트 변환)
예전에는 어떤 책의 문구나 특정 부분을 사진이나 이미지 등으로 촬영, 스캔을 하여 다시 컴퓨터로 옮기는 작업을 해야할때 양이 많지 않으면 그렇게 오래 걸리지 않았지만 몇페이지나 되는 경우에는 이걸 어떻게 해야하는지 막막해 할 수 있습니다.
더군다나 이미지를 텍스트로 변환 하여 사진 내에 있는 문자를 인식 하는 것은 불가능 하다고 생각했었죠. 예전엔 단순히 이미지 내에 있는 텍스트 복사 붙여넣기 하고 싶었던 적도 있었습니다. 하지만 이제는 무료 OCR 프로그램을 이용을 하여 이미지 문자인식 이 가능하다고 합니다. 그 방법을 알아볼게요 ^^
테스트핼 이미지로 다크나이트 대본을 가져 와 보았습니다. 불후의명작 다크나이트는 여전히 인기를 끌고 있는 영화임에는 틀림이 없죠 ^^ 어쨋든 PDF 파일로 받은 것인데 PDF 파일 그대로는 텍스트를 가져올 수 없기 때문에 OCR 프로그램을 이용을 하여 텍스트를 읽어올 수 있습니다.
예를 돕기 위해서 이미지로 다시 한번 캡처를 하여 이용을 해보도록 하겠습니다!
ABBYY 프로그램을 이용을 하였는데요. http://retia.co.kr 사이트로 이동을 해주시면 됩니다.
ReTIA 홈페이지가 나오는데요 이미지 문자인식 을 하기 위해서는 서비스 메뉴로 들어가서 ROSE 문서인식 으로 이동을 합니다.
OCR 서비스 이용하기 버튼을 누르시면 시작을 하는데요. 위 내용에도 보이스듯이 사용가능한 문서는 스캐닝한 문서 또는 PDF 파일을 워드로 변환을 하게 되고 카메라로 촬영한 문서 이미지의 경우에는 텍스트 추출을 한다고 합니다.
다음 페이지로 이동을 하게 되면 PDF, JPG, PNG, BMP, TIF 파일을 변환을 할 수 있다고 하고 최소 300DPI 이상의 품질을 권장 한다고 합니다. 아무래도 낮은 DPI 품질을 이용을 한다면 잘못된 이미지 텍스트 변환이 될 수도 있다는 이야기가 되겠지요.
이미지문서를 워드문서로 변환할 수 있는데 MS워드 이외에는 변환이 되지 않으니 참고 하시고요~ 문서를 바로 저장을 할 수는 없고 대신 이메일로 받을 수 있습니다.
문서변환 버튼을 누르시게 되면 설정한 이메일로 변환된 문서 파일이 발송이 되게 됩니다. 거의 클릭하는 순간 파일이 오네요 ^^
위와 같은 제목으로 오기 때문에 혹시나 삭제를 하지 않으셔야 할거 같네요. 레티아 OCR 서비스 ABBYYOCR 서비스 - 문서 변환 성공 이라는 제목입니다.
지금 보시고 계신 화면은 무료 OCR 프로그램 으로 이미지 문자 인식을 실시한 화면 인데요 좌측이 다크나이크 이미지 파일이고 우측이 텍스트 변환한 워드 파일 입니다. 몇곳에 텍스트 변환에 실패한 부분이 있는데요. 완벽하게 텍스트로 변환이 되지 않으면 이미지 형태로 그대로 남겨 두는 거 같습니다.
PDF 파일이 있으시다면 PDF 파일 그대로 이용을 하시는걸 추천 해 드립니다~
지금까지 무료 OCR 프로그램 RETIA ABBYY OCR 서비스 였습니다~