3. OCR


사실 OCR은 특별히 설정을 건드릴 부분이 없다.

보통 Adobe Acrobat을 사용하고 잘 안되는 파일은 Abbyy를 사용하는데,

아직까지 어느쪽의 인식률이 더 좋은지는 잘 모르겠다.




OCR을 하기 위해서는 Acrobat을 열고 도구메뉴에서 "여러 파일의 텍스트 인식"을 누르면 된다.




도구메뉴에 저 아이콘이 없으면 도구메뉴쪽을 우클릭하고 "현재 도구 세트 편집"에 들어가서


텍스트 인식 -> 여러 파일의 텍스트 인식 을 선태하고 오른쪽의 '+' 버튼을 눌러서 위로 올리면 된다.






아니면 보기 -> 도구 -> 텍스트 인식

으로 들어가서


오른쪽에 뜨는 텍스트 인식->여러 파일에서

를 클릭해도 된다.







아무튼 이런 창이 뜨면,

파일 추가 -> OCR돌릴 파일을 선택 (여러 파일 동시 선택 가능)



대충 이런 식으로 설정하고



언어를 선택하고 (한국어를 선택해도 중간에 있는 영어는 영어로 인식한다)

출력 스타일은 ClearScan이나 검색할 수 있는 이미지 로 하면 된다.

ClearScan이 용량도 적고 약간 깔끔하게 나오는 것 같아서 주로 ClearScan 옵션을 사용한다.


확인을 누르면 꽤 오랫동안 작업을 하고 CPU도 꽤 많이 사용하기때문에 밤에 잘 때 여러 파일을 한번에 돌리는 식으로 하면 좋다.


OCR인식률은 좋은 편이다. 물론 띄어쓰기까지 완벽하게 인식되진 않지만 그래도 검색은 별 무리 없이 되는 편이고, 텍스트 복사도 조금만 손보면 쓸 수 있는 정도로 나온다.

책 한권 전체를 복사하는건 어렵겠지만 중간 중간 몇문장을 복사하는 정도는 충분히 가능하다.






Posted by ark1230
: