ABBYY FineReader로 OCR작업을 하면 임시파일이 상당히 크게 생긴다.


현재 128짜리 SSD에 윈도우10을 깔아서 쓰고 있는데 사실 평소에는 사용하는데 아무 불편함이 없다.


어차피 용량 큰 파일들은 추가로 달아놓은 1테라짜리 HDD에 넣어두니 용량이 부족하진 않고


심지어 OCR을 돌릴 때도 2,300쪽 정도 되는 책은 그럭저럭 작업이 가능했다.


그런데 거의 1000페이지에 가까운 책을 OCR돌리려고 하니 용량이 부족했다.


대략 20기가 이상을 필요로 하는지라...




C드라이브를 아무리 정리해도 SSD에서 20기가 이상을 확보할 수가 없어서 그냥 임시파일 저장장소를 HDD로 옮겨야겠다 생각을 했다


원래 ABBYY는 기본적으로 "사용자\AppData\Local\Temp" 이 위치에 폴더를 만들고 임시파일을 저장하게 되어있다. (윈도우10 기준. 아마 윈도우계열은 다 똑같지 싶다)


당연히 ABBYY에서 임시파일 저장위치를 설정할 수 있을줄 알았는데 그런 기능을 지원하지 않는 것 같았다.


"사용자\AppData\Local\Temp" 여기는 ABBYY말고도 다른 프로그램들의 임시파일도 저장되는 장소라서 ABBYY만 따로 빼고 싶었는데 방법이 없어서


어쩔 수 없이 OCR작업을 할 때만이라도 환경변수를 바꿀 수밖에 없었다.




시작->설정->시스템->정보->시스템정보->고급 시스템 설정->환경변수

(아니면 그냥 윈도우키 누르고 "환경 변수"검색하면 "시스템 환경 변수 편집" 이라고 나온다)


여기서 "(사용자)에 대한 사용자변수"쪽에 보면 TMP 항목이 있다.


더블클릭하면 아마 "%USERPROFILE%\AppData\Local\Temp" 이렇게 되어있을텐데,


이 부분을 내가 임시파일을 저장하고자 하는 위치로 바꿔줘서 OCR작업을 시작하고,


끝난다음에 다시 원래 주소로 되돌려주면 된다.




조금 번거롭긴 해도 이 방법 말고 다른 방법을 찾을 수가 없어서 일단 이렇게 사용하고 있다.







Posted by ark1230
:

블로그에 배경음악을 넣는 방법이야 단순하게 파일첨부해서 embed태그로 넣는 방법부터 정말 다양하게 있겠지만 유튜브SCM 플레이어를 활용하는 방식이 제일 쉽고 깔끔하게 해결되는 것 같다.


특별히 설명이 없이도 SCM플레이어 홈페이지에서 시키는대로만 하면 태그가 생성된다.





우선, SCM 홈페이지(http://scmplayer.co/)로 들어가서



스킨을 골라주고,






재생할 음악의 주소를 유튜브에서 복사해 온다.

이 블로그에는 유튜브에 올라와 있는 24시간 라이브 음악방송 주소 하나만 사용하고 있는데, 여러 곡을 추가할 수도 있다.






마지막으로 몇가지 세팅값만 설정해 주면 되는데,


자동재생, 랜덤재생, 기본 볼륨값, 반복재생 기능들이랑

재생바의 위치, 플레이리스트 등의 옵션을 설정할 수 있다.


다 마치고 우측 하단의 Done을 누르면 HTML태그가 나온다.








이 HTML태그를 복사해서 티스토리 스킨에 넣어주면 끝난다.






티스토리 관리 페이지 왼쪽 메뉴에서

꾸미기->HTML/CSS편집

으로 들어가면




오른쪽에 이렇게 HTML을 직접 편집할 수 있게 나오는데, 여기서

<body> 태그 안에다가 넣어주면 간단하게 적용된다.







Posted by ark1230
:

예전부터 집에 있는 책들 중에 자주 보지는 않지만 가끔 찾아볼만한 책이나, 전공서적 등을 PDF로 스캔해서 클라우드에 넣어다니고 싶다는 생각을 종종 했다.


언제 한 번은 책 몇권을 들고 훈민스캔에 가서 셀프 스캔도 해봤는데 결과물은 만족스러웠지만, 어쨌든 책을 한 번 재단해야한다는 점이 아쉬웠다.


평판형은 한 장 한 장 넘겨가며 스캔을 해야되다보니 아무래도 자동으로 빠르게 되는 급지형보다는 조금 노가다를 해야되지만 한 번 스캔하면 책이 훼손된다는게 아무래도 걸려서 결국 평판형 스캐너를 선택했다.


이것저것 찾아보다가 너무 비싼 기기는 부담스럽고 Avision에서 나온 FB2280E를 구매했다.


세어보니 지금까지 대략 15권 조금 넘게 스캔을 했는데 시간을 꽤 잡아먹기는 하지만 어쨌든 내 손으로 E-book을 만들 수 있다는게 정말 좋은 것 같다.



<스캐너 사용 영상>


여기서는 영상을 찍느라고 스캐너를 왼쪽에 두고 작업했지만, 보통은 정면에 두고 작업한다.


컴퓨터 화면이 2개라서 한 쪽에서는 스캔작업 모니터링 하고 한 쪽에서는 영상을 틀어놓고 작업하다보니 그렇게 지루하지도 않고 할만하다.




<소요시간>


판형 : 신국판 152×225mm (가장 일반적인 단행본 사이즈)

DPI : 300 (보통은 300정도면 충분한 것 같다. 그림이 많은 책이라면 조금 더 올리는게 좋을 수도 있다)

Grayscale (Color로 스캔했을 때 OCR인식률이 더 좋다고도 하지만 그렇게까지 할 필요는 없었다)

Scanner Interval : 1sec


*이게 위 영상에 나오는 책 작업할 때 설정이고 책 사이즈를 제외하고는 대부분 저렇게 하고 작업했다.


이런 조건으로 스캔했을 때 시간을 재어보니,

50페이지4분20초 (260s) 정도가 나왔다.


대략 한 페이지에 5.2초가 걸려서

376쪽짜리 책을 스캔하는데 약 35분정도가 걸렸다.


그 뒤 후 보정 작업에서 이미지 조정하고 pdf로 합치는데까지 대략 20분 내외가 걸렸다.


일반적으로 300~400 페이지 내외의 책 한 권 스캔작업 마무리하는데 1시간 정도 걸린다고 보면 될 것 같다.



하지만 소요시간은 책의 사이즈나 dpi를 어떻게 설정하는지,

그리고 책 상태에 따라 빨리빨리 넘기기 어려운 책의 경우 인터벌을 2초 이상 줘야할 수도 있고..

변수가 다양해서 항상 저정도 시간이 걸린다고 보기는 어렵다.

(실제로 중간에 회색 페이지 위에 글이 인쇄되어 있는 부분이 많았던 책은 선명하게 스캔하기 위해 DPI를 400으로 올려서 작업했는데 스캔속도 자체가 느려져서 훨씬 오래 걸렸던 적이 있다.)


그리고 스캔하다가 중간에 멈추고 잠깐 다른 일 하다 오는 경우도 좀 있고, 실제 시간은 더 오래 걸리는 경우가 훨씬 많았다.




<결과물>




스캔한 책들은 주로 태블릿에 넣어서 읽는 편인데, 태블릿이나 스마트폰에서 보는데는 아무 지장 없이 깔끔하게 보일 정도의 퀄리티는 나온다.


OCR같은 경우는 대부분 Acrobat으로 하는 편인데, 위의 결과물 샘플에 나오는 것처럼 글씨 배경에 그림이 있거나 글씨가 잘 안보이게 스캔된 부분은 인식률이 떨어지기는 하지만, 일반적인 본문의 경우 꽤 괜찮은 퀄리티로 OCR이 가능하다.


일부분을 복사해서 사용하는 경우 줄 바꿈이나 띄어쓰기를 꽤 많이 조절해야 하지만 그래도 직접 타이핑하는 것 보다는 효율이 좋은 것 같고, 내용 검색을 하기엔 충분한 퀄리티로 나오는 것 같다.




<북스캔 총평>


장점

1. 접근성이 좋다

언제 어디서나 내가 가지고 있는 책의 내용을 검색하거나 읽을 수 있다는 점이 제일 좋은 것 같다. 특히 전공서적같은 경우 그 두꺼운 책들을 자주 보진 않지만 가끔씩 찾아볼 때가 있는데 그럴 때 유용하다.


2. 책을 훼손하지 않는다

스캔을 위해서 책을 버릴 필요 없이 손상하지 않고 스캔이 가능하다.


3. 단순하다

이 부분은 조금 애매하긴 한데, 처음에는 정말 복잡하게 느껴진다. 할 일도 많고 뭐가 어떻게 돌아가는건지도 모르겠고 한 번 스캔하는데 엄청 시간이 오래 걸리기도 한다.

하지만 스캔작업은 결국 단순노동이다 보니 어느정도 방법이 정리되고 절차가 익숙해지면 그 때부터는 어렵지 않게 작업이 된다.


단점

1. 시간이 오래 걸린다

아무래도 급지형에 비하면 훨씬 시간이 많이 소요된다. 위에 적은 소요시간은 정말 스캔작업만 할 때 걸리는 시간이지만 실제 스캔을 하다보면 중간에 쉬기도 하고 다른 일이 생기기도 해서, 몇 권 스캔하다 보면 하루가 금방 갈 때도 있다.


2. 피곤하다

어쨌든 손으로 일일히 책을 넘겨줘야 하고, 책 상태에 따라 모서리를 조금 눌러줘야 하는 경우도 있다. 영상을 틀어놓고 하기도 하지만 한편으로는 제대로 스캔이 되고 있는지 모니터도 해야하기 때문에 은근히 지친다.



그래도 전체적으로 매우 만족이다. 예전부터 스캔을 하고싶기도 했고 결과물도 정말 맘에 드는 수준으로 나오기 때문에, 집에 있는 책들로 온라인 서재를 채워나가는 성취감이 있다.









Posted by ark1230
:

3. OCR


사실 OCR은 특별히 설정을 건드릴 부분이 없다.

보통 Adobe Acrobat을 사용하고 잘 안되는 파일은 Abbyy를 사용하는데,

아직까지 어느쪽의 인식률이 더 좋은지는 잘 모르겠다.




OCR을 하기 위해서는 Acrobat을 열고 도구메뉴에서 "여러 파일의 텍스트 인식"을 누르면 된다.




도구메뉴에 저 아이콘이 없으면 도구메뉴쪽을 우클릭하고 "현재 도구 세트 편집"에 들어가서


텍스트 인식 -> 여러 파일의 텍스트 인식 을 선태하고 오른쪽의 '+' 버튼을 눌러서 위로 올리면 된다.






아니면 보기 -> 도구 -> 텍스트 인식

으로 들어가서


오른쪽에 뜨는 텍스트 인식->여러 파일에서

를 클릭해도 된다.







아무튼 이런 창이 뜨면,

파일 추가 -> OCR돌릴 파일을 선택 (여러 파일 동시 선택 가능)



대충 이런 식으로 설정하고



언어를 선택하고 (한국어를 선택해도 중간에 있는 영어는 영어로 인식한다)

출력 스타일은 ClearScan이나 검색할 수 있는 이미지 로 하면 된다.

ClearScan이 용량도 적고 약간 깔끔하게 나오는 것 같아서 주로 ClearScan 옵션을 사용한다.


확인을 누르면 꽤 오랫동안 작업을 하고 CPU도 꽤 많이 사용하기때문에 밤에 잘 때 여러 파일을 한번에 돌리는 식으로 하면 좋다.


OCR인식률은 좋은 편이다. 물론 띄어쓰기까지 완벽하게 인식되진 않지만 그래도 검색은 별 무리 없이 되는 편이고, 텍스트 복사도 조금만 손보면 쓸 수 있는 정도로 나온다.

책 한권 전체를 복사하는건 어렵겠지만 중간 중간 몇문장을 복사하는 정도는 충분히 가능하다.






Posted by ark1230
:

2. Adjust


스캔된 이미지를 일괄 보정해주는 방법으로는 포토샵과 브릿지를 사용해서 일괄 수정하는 방법 등 여러가지가 있겠지만, Scan Tailor라는 프로그램이 심플하면서 다양한 기능을 제공해주고 있다.


User Guide 여기에 들어가보면 각 기능별로 설명이 잘 나와있다.








여기까지만 해도 pdf파일이 나오기 때문에 그대로 사용해도 되지만, Acrobat이나 Abbyy같은 프로그램이 있다면 OCR을 해주는 것도 좋다. -> Avision FB2280E 북스캔 절차 정리 - 3. OCR












'신변잡기 > ETC' 카테고리의 다른 글

평판형 북스캐너 Avision FB2280E 사용기  (0) 2017.10.01
Avision FB2280E 북스캔 절차 정리 - 3. OCR  (0) 2017.09.30
Avision FB2280E 북스캔 절차 정리 - 1.Scan  (13) 2017.09.30
엘릭서 줄 교체  (0) 2017.02.20
KF-15  (0) 2016.06.06
Posted by ark1230
:

얼마전에 Avision FB2280E 평판형 북스캐너를 마련하고서


처음에 얼마간은 스캔하는 방법도 알아보고 이것저것 시도해봤는데


이제는 어느정도 절차나 방법이 잡힌 것 같아서 정리하려 한다.


이 방법이 평판형 스캐너로 북스캔하는 최적의 방법은 아니겠지만 일단 지금으로선 비교적 만족스럽게 사용하고 있다.





북스캔 절차


북스캔 과정은 다음 3가지로 순서로 진행된다.

1. 스캔 -> 2. 보정 -> 3. OCR (OCR은 선택..이지만 안 할이유가 없다)


 






_M#]




1. 스캔






여기까지 하면 스캔하고 파일명 정리하는 단계까지가 끝난다.

다음은 Scan Tailor에서 보정하는 단계이다. -> Avision FB2280E 북스캔 절차 정리 - 2. Adjust


'신변잡기 > ETC' 카테고리의 다른 글

평판형 북스캐너 Avision FB2280E 사용기  (0) 2017.10.01
Avision FB2280E 북스캔 절차 정리 - 3. OCR  (0) 2017.09.30
Avision FB2280E 북스캔 절차 정리 - 2.Adjust  (0) 2017.09.30
엘릭서 줄 교체  (0) 2017.02.20
KF-15  (0) 2016.06.06
Posted by ark1230
:


いきものがかり - My Song Your Song (2008)



이키모노가카리 곡들을 좋아는 하는데 그렇게 많이 듣진 않았다

그냥 반가워서 한장 삼


'신변잡기 > 앨범' 카테고리의 다른 글

Extreme/Nuno [2]  (0) 2017.09.28
YUI [2]  (0) 2017.09.28
Be The Voice [4]  (0) 2017.09.28
Do As Infinity [3]  (0) 2017.09.28
Posted by ark1230
:

Extreme/Nuno [2]

신변잡기/앨범 2017. 9. 28. 23:38 |


Pornograffitti (1990)


비닐도 안뜯은 새거가 있길래 사와서 그대로 모셔두고 있다




Dramagods - Love (2005)


신기하게 Nuno형님 앨범이 알라딘에 있길래 집어옴



'신변잡기 > 앨범' 카테고리의 다른 글

いきものがかり - My Song Your Song  (0) 2017.09.28
YUI [2]  (0) 2017.09.28
Be The Voice [4]  (0) 2017.09.28
Do As Infinity [3]  (0) 2017.09.28
Posted by ark1230
:

YUI [2]

신변잡기/앨범 2017. 9. 28. 23:34 |


Can't buy my love (2007)





again (2009)

single



'신변잡기 > 앨범' 카테고리의 다른 글

いきものがかり - My Song Your Song  (0) 2017.09.28
Extreme/Nuno [2]  (0) 2017.09.28
Be The Voice [4]  (0) 2017.09.28
Do As Infinity [3]  (0) 2017.09.28
Posted by ark1230
:

Be The Voice [4]

신변잡기/앨범 2017. 9. 28. 23:31 |

Drawing (2003)





Epochs (2005)





Music & Me (2008)





Groundscape (2010)













'신변잡기 > 앨범' 카테고리의 다른 글

いきものがかり - My Song Your Song  (0) 2017.09.28
Extreme/Nuno [2]  (0) 2017.09.28
YUI [2]  (0) 2017.09.28
Do As Infinity [3]  (0) 2017.09.28
Posted by ark1230
: