ABBYY FineReader로 OCR작업을 하면 임시파일이 상당히 크게 생긴다.


현재 128짜리 SSD에 윈도우10을 깔아서 쓰고 있는데 사실 평소에는 사용하는데 아무 불편함이 없다.


어차피 용량 큰 파일들은 추가로 달아놓은 1테라짜리 HDD에 넣어두니 용량이 부족하진 않고


심지어 OCR을 돌릴 때도 2,300쪽 정도 되는 책은 그럭저럭 작업이 가능했다.


그런데 거의 1000페이지에 가까운 책을 OCR돌리려고 하니 용량이 부족했다.


대략 20기가 이상을 필요로 하는지라...




C드라이브를 아무리 정리해도 SSD에서 20기가 이상을 확보할 수가 없어서 그냥 임시파일 저장장소를 HDD로 옮겨야겠다 생각을 했다


원래 ABBYY는 기본적으로 "사용자\AppData\Local\Temp" 이 위치에 폴더를 만들고 임시파일을 저장하게 되어있다. (윈도우10 기준. 아마 윈도우계열은 다 똑같지 싶다)


당연히 ABBYY에서 임시파일 저장위치를 설정할 수 있을줄 알았는데 그런 기능을 지원하지 않는 것 같았다.


"사용자\AppData\Local\Temp" 여기는 ABBYY말고도 다른 프로그램들의 임시파일도 저장되는 장소라서 ABBYY만 따로 빼고 싶었는데 방법이 없어서


어쩔 수 없이 OCR작업을 할 때만이라도 환경변수를 바꿀 수밖에 없었다.




시작->설정->시스템->정보->시스템정보->고급 시스템 설정->환경변수

(아니면 그냥 윈도우키 누르고 "환경 변수"검색하면 "시스템 환경 변수 편집" 이라고 나온다)


여기서 "(사용자)에 대한 사용자변수"쪽에 보면 TMP 항목이 있다.


더블클릭하면 아마 "%USERPROFILE%\AppData\Local\Temp" 이렇게 되어있을텐데,


이 부분을 내가 임시파일을 저장하고자 하는 위치로 바꿔줘서 OCR작업을 시작하고,


끝난다음에 다시 원래 주소로 되돌려주면 된다.




조금 번거롭긴 해도 이 방법 말고 다른 방법을 찾을 수가 없어서 일단 이렇게 사용하고 있다.







Posted by ark1230
:

윈도우 10이 여러모로 편리한 점이 많긴 한데, 오히려 쓸데없이 친절해서 불편한 부분도 있다.


그 중에 하나가 윈도우 탐색기 왼쪽에 나오는 바로가기들에


OneDrive나 Creative Cloud Files같은 바로가기들이 자동으로 생기는 것이다.



쓰는 사람이야 편하겠지만, 생전 안건드리는 나같은 경우는 오히려 있어서 보기 불편했는데


찾아보니까 지우는 방법은 다양하게 있었지만, 여기서는 레지스트리에서 지우는 방법을 소개하려고 한다.



1. "윈도우 + R" 누르고 실행 창에다가 "regedit" 입력 후 확인

(아니면 윈도우키 누르고 regedit 검색)





2. HKEY_CLASSES_ROOT\CLSID\{018D5C66-4533-4307-9B53-224DE2ED1FE6}

여기로 찾아가서 (아니면 Ctrl +F 해서 "Creative Cloud Files" 검색해도 된다)

System.IsPinnedToNameSpaceTree 이 항목을 더블클릭하고,

1로 되어있는 값을 0으로 바꾸고 확인



HKEY_CLASSES_ROOT\CLSID\{0E270DAA-1BE6-48F2-AC49-E150A5CE9F93}

여기도 똑같이 바꿔준다.


참고로

OneDrive :

{018D5C66-4533-4307-9B53-224DE2ED1FE6}


Creative Cloud Files :

{0E270DAA-1BE6-48F2-AC49-E150A5CE9F93}




이렇게 바꿔주면 탐색기 왼쪽에서 사라진다






* 맨 뒷자리 값은 조금 다를 수도 있으니, 앞자리 비슷하게 찾아서 바꿔보고 확인해보자.


 ** HKEY_CURRENT_USER\Software\Classes\CLSID

여기서 바꿔도 된다.













'컴퓨터관련 > 기타' 카테고리의 다른 글

티스토리에 PDF문서 삽입  (1) 2017.10.01
MS 워드 한글 자모 분리  (0) 2017.06.27
이클립스 아이콘 정보  (1) 2016.12.10
Visual Studio 2015 탭 닫기  (0) 2016.07.15
블로그에 소스코드 올리기 - Color Scripter  (0) 2016.07.09
Posted by ark1230
:

유튜브 Sensual Musique 채널에 올라오는 음악들이 대부분 취향저격이라 구독해서 잘 듣고 있는데

거기서 최근 알게된 아티스트를 소개한다.



<SAXITY>

홈페이지

페이스북

유튜브



Saxity are bridging the gap between live musicians, record producers & performers.
Instrumentally focussed, the German duo combines their trademark live guitar and saxophone sound
with deep/melodic house productions, creating vibrant tunes to bring rawer musicality back on the dance floor.

Founded in Cologne in 2013, the duo performed houndreds of live shows all over Germany
as well as over seas. Their music brought the two young men to Croatia, Spain, Mexico,
Barbados, Norway and Slovakia already & many more exciting places are on the map for 2017!
Alone in 2016, Saxity’s remixes got played more than 10 Million times
with mentions across all major music blogs including Billboard magazine.

출처:http://saxity.com/



SAXITY는 2013년부터 활동을 시작한 독일 출신의 이인조 뮤지션/프로듀서 이고 Sebastian Dittrich는 일렉기타를, Konstantin Flegelskamp는 색소폰을 연주한다.






보면 커버/리믹스 곡들도 있고, 자작곡도 있는데 대부분 꽤 괜찮다.

개인적으로 Scream, Brothers가 좋았다.






이전에 Ehrling 곡 들을때부터 느꼈지만, 의외로 트로피컬 하우스 장르랑 색소폰 음색이 잘 어울리는 것 같다.


Posted by ark1230
:

블로그에 배경음악을 넣는 방법이야 단순하게 파일첨부해서 embed태그로 넣는 방법부터 정말 다양하게 있겠지만 유튜브SCM 플레이어를 활용하는 방식이 제일 쉽고 깔끔하게 해결되는 것 같다.


특별히 설명이 없이도 SCM플레이어 홈페이지에서 시키는대로만 하면 태그가 생성된다.





우선, SCM 홈페이지(http://scmplayer.co/)로 들어가서



스킨을 골라주고,






재생할 음악의 주소를 유튜브에서 복사해 온다.

이 블로그에는 유튜브에 올라와 있는 24시간 라이브 음악방송 주소 하나만 사용하고 있는데, 여러 곡을 추가할 수도 있다.






마지막으로 몇가지 세팅값만 설정해 주면 되는데,


자동재생, 랜덤재생, 기본 볼륨값, 반복재생 기능들이랑

재생바의 위치, 플레이리스트 등의 옵션을 설정할 수 있다.


다 마치고 우측 하단의 Done을 누르면 HTML태그가 나온다.








이 HTML태그를 복사해서 티스토리 스킨에 넣어주면 끝난다.






티스토리 관리 페이지 왼쪽 메뉴에서

꾸미기->HTML/CSS편집

으로 들어가면




오른쪽에 이렇게 HTML을 직접 편집할 수 있게 나오는데, 여기서

<body> 태그 안에다가 넣어주면 간단하게 적용된다.







Posted by ark1230
:

북스캐너 리뷰 포스팅을 작성하다가

PDF파일을 단순히 첨부하는 방식이 아니라 본문에서 바로 볼 수 있게 올리는 방법이 없을까 알아봤더니 생각보다 간단한 방법이 있었다.


* 파이어폭스로 했더니 잘 안됐다. 아마 설치해둔 애드온이랑 구글 앱이랑 충돌해서 그런 것 같긴 한데, 안전하게 크롬으로 하는 것을 권장한다.


* 2017년 10월 1일 기준.





1. 구글 드라이브에 PDF파일을 올린다.


2. 올린 파일을 우클릭해서 공유 옵션으로 들어간다.





3. 고급 -> 변경 으로 들어간다






4. 사용 - 모든 웹 사용자 옵션을 선택하고 저장한다





5. 파일을 더블클릭해서 열면 바로 미리보기로 보여주는데, 우측 상단에 ... 을 클릭하고

"새 창에서 열기"를 누른다.





6. 새 창에서 파일이 열리면 다시 우측 상단의 ... 으로 들어가서 "항목 삽입"을 클릭한다.





7. 여기서 보여주는 링크를 복사해서 사용한다.




8. 티스토리에서 글을 작성할 때 메뉴 오른쪽 끝에 있는 HTML체크박스를 체크하고 위 태그를 붙여넣고 다시 체크를 헤제하면 본문에 아래처럼 PDF파일이 보인다.



적용 예 ↓






Posted by ark1230
:

예전부터 집에 있는 책들 중에 자주 보지는 않지만 가끔 찾아볼만한 책이나, 전공서적 등을 PDF로 스캔해서 클라우드에 넣어다니고 싶다는 생각을 종종 했다.


언제 한 번은 책 몇권을 들고 훈민스캔에 가서 셀프 스캔도 해봤는데 결과물은 만족스러웠지만, 어쨌든 책을 한 번 재단해야한다는 점이 아쉬웠다.


평판형은 한 장 한 장 넘겨가며 스캔을 해야되다보니 아무래도 자동으로 빠르게 되는 급지형보다는 조금 노가다를 해야되지만 한 번 스캔하면 책이 훼손된다는게 아무래도 걸려서 결국 평판형 스캐너를 선택했다.


이것저것 찾아보다가 너무 비싼 기기는 부담스럽고 Avision에서 나온 FB2280E를 구매했다.


세어보니 지금까지 대략 15권 조금 넘게 스캔을 했는데 시간을 꽤 잡아먹기는 하지만 어쨌든 내 손으로 E-book을 만들 수 있다는게 정말 좋은 것 같다.



<스캐너 사용 영상>


여기서는 영상을 찍느라고 스캐너를 왼쪽에 두고 작업했지만, 보통은 정면에 두고 작업한다.


컴퓨터 화면이 2개라서 한 쪽에서는 스캔작업 모니터링 하고 한 쪽에서는 영상을 틀어놓고 작업하다보니 그렇게 지루하지도 않고 할만하다.




<소요시간>


판형 : 신국판 152×225mm (가장 일반적인 단행본 사이즈)

DPI : 300 (보통은 300정도면 충분한 것 같다. 그림이 많은 책이라면 조금 더 올리는게 좋을 수도 있다)

Grayscale (Color로 스캔했을 때 OCR인식률이 더 좋다고도 하지만 그렇게까지 할 필요는 없었다)

Scanner Interval : 1sec


*이게 위 영상에 나오는 책 작업할 때 설정이고 책 사이즈를 제외하고는 대부분 저렇게 하고 작업했다.


이런 조건으로 스캔했을 때 시간을 재어보니,

50페이지4분20초 (260s) 정도가 나왔다.


대략 한 페이지에 5.2초가 걸려서

376쪽짜리 책을 스캔하는데 약 35분정도가 걸렸다.


그 뒤 후 보정 작업에서 이미지 조정하고 pdf로 합치는데까지 대략 20분 내외가 걸렸다.


일반적으로 300~400 페이지 내외의 책 한 권 스캔작업 마무리하는데 1시간 정도 걸린다고 보면 될 것 같다.



하지만 소요시간은 책의 사이즈나 dpi를 어떻게 설정하는지,

그리고 책 상태에 따라 빨리빨리 넘기기 어려운 책의 경우 인터벌을 2초 이상 줘야할 수도 있고..

변수가 다양해서 항상 저정도 시간이 걸린다고 보기는 어렵다.

(실제로 중간에 회색 페이지 위에 글이 인쇄되어 있는 부분이 많았던 책은 선명하게 스캔하기 위해 DPI를 400으로 올려서 작업했는데 스캔속도 자체가 느려져서 훨씬 오래 걸렸던 적이 있다.)


그리고 스캔하다가 중간에 멈추고 잠깐 다른 일 하다 오는 경우도 좀 있고, 실제 시간은 더 오래 걸리는 경우가 훨씬 많았다.




<결과물>




스캔한 책들은 주로 태블릿에 넣어서 읽는 편인데, 태블릿이나 스마트폰에서 보는데는 아무 지장 없이 깔끔하게 보일 정도의 퀄리티는 나온다.


OCR같은 경우는 대부분 Acrobat으로 하는 편인데, 위의 결과물 샘플에 나오는 것처럼 글씨 배경에 그림이 있거나 글씨가 잘 안보이게 스캔된 부분은 인식률이 떨어지기는 하지만, 일반적인 본문의 경우 꽤 괜찮은 퀄리티로 OCR이 가능하다.


일부분을 복사해서 사용하는 경우 줄 바꿈이나 띄어쓰기를 꽤 많이 조절해야 하지만 그래도 직접 타이핑하는 것 보다는 효율이 좋은 것 같고, 내용 검색을 하기엔 충분한 퀄리티로 나오는 것 같다.




<북스캔 총평>


장점

1. 접근성이 좋다

언제 어디서나 내가 가지고 있는 책의 내용을 검색하거나 읽을 수 있다는 점이 제일 좋은 것 같다. 특히 전공서적같은 경우 그 두꺼운 책들을 자주 보진 않지만 가끔씩 찾아볼 때가 있는데 그럴 때 유용하다.


2. 책을 훼손하지 않는다

스캔을 위해서 책을 버릴 필요 없이 손상하지 않고 스캔이 가능하다.


3. 단순하다

이 부분은 조금 애매하긴 한데, 처음에는 정말 복잡하게 느껴진다. 할 일도 많고 뭐가 어떻게 돌아가는건지도 모르겠고 한 번 스캔하는데 엄청 시간이 오래 걸리기도 한다.

하지만 스캔작업은 결국 단순노동이다 보니 어느정도 방법이 정리되고 절차가 익숙해지면 그 때부터는 어렵지 않게 작업이 된다.


단점

1. 시간이 오래 걸린다

아무래도 급지형에 비하면 훨씬 시간이 많이 소요된다. 위에 적은 소요시간은 정말 스캔작업만 할 때 걸리는 시간이지만 실제 스캔을 하다보면 중간에 쉬기도 하고 다른 일이 생기기도 해서, 몇 권 스캔하다 보면 하루가 금방 갈 때도 있다.


2. 피곤하다

어쨌든 손으로 일일히 책을 넘겨줘야 하고, 책 상태에 따라 모서리를 조금 눌러줘야 하는 경우도 있다. 영상을 틀어놓고 하기도 하지만 한편으로는 제대로 스캔이 되고 있는지 모니터도 해야하기 때문에 은근히 지친다.



그래도 전체적으로 매우 만족이다. 예전부터 스캔을 하고싶기도 했고 결과물도 정말 맘에 드는 수준으로 나오기 때문에, 집에 있는 책들로 온라인 서재를 채워나가는 성취감이 있다.









Posted by ark1230
: