'이미지문자인식'에 해당되는 글 1건

PDF파일을 텍스트형식으로 변환하려면

 

 

요즘 학교나 여러곳에서 PDF문서를 많이 사용합니다.
그런데 그것을 텍스트파일로 다시 사용하려면 어려운 경우가 있습니다.
그러나
PDF 파일을 텍스트형식으로 <변환> 하는 것은 문자인식 프로그램을 사용하면 가능하기도 합니다.

워드나 엑셀에서 만들어진 PDF파일을 쉽게 텍스트 레이어가 있어서 추출이 가능하나

스캔해서 만들어지거나 이미지PDF 파일은  말그대로 이미지로 만들어져서
텍스트 드래그 안되는 PDF 파일을 문자인식프로그램을 사용하여야만  텍스트를 추출할 수 있습니다.
프로그램 몇개를 소개하면 파인리더, 아르미, 옴니아  등이 있습니다
오늘은 제가 최근에 사용한  ABBYY PDF Transformer 소개하고자 합니다.

 

다운받을 수 있는 곳

 

워드, 엑셀, 파워포인트 같은 오피스문서 프로그램에서 만들어진 PDF파일은 생성될 때 부터 텍스트 레이어를 가지고 있지요~ 이런 PDF문서는 편집이나 텍스트 추출(마우스로 텍스트를 드래그하여 복사하는 것)이 쉽습니다.

가끔 우리가 당황하는 것은 바로 이런 "이미지PDF" 스캔PDF !! 이런 이미지PDF를 만났을 때. 분명 PDF파일이라고 했는데, 텍스트 편집도 안되고. 수정도 안되고.. 심지어 드래그 해서 복사도 안된다니.

 


ABBYY 파인리더 14는 이렇게 PDF문서에서 곧바로 텍스트를 수정할 수도 있지만,

문서에서 텍스트 자체를 복사할 수 있네요.

많은 분들이 'PDF텍스트 추출' 이라고 부르시는 기능인데요,

한번 다운받아 사용해 보세요 !

블로그 이미지

itworldkorea

IT korea가 세상(world)을 변화시킨다.

,