PDF 파일에서 텍스트를 추출하는 방법
PDF 파일에서 텍스트를 추출해야 할 때가 올 수 있습니다. 워드 프로세싱 문서에 복사하여 붙여넣거나, 나중에 참조하기 위해 텍스트를 보관하고 싶을 수도 있습니다.
하지만 때로는 짜증나는 과정이 될 수도 있습니다. 대부분의 PDF 파일은 화면에서 보거나 그대로 인쇄하도록 되어 있습니다. 원하는 텍스트만 선택하려고 하면 너무 많이 선택하거나 너무 적게 선택하는 경우가 많습니다. 그리고 텍스트를 다른 양식으로 저장하려면 Edge와 같은 PDF 뷰어에서 직접 할 수 없습니다.
다행히 PDF 파일에서 텍스트를 추출하여 프로세스를 훨씬 더 쉽게 만들 수 있는 몇 가지 방법이 있습니다.
PDF에서 텍스트를 추출하는 방법?
- Adobe Acrobat Pro를 사용하세요
유료 프로그램인 Adobe Acrobat Pro는 가장 인기 있는 PDF 리더 중 하나이며 강력한 텍스트 추출 기능도 있습니다. Adobe Acrobat에서 PDF 파일을 열고 "도구" > "PDF 내보내기"로 이동하기만 하면 됩니다. Word, Rich Text, Excel, PowerPoint, Image를 포함하여 PDF를 내보낼 수 있는 여러 가지 형식이 있습니다.
여러 PDF 파일을 추가하고 한 번에 모두 내보낼 수 있으므로 한 번에 하나씩 과정을 거칠 필요가 없습니다.
PDF에서 특정 문구나 텍스트의 일부(예: 데이터 표)를 추출하려면 해당 영역을 선택한 다음 마우스 오른쪽 버튼을 클릭하여 내보내기만 하면 됩니다.
또는 다음을 활용할 수 있습니다. PDF요소 Adobe Acrobat이 마음에 들지 않는다면
- 온라인 PDF 변환기 사용
컴퓨터에 소프트웨어를 설치하고 싶지 않다면, PDF 파일에서 텍스트를 추출하는 데 도움이 되는 여러 온라인 PDF 변환기가 있습니다. 내보내고 싶은 형식을 지원하는 것을 찾아서 PDF를 업로드하세요.
이러한 서비스 중 일부는 무료로 사용할 수 있지만 대부분은 파일 크기 제한, 페이지 제한, 출력 문서에 워터마크가 표시되는 등 어떤 종류의 제한이 있습니다.
- Google 문서 사용
Google Docs를 사용하여 PDF에서 텍스트를 추출할 수도 있습니다. PDF 파일을 Google Drive에 업로드한 다음 Google Docs로 열어 이 작업을 완료하기만 하면 됩니다.
PDF가 열리면 "파일" > "다운로드"로 이동하여 대상 형식 중 하나를 선택합니다. 파일이 컴퓨터에 다운로드되어 마음껏 편집할 수 있습니다.
스캔한 PDF에서 텍스트를 추출하려면 어떻게 해야 하나요?
스캔한 PDF에서 텍스트를 추출하려고 하면 PDF 파일이 본질적으로 텍스트의 이미지이기 때문에 더 어려울 것입니다. 이 경우 광학 문자 인식(OCR) 도구를 사용하여 텍스트를 추출해야 합니다.
강력한 OCR 프로그램 중 하나는 아이스크림 PDF 변환기 몇 번의 클릭만으로 스캔한 PDF를 편집 가능한 텍스트 파일로 바꿀 수 있습니다.
작동 원리는 다음과 같습니다.
- Windows 컴퓨터에 Icecream PDF Converter를 설치하고 엽니다(Mac의 경우 다음을 사용하세요. 동일한 PDF 변환기 OCR ).
- "PDF에서"를 클릭하고 변환하려는 스캔된 PDF를 선택합니다.
- 새 파일에 대한 출력 형식을 선택하고 "변환"을 클릭하세요.
변환이 완료되면 파일이 컴퓨터에 저장됩니다.
Icecream PDF Converter는 12개 이상의 OCR 언어를 지원하고 PDF를 DOC, DOCX, HTML, ODT, RTF, TXT 등으로 변환할 수 있습니다.
앞서 언급한 Google Docs에는 스캔한 PDF를 편집 가능한 텍스트 문서로 변환하는 데 사용할 수 있는 OCR 기능도 있습니다. Icecream PDF Converter나 Cisdem PDF Converter OCR만큼 포괄적이지는 않지만 대부분의 경우 여전히 작업을 완료할 수 있습니다.
보호된 PDF에서 텍스트를 추출하는 방법?
일부 PDF 파일은 편집 암호로 잠겨 있거나 텍스트를 추출하지 못하게 하는 다른 보안 조치가 있습니다. 보호된 PDF에서 텍스트를 추출해야 하는 경우 다음과 같은 PDF 잠금 해제 프로그램을 사용해야 합니다. PDF용 Passper .
Passper for PDF는 PDF 파일에서 편집 암호 및 인쇄 제한, 복사 제한 등과 같은 기타 보안 제한을 제거할 수 있는 강력한 프로그램입니다. 변환 프로세스는 간단하고 빠르므로 컴퓨터 전문가가 아니어도 할 수 있습니다.
PC에 소프트웨어를 다운로드하여 설치한 다음, Passper for PDF에서 보안된 PDF 파일을 엽니다.
"제한 제거" 버튼을 클릭하면 프로그램이 PDF 파일에서 보호를 제거하기 시작합니다. 완료되면 Edge, PDFelement, Google Docs 또는 다른 PDF 보기 프로그램에서 PDF 파일을 열고 텍스트를 추출할 수 있습니다.
PDF 파일에서 텍스트를 추출하는 것은 어려운 과정이 될 필요가 없습니다. 적절한 도구를 사용하면 가장 보호된 PDF 파일에서도 텍스트를 쉽게 추출할 수 있습니다.