Mètodes per extreure text d'un fitxer PDF
Pot arribar un moment en què necessiteu extreure text d'un fitxer PDF. Potser el voleu copiar i enganxar en un document de processament de textos, o potser voleu arxivar el text per a una futura referència.
Tanmateix, de vegades pot ser un procés frustrant. La majoria dels fitxers PDF estan pensats per veure's en una pantalla o imprimir-los tal com estan. Si intenteu seleccionar només el text que voleu, sovint es seleccionen massa o massa poc. I si voleu desar el text com a forma diferent, no ho podeu fer directament des del visualitzador de PDF com Edge.
Afortunadament, hi ha alguns mètodes que podeu utilitzar per extreure text d'un fitxer PDF i fer el procés molt més fàcil.
Com extreure text d'un PDF?
- Utilitzeu Adobe Acrobat Pro
Adobe Acrobat Pro, un programa de pagament, és un dels lectors de PDF més populars disponibles i també té algunes potents funcions d'extracció de text. Només cal que obriu el fitxer PDF a Adobe Acrobat i aneu a "Eines" > "Exporta PDF". Hi ha diversos formats que podeu triar per exportar el PDF, com ara Word, text enriquit, Excel, PowerPoint i imatge.
També podeu afegir diversos fitxers PDF i exportar-los tots alhora perquè no hàgiu de passar pel procés d'un en un.
Per extreure una frase específica o una part de text (com ara una taula de dades) del PDF, només cal que trieu l'àrea i feu clic amb el botó dret per exportar-la.
Alternativament, podeu utilitzar Element PDF si Adobe Acrobat no és el vostre.
- Utilitzeu un convertidor de PDF en línia
Si no voleu instal·lar cap programari al vostre ordinador, hi ha una sèrie de convertidors de PDF en línia que us poden ajudar a extreure text d'un fitxer PDF. Cerqueu-ne un que admeti el format en què voleu exportar-lo i pengeu el vostre PDF.
Tot i que alguns d'aquests serveis són gratuïts, la majoria tenen algun tipus de limitació, com ara un límit de mida del fitxer, un límit de pàgina o una marca d'aigua al document de sortida.
- Utilitzeu Google Docs
Google Docs també es pot utilitzar per extreure text d'un PDF. Només cal que carregueu el fitxer PDF al vostre Google Drive i, a continuació, obriu-lo amb Google Docs per dur a terme aquesta tasca.
Un cop obert el PDF, aneu a "Fitxer" > "Descarrega" i trieu un dels formats de destinació. El fitxer es baixarà al vostre ordinador, on podreu editar-lo al vostre gust.
Com puc extreure text d'un PDF escanejat?
Si esteu intentant extreure text d'un PDF escanejat, serà més difícil perquè el fitxer PDF és essencialment una imatge del text. En aquest cas, haureu d'utilitzar l'eina de reconeixement òptic de caràcters (OCR) per extreure el text.
Un potent programa OCR és Icecream PDF Converter . Pot convertir els PDF escanejats en fitxers de text editables amb només uns quants clics.
Així és com funciona:
- Instal·leu i obriu Icecream PDF Converter al vostre ordinador Windows (per a Mac, utilitzeu El mateix PDF Converter OCR ).
- Feu clic a "Des de PDF" i seleccioneu el PDF escanejat que voleu convertir.
- Trieu un format de sortida per al fitxer nou i feu clic a "Convertir".
Un cop finalitzada la conversió, el fitxer es desarà al vostre ordinador.
Icecream PDF Converter admet més de 12 idiomes OCR i pot convertir PDF a DOC, DOCX, HTML, ODT, RTF, TXT, etc.
El Google Docs que hem esmentat anteriorment també té una funció OCR que es pot utilitzar per convertir PDF escanejats en documents de text editables. Tot i que no és tan complet com Icecream PDF Converter o Cisdem PDF Converter OCR, encara pot fer la feina en la majoria dels casos.
Com extreure text d'un PDF protegit?
Alguns fitxers PDF estan bloquejats amb una contrasenya d'edició o tenen altres mesures de seguretat que us impedeixen extreure text. Si necessiteu extreure text d'un PDF protegit, haureu d'utilitzar un programa de desbloqueig de PDF com ara Passper per a PDF .
Passper per a PDF és un programa potent que pot eliminar contrasenyes d'edició i altres restriccions de seguretat dels fitxers PDF, com ara restriccions d'impressió, restriccions de còpia i molt més. El procés de conversió és senzill i ràpid, de manera que no cal ser un expert en ordinador per fer-ho.
Només cal que baixeu i instal·leu el programari al vostre PC i, a continuació, obriu el fitxer PDF segur a Passper per a PDF.
Feu clic al botó "Elimina les restriccions" i el programa començarà a eliminar la protecció del fitxer PDF. Un cop fet, podreu obrir el fitxer PDF a Edge, PDFelement, Google Docs o qualsevol altre programa de visualització de PDF i extreure el text.
L'extracció de text d'un fitxer PDF no ha de ser un procés difícil. Amb les eines adequades, podeu extreure fàcilment text fins i tot dels fitxers PDF més protegits.