Dokumentum

Szöveg PDF-fájlból való kinyerésének módszerei

Előfordulhat, hogy szöveget kell kivonnia egy PDF-fájlból. Lehet, hogy ki szeretné másolni és beilleszteni egy szövegszerkesztő dokumentumba, vagy esetleg archiválni szeretné a szöveget későbbi felhasználás céljából.

Ez azonban néha frusztráló folyamat lehet. A legtöbb PDF-fájlt képernyőn való megtekintésre vagy kinyomtatásra szánták. Ha csak a kívánt szöveget próbálja kijelölni, akkor gyakran túl sokat vagy túl keveset választ ki. És ha a szöveget más űrlapként szeretné menteni, nem teheti meg közvetlenül a PDF-megtekintőből, például az Edge-ből.

Szerencsére van néhány módszer, amellyel szöveget nyerhet ki egy PDF-fájlból, és ezzel sokkal könnyebbé teheti a folyamatot.

Hogyan lehet szöveget kivonni a PDF-ből?

  1. Használja az Adobe Acrobat Pro programot

Az Adobe Acrobat Pro, egy fizetős program, az egyik legnépszerűbb elérhető PDF-olvasó, és néhány hatékony szövegkivonási funkcióval is rendelkezik. Csak nyissa meg a PDF-fájlt az Adobe Acrobatban, és lépjen az „Eszközök” > „PDF exportálása” menüpontra. Számos formátum közül választhat a PDF exportálásához, például Word, Rich Text, Excel, PowerPoint és Image.

Több PDF-fájlt is hozzáadhat, és egyszerre exportálhatja őket, így nem kell egyenként végigmennie a folyamaton.

Ha egy adott kifejezést vagy szövegrészletet (például adattáblázatot) szeretne kivonni a PDF-ből, egyszerűen válassza ki a területet, majd kattintson a jobb gombbal az exportáláshoz.

Alternatív megoldásként használhatja PDFelement ha nem az Adobe Acrobat a te dolgod.

  1. Használjon online PDF konvertert

Ha nem szeretne szoftvert telepíteni a számítógépére, számos online PDF-átalakító létezik, amelyek segítségével szöveget vonhat ki egy PDF-fájlból. Keressen olyat, amely támogatja az exportálni kívánt formátumot, és töltse fel a PDF-fájlt.

Bár ezeknek a szolgáltatásoknak egy része ingyenesen használható, legtöbbjüknek van valamilyen korlátozása, például fájlméret-korlátozás, oldalkorlát vagy vízjel a kimeneti dokumentumon.

  1. Használja a Google Dokumentumokat

A Google Dokumentumok segítségével szöveget is ki lehet bontani PDF-ből. Egyszerűen töltse fel a PDF-fájlt a Google Drive-ra, majd nyissa meg a Google Dokumentumokkal a feladat végrehajtásához.

A PDF megnyitása után lépjen a „Fájl” > „Letöltés” ​​menüpontra, és válasszon egyet a célformátumok közül. A fájl letöltődik a számítógépére, ahol aztán kedvére szerkesztheti.

Hogyan tudok szöveget kivonni egy beszkennelt PDF-ből?

Ha szöveget próbál kivonni egy beolvasott PDF-ből, akkor ez nehezebb lesz, mivel a PDF-fájl lényegében a szöveg képe. Ebben az esetben az optikai karakterfelismerő (OCR) eszközt kell használnia a szöveg kibontásához.

Az egyik hatékony OCR program Icecream PDF Converter . A beolvasott PDF-eket néhány kattintással szerkeszthető szövegfájlokká alakíthatja.

Az Icecream PDF Converter használatával szöveget vonhat ki az Image PDF-ből

Így működik:

  1. Telepítse és nyissa meg az Icecream PDF Converter programot Windows számítógépén (Mac esetén használja Ugyanaz a PDF Converter OCR ).
  2. Kattintson a „PDF-ből” elemre, és válassza ki a konvertálni kívánt beolvasott PDF-et.
  3. Válassza ki az új fájl kimeneti formátumát, majd kattintson a „Konvertálás” gombra.

Az átalakítás befejezése után a fájl mentésre kerül a számítógépére.

Az Icecream PDF Converter több mint 12 OCR-nyelvet támogat, és a PDF-eket DOC, DOCX, HTML, ODT, RTF, TXT stb.

A korábban említett Google Dokumentumok is rendelkezik egy OCR funkcióval, amellyel a beolvasott PDF-ek szerkeszthető szöveges dokumentumokká alakíthatók. Bár nem olyan átfogó, mint az Icecream PDF Converter vagy a Cisdem PDF Converter OCR, a legtöbb esetben még mindig el tudja végezni a munkát.

Hogyan lehet szöveget kivonni a védett PDF-ből?

Egyes PDF-fájlok szerkesztési jelszóval vannak zárva, vagy más biztonsági intézkedések vannak bevezetve, amelyek megakadályozzák a szöveg kibontását. Ha szöveget kell kivonnia egy védett PDF-ből, akkor olyan PDF-feloldó programot kell használnia, mint pl Passper PDF-hez .

A Passper for PDF egy hatékony program, amely eltávolítja a szerkesztési jelszavakat és egyéb biztonsági korlátozásokat a PDF-fájlokból, például nyomtatási korlátozásokat, másolási korlátozásokat és egyebeket. Az átalakítási folyamat egyszerű és gyors, így nem kell számítógépes varázslónak lennie.

Egyszerűen töltse le és telepítse a szoftvert számítógépére, majd nyissa meg a biztonságos PDF-fájlt a Passper for PDF-ben.

Távolítsa el a PDF korlátozásokat a Passper for PDF segítségével

Kattintson a „Korlátozások eltávolítása” gombra, és a program elkezdi eltávolítani a PDF-fájl védelmét. Ha ez megtörtént, megnyithatja a PDF-fájlt az Edge-ben, a PDFelement-ben, a Google Docs-ban vagy bármely más PDF-megtekintő programban, és kibonthatja a szöveget.

A védett PDF védtelenné válik, így szabadon kivonhat szöveget a PDF-ből

A szöveg PDF-fájlból való kinyerése nem feltétlenül bonyolult folyamat. A megfelelő eszközökkel könnyedén kinyerhet szöveget még a legvédettebb PDF-fájlokból is.

Fénykép Susannáról

Susanna

Susanna a Fileelem tartalommenedzsere és írója. Évek óta tapasztalt szerkesztő és könyvtervező, akit érdekelt a különböző termelékenységi szoftverek kipróbálása és tesztelése. Ő is nagy Kindle rajongó, aki közel 7 éve használja a Kindle Touch-ot, és szinte bárhová magával viszi a Kindle-t. Nem sokkal ezelőtt az eszköz élettartama végén járt, így Susanna boldogan vett egy Kindle Oasist.

Kapcsolódó cikkek

Vissza a tetejére gomb