طرق استخراج النص من ملف PDF
قد يأتي وقت تحتاج فيه إلى استخراج نص من ملف PDF. ربما تريد نسخه ولصقه في مستند معالجة النصوص، أو ربما تريد أرشفة النص للرجوع إليه في المستقبل.
ومع ذلك، قد تكون هذه العملية محبطة في بعض الأحيان. فمعظم ملفات PDF مصممة للعرض على الشاشة أو طباعتها كما هي. ومحاولة تحديد النص الذي تريده فقط تؤدي غالبًا إلى تحديد قدر كبير جدًا أو قليل جدًا. وإذا كنت تريد حفظ النص بصيغة مختلفة، فلن تتمكن من القيام بذلك مباشرةً من عارض PDF مثل Edge.
لحسن الحظ، هناك بعض الطرق التي يمكنك استخدامها لاستخراج النص من ملف PDF وجعل العملية أسهل بكثير.
كيفية استخراج النص من PDF؟
- استخدم Adobe Acrobat Pro
Adobe Acrobat Pro، وهو برنامج مدفوع، هو أحد أكثر برامج قراءة ملفات PDF شيوعًا، كما أنه يحتوي على بعض ميزات استخراج النصوص القوية. ما عليك سوى فتح ملف PDF في Adobe Acrobat والانتقال إلى "أدوات" > "تصدير PDF". هناك العديد من التنسيقات التي يمكنك اختيارها لتصدير ملف PDF بها، بما في ذلك Word وRich Text وExcel وPowerPoint وImage.
يمكنك أيضًا إضافة ملفات PDF متعددة وتصديرها كلها مرة واحدة حتى لا تضطر إلى تكرار العملية واحدة تلو الأخرى.
لاستخراج عبارة معينة أو جزء من النص (مثل جدول بيانات) من ملف PDF، ما عليك سوى اختيار المنطقة ثم النقر بزر الماوس الأيمن لتصديرها.
بدلا من ذلك، يمكنك الاستفادة برنامج PDFelement إذا لم يكن Adobe Acrobat هو الشيء المفضل لديك.
- استخدم محول PDF عبر الإنترنت
إذا كنت لا ترغب في تثبيت أي برنامج على جهاز الكمبيوتر الخاص بك، فهناك عدد من محولات PDF عبر الإنترنت التي يمكنها مساعدتك في استخراج النص من ملف PDF. ابحث عن محول يدعم التنسيق الذي تريد تصديره به وقم بتحميل ملف PDF الخاص بك.
على الرغم من أن بعض هذه الخدمات مجانية الاستخدام، إلا أن معظمها لديه نوع من القيود مثل حد حجم الملف، أو حد الصفحة، أو علامة مائية على المستند الناتج.
- استخدم مستندات Google
يمكن أيضًا استخدام Google Docs لاستخراج نص من ملف PDF. ما عليك سوى تحميل ملف PDF إلى Google Drive ثم فتحه باستخدام Google Docs لإنجاز هذه المهمة.
بمجرد فتح ملف PDF، انتقل إلى "ملف" > "تنزيل"، واختر أحد التنسيقات المستهدفة. سيتم تنزيل الملف على جهاز الكمبيوتر الخاص بك، حيث يمكنك بعد ذلك تحريره حسب رغبتك.
كيف يمكنني استخراج النص من ملف PDF الممسوح ضوئيًا؟
إذا كنت تحاول استخراج نص من ملف PDF ممسوح ضوئيًا، فسيكون الأمر أكثر صعوبة لأن ملف PDF هو في الأساس صورة للنص. في هذه الحالة، ستحتاج إلى استخدام أداة التعرف الضوئي على الحروف (OCR) لاستخراج النص.
أحد برامج التعرف الضوئي على الحروف القوية هو محول PDF للآيس كريم يمكنه تحويل ملفات PDF الممسوحة ضوئيًا إلى ملفات نصية قابلة للتحرير ببضع نقرات فقط.
وهنا كيف يعمل الأمر:
- قم بتثبيت وفتح Icecream PDF Converter على جهاز الكمبيوتر الخاص بك الذي يعمل بنظام Windows (بالنسبة لجهاز Mac، استخدم نفس محول PDF OCR ).
- انقر فوق "من PDF" وحدد ملف PDF الممسوح ضوئيًا الذي تريد تحويله.
- اختر تنسيق الإخراج للملف الجديد وانقر على "تحويل".
بمجرد اكتمال التحويل، سيتم حفظ الملف على جهاز الكمبيوتر الخاص بك.
يدعم Icecream PDF Converter أكثر من 12 لغة OCR ويمكنه تحويل ملفات PDF إلى DOC وDOCX وHTML وODT وRTF وTXT وما إلى ذلك.
يحتوي Google Docs الذي ذكرناه سابقًا أيضًا على ميزة OCR التي يمكن استخدامها لتحويل ملفات PDF الممسوحة ضوئيًا إلى مستندات نصية قابلة للتحرير. على الرغم من أنها ليست شاملة مثل Icecream PDF Converter أو Cisdem PDF Converter OCR، إلا أنها لا تزال قادرة على إنجاز المهمة في معظم الحالات.
كيفية استخراج النص من ملف PDF المحمي؟
يتم قفل بعض ملفات PDF بكلمة مرور للتحرير أو يتم تطبيق تدابير أمان أخرى تمنعك من استخراج النص. إذا كنت بحاجة إلى استخراج نص من ملف PDF محمي، فستحتاج إلى استخدام برنامج إلغاء قفل PDF مثل جواز السفر لـ PDF .
Passper for PDF هو برنامج قوي يمكنه إزالة كلمات مرور التحرير والقيود الأمنية الأخرى من ملفات PDF، مثل قيود الطباعة وقيود النسخ والمزيد. عملية التحويل بسيطة وسريعة، لذا لا تحتاج إلى أن تكون خبيرًا في الكمبيوتر للقيام بذلك.
كل ما عليك فعله هو تنزيل البرنامج وتثبيته على جهاز الكمبيوتر الخاص بك، ثم افتح ملف PDF الآمن في Passper for PDF.
انقر على زر "إزالة القيود" وسيبدأ البرنامج في إزالة الحماية من ملف PDF. بمجرد الانتهاء من ذلك، ستتمكن من فتح ملف PDF في Edge أو PDFelement أو Google Docs أو أي برنامج آخر لعرض ملفات PDF واستخراج النص.
لا ينبغي أن يكون استخراج النص من ملف PDF عملية صعبة. باستخدام الأدوات المناسبة، يمكنك استخراج النص بسهولة حتى من أكثر ملفات PDF حماية.