पीडीएफ फाइल से टेक्स्ट निकालने के तरीके
कभी-कभी ऐसा समय आ सकता है जब आपको PDF फ़ाइल से टेक्स्ट निकालने की ज़रूरत हो। हो सकता है कि आप इसे कॉपी करके वर्ड प्रोसेसिंग डॉक्यूमेंट में पेस्ट करना चाहें, या हो सकता है कि आप भविष्य के संदर्भ के लिए टेक्स्ट को संग्रहित करना चाहें।
हालाँकि, यह कभी-कभी एक निराशाजनक प्रक्रिया हो सकती है। अधिकांश PDF फ़ाइलें स्क्रीन पर देखने या वैसे ही प्रिंट करने के लिए होती हैं। सिर्फ़ वही टेक्स्ट चुनने की कोशिश करने से अक्सर बहुत ज़्यादा या बहुत कम टेक्स्ट चुनने का नतीजा निकलता है। और अगर आप टेक्स्ट को किसी दूसरे फ़ॉर्म में सेव करना चाहते हैं, तो आप इसे सीधे Edge जैसे PDF व्यूअर से नहीं कर सकते।
सौभाग्य से, कुछ विधियां हैं जिनका उपयोग करके आप पीडीएफ फाइल से टेक्स्ट निकाल सकते हैं और इस प्रक्रिया को बहुत आसान बना सकते हैं।
पीडीएफ से टेक्स्ट कैसे निकालें?
- एडोब एक्रोबेट प्रो का उपयोग करें
एडोब एक्रोबैट प्रो, एक सशुल्क प्रोग्राम, उपलब्ध सबसे लोकप्रिय पीडीएफ रीडर में से एक है और इसमें कुछ शक्तिशाली टेक्स्ट निष्कर्षण सुविधाएँ भी हैं। बस एडोब एक्रोबैट में पीडीएफ फाइल खोलें और “टूल्स” > “पीडीएफ निर्यात करें” पर जाएँ। पीडीएफ को निर्यात करने के लिए आप कई प्रारूप चुन सकते हैं, जिसमें वर्ड, रिच टेक्स्ट, एक्सेल, पावरपॉइंट और इमेज शामिल हैं।
आप एकाधिक पीडीएफ फाइलें भी जोड़ सकते हैं और उन्हें एक साथ निर्यात कर सकते हैं, ताकि आपको एक बार में एक प्रक्रिया से गुजरना न पड़े।
पीडीएफ से किसी विशिष्ट वाक्यांश या पाठ के भाग (जैसे डेटा तालिका) को निकालने के लिए, बस उस क्षेत्र को चुनें और फिर उसे निर्यात करने के लिए राइट-क्लिक करें।
वैकल्पिक रूप से, आप उपयोग कर सकते हैं पीडीएफएलिमेंट यदि एडोबी एक्रोबेट आपकी पसंद नहीं है।
- ऑनलाइन पीडीएफ कनवर्टर का उपयोग करें
अगर आप अपने कंप्यूटर पर कोई सॉफ़्टवेयर इंस्टॉल नहीं करना चाहते हैं, तो ऐसे कई ऑनलाइन PDF कन्वर्टर हैं जो PDF फ़ाइल से टेक्स्ट निकालने में आपकी मदद कर सकते हैं। ऐसा कन्वर्टर ढूँढें जो उस फ़ॉर्मेट को सपोर्ट करता हो जिस फ़ॉर्मेट में आप इसे एक्सपोर्ट करना चाहते हैं और अपना PDF अपलोड करें।
हालांकि इनमें से कुछ सेवाएं निःशुल्क हैं, लेकिन अधिकांश में कुछ प्रकार की सीमाएं होती हैं, जैसे फ़ाइल आकार सीमा, पृष्ठ सीमा, या आउटपुट दस्तावेज़ पर वॉटरमार्क।
- गूगल डॉक्स का उपयोग करें
Google Docs का उपयोग PDF से टेक्स्ट निकालने के लिए भी किया जा सकता है। इस कार्य को पूरा करने के लिए बस PDF फ़ाइल को अपने Google Drive पर अपलोड करें और फिर उसे Google Docs के साथ खोलें।
पीडीएफ खुलने के बाद, “फ़ाइल” > “डाउनलोड” पर जाएँ और लक्ष्य प्रारूपों में से एक चुनें। फ़ाइल आपके कंप्यूटर पर डाउनलोड हो जाएगी, जहाँ आप अपनी इच्छानुसार संपादन कर सकते हैं।
मैं स्कैन किए गए पीडीएफ से टेक्स्ट कैसे निकाल सकता हूं?
यदि आप स्कैन की गई PDF से टेक्स्ट निकालने की कोशिश कर रहे हैं, तो यह अधिक कठिन होगा क्योंकि PDF फ़ाइल मूलतः टेक्स्ट की एक छवि है। इस मामले में, आपको टेक्स्ट निकालने के लिए ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) टूल का उपयोग करना होगा।
एक शक्तिशाली ओसीआर कार्यक्रम है आइसक्रीम पीडीएफ कनवर्टर यह स्कैन की गई पीडीएफ को कुछ ही क्लिक से संपादन योग्य टेक्स्ट फाइलों में बदल सकता है।
यह ऐसे काम करता है:
- अपने विंडोज कंप्यूटर पर आइसक्रीम पीडीएफ कनवर्टर स्थापित करें और खोलें (मैक के लिए, उपयोग करें वही पीडीएफ कन्वर्टर ओसीआर ).
- “पीडीएफ से” पर क्लिक करें और उस स्कैन किए गए पीडीएफ का चयन करें जिसे आप परिवर्तित करना चाहते हैं।
- नई फ़ाइल के लिए आउटपुट प्रारूप चुनें और “कन्वर्ट” पर क्लिक करें।
एक बार रूपांतरण पूरा हो जाने पर, फ़ाइल आपके कंप्यूटर पर सहेज ली जाएगी।
आइसक्रीम पीडीएफ कनवर्टर 12 से अधिक ओसीआर भाषाओं का समर्थन करता है और पीडीएफ को DOC, DOCX, HTML, ODT, RTF, TXT आदि में परिवर्तित कर सकता है।
हमने पहले जिस Google Docs का ज़िक्र किया था, उसमें भी OCR सुविधा है जिसका इस्तेमाल स्कैन किए गए PDF को संपादन योग्य टेक्स्ट दस्तावेज़ों में बदलने के लिए किया जा सकता है। हालाँकि यह Icecream PDF Converter या Cisdem PDF Converter OCR जितना व्यापक नहीं है, फिर भी यह ज़्यादातर मामलों में काम पूरा कर सकता है।
संरक्षित पीडीएफ से टेक्स्ट कैसे निकालें?
कुछ PDF फ़ाइलें संपादन पासवर्ड से लॉक होती हैं या उनमें अन्य सुरक्षा उपाय होते हैं जो आपको टेक्स्ट निकालने से रोकते हैं। यदि आपको किसी संरक्षित PDF से टेक्स्ट निकालने की आवश्यकता है, तो आपको PDF अनलॉकिंग प्रोग्राम का उपयोग करना होगा जैसे पीडीएफ के लिए पासपर .
पासपर फॉर पीडीएफ एक शक्तिशाली प्रोग्राम है जो पीडीएफ फाइलों से संपादन पासवर्ड और अन्य सुरक्षा प्रतिबंध हटा सकता है, जैसे कि प्रिंटिंग प्रतिबंध, कॉपी करने के प्रतिबंध और बहुत कुछ। रूपांतरण प्रक्रिया सरल और त्वरित है, इसलिए आपको इसे करने के लिए कंप्यूटर विशेषज्ञ होने की आवश्यकता नहीं है।
बस अपने पीसी पर सॉफ्टवेयर डाउनलोड और इंस्टॉल करें, फिर Passper for PDF में सुरक्षित पीडीएफ फाइल खोलें।
"प्रतिबंध हटाएँ" बटन पर क्लिक करें और प्रोग्राम PDF फ़ाइल से सुरक्षा हटाना शुरू कर देगा। एक बार ऐसा हो जाने के बाद, आप Edge, PDFelement, Google Docs या किसी अन्य PDF-व्यूइंग प्रोग्राम में PDF फ़ाइल खोल पाएँगे और टेक्स्ट निकाल पाएँगे।
PDF फ़ाइल से टेक्स्ट निकालना कोई मुश्किल काम नहीं है। सही टूल के साथ, आप सबसे सुरक्षित PDF फ़ाइल से भी आसानी से टेक्स्ट निकाल सकते हैं।