পিডিএফ ফাইল থেকে টেক্সট এক্সট্রাক্ট করার পদ্ধতি

এমন একটি সময় আসতে পারে যখন আপনাকে একটি PDF ফাইল থেকে পাঠ্য বের করতে হবে। হতে পারে আপনি এটিকে একটি ওয়ার্ড প্রসেসিং নথিতে কপি এবং পেস্ট করতে চান, অথবা আপনি ভবিষ্যতের রেফারেন্সের জন্য পাঠ্য সংরক্ষণাগার করতে চান।
যাইহোক, এটি কখনও কখনও একটি হতাশাজনক প্রক্রিয়া হতে পারে। বেশিরভাগ পিডিএফ ফাইল একটি স্ক্রিনে দেখা বা যেমন আছে প্রিন্ট করা হয়। আপনি যে পাঠ্যটি চান তা নির্বাচন করার চেষ্টা করার ফলে প্রায়শই খুব বেশি বা খুব কম নির্বাচন হয়। এবং আপনি যদি পাঠ্যটিকে একটি ভিন্ন ফর্ম হিসাবে সংরক্ষণ করতে চান তবে আপনি এজ এর মতো পিডিএফ ভিউয়ার থেকে সরাসরি এটি করতে পারবেন না।
সৌভাগ্যবশত, এমন কয়েকটি পদ্ধতি রয়েছে যা আপনি একটি PDF ফাইল থেকে পাঠ্য বের করতে এবং প্রক্রিয়াটিকে আরও সহজ করতে ব্যবহার করতে পারেন।
কিভাবে PDF থেকে টেক্সট এক্সট্রাক্ট করবেন?
- Adobe Acrobat Pro ব্যবহার করুন
Adobe Acrobat Pro, একটি অর্থপ্রদানের প্রোগ্রাম, উপলব্ধ সবচেয়ে জনপ্রিয় PDF পাঠকগুলির মধ্যে একটি এবং এতে কিছু শক্তিশালী পাঠ্য নিষ্কাশন বৈশিষ্ট্যও রয়েছে৷ Adobe Acrobat-এ পিডিএফ ফাইল খুলুন এবং "টুলস" > "পিডিএফ রপ্তানি করুন" এ যান। ওয়ার্ড, রিচ টেক্সট, এক্সেল, পাওয়ারপয়েন্ট এবং ইমেজ সহ পিডিএফ রপ্তানি করার জন্য আপনি বেশ কয়েকটি ফর্ম্যাট বেছে নিতে পারেন।
আপনি একাধিক পিডিএফ ফাইল যোগ করতে পারেন এবং সেগুলি একবারে রপ্তানি করতে পারেন যাতে আপনাকে একবারে একটি প্রক্রিয়ার মধ্য দিয়ে যেতে হবে না।
PDF থেকে একটি নির্দিষ্ট বাক্যাংশ বা পাঠ্যের অংশ (যেমন একটি ডেটা টেবিল) বের করতে, কেবল এলাকাটি বেছে নিন এবং তারপরে এটি রপ্তানি করতে ডান-ক্লিক করুন।
বিকল্পভাবে, আপনি ব্যবহার করতে পারেন PDF উপাদান যদি Adobe Acrobat আপনার জিনিস না হয়.
- একটি অনলাইন পিডিএফ কনভার্টার ব্যবহার করুন
আপনি যদি আপনার কম্পিউটারে কোনো সফ্টওয়্যার ইনস্টল করতে না চান, তাহলে অনেকগুলি অনলাইন PDF রূপান্তরকারী রয়েছে যা আপনাকে PDF ফাইল থেকে পাঠ্য বের করতে সাহায্য করতে পারে। আপনি যে ফর্ম্যাটটিকে রপ্তানি করতে চান তা সমর্থন করে এমন একটি খুঁজুন এবং আপনার পিডিএফ আপলোড করুন৷
যদিও এই পরিষেবাগুলির মধ্যে কিছু বিনামূল্যে ব্যবহার করা যায়, তবে তাদের বেশিরভাগেরই ফাইলের আকারের সীমা, পৃষ্ঠার সীমা বা আউটপুট নথিতে ওয়াটারমার্কের মতো কিছু ধরণের সীমাবদ্ধতা রয়েছে৷
- Google ডক্স ব্যবহার করুন
Google ডক্স পিডিএফ থেকে পাঠ্য বের করতেও ব্যবহার করা যেতে পারে। আপনার Google ড্রাইভে পিডিএফ ফাইলটি আপলোড করুন এবং তারপরে এই কাজটি সম্পন্ন করতে Google ডক্সের সাথে খুলুন।
পিডিএফ ওপেন হয়ে গেলে, “ফাইল” > “ডাউনলোড”-এ যান এবং একটি টার্গেট ফরম্যাট বেছে নিন। ফাইলটি আপনার কম্পিউটারে ডাউনলোড করা হবে, যেখানে আপনি আপনার হৃদয়ের বিষয়বস্তুতে সম্পাদনা করতে পারবেন।
কিভাবে আমি একটি স্ক্যান করা PDF থেকে পাঠ্য বের করতে পারি?
আপনি যদি একটি স্ক্যান করা পিডিএফ থেকে পাঠ্য বের করার চেষ্টা করেন তবে এটি আরও কঠিন হতে চলেছে কারণ পিডিএফ ফাইলটি মূলত পাঠ্যের একটি চিত্র। এই ক্ষেত্রে, পাঠ্যটি বের করতে আপনাকে অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) টুল ব্যবহার করতে হবে।
একটি শক্তিশালী ওসিআর প্রোগ্রাম আইসক্রিম পিডিএফ কনভার্টার . এটি মাত্র কয়েকটি ক্লিকে স্ক্যান করা পিডিএফকে সম্পাদনাযোগ্য পাঠ্য ফাইলে পরিণত করতে পারে।
এটি কিভাবে কাজ করে তা এখানে:
- আপনার উইন্ডোজ কম্পিউটারে আইসক্রিম পিডিএফ কনভার্টার ইনস্টল করুন এবং খুলুন (ম্যাকের জন্য, ব্যবহার করুন একই পিডিএফ কনভার্টার ওসিআর )
- "পিডিএফ থেকে" ক্লিক করুন এবং আপনি রূপান্তর করতে চান স্ক্যান করা PDF নির্বাচন করুন।
- নতুন ফাইলের জন্য একটি আউটপুট বিন্যাস চয়ন করুন এবং "রূপান্তর" ক্লিক করুন।
একবার রূপান্তর সম্পূর্ণ হলে, ফাইলটি আপনার কম্পিউটারে সংরক্ষণ করা হবে।
আইসক্রিম পিডিএফ কনভার্টার 12টিরও বেশি ওসিআর ভাষা সমর্থন করে এবং পিডিএফগুলিকে DOC, DOCX, HTML, ODT, RTF, TXT ইত্যাদিতে রূপান্তর করতে পারে।
আমরা আগে যে Google ডক্সের কথা উল্লেখ করেছি তাতেও একটি OCR বৈশিষ্ট্য রয়েছে যা স্ক্যান করা PDFগুলিকে সম্পাদনাযোগ্য পাঠ্য নথিতে রূপান্তর করতে ব্যবহার করা যেতে পারে। যদিও এটি আইসক্রিম পিডিএফ কনভার্টার বা সিসডেম পিডিএফ কনভার্টার ওসিআরের মতো ব্যাপক নয়, তবুও এটি বেশিরভাগ ক্ষেত্রে কাজটি সম্পন্ন করতে পারে।
কিভাবে সুরক্ষিত PDF থেকে টেক্সট এক্সট্রাক্ট করবেন?
কিছু পিডিএফ ফাইল একটি সম্পাদনা পাসওয়ার্ড দিয়ে লক করা আছে বা অন্যান্য নিরাপত্তা ব্যবস্থা রয়েছে যা আপনাকে পাঠ্য বের করতে বাধা দেয়। আপনি যদি একটি সুরক্ষিত PDF থেকে পাঠ্য বের করতে চান, তাহলে আপনাকে একটি PDF আনলকিং প্রোগ্রাম ব্যবহার করতে হবে পিডিএফের জন্য পাসপার .
পিডিএফের জন্য পাসপার হল একটি শক্তিশালী প্রোগ্রাম যা PDF ফাইলগুলি থেকে পাসওয়ার্ড সম্পাদনা এবং অন্যান্য নিরাপত্তা বিধিনিষেধ যেমন মুদ্রণ সীমাবদ্ধতা, অনুলিপি সীমাবদ্ধতা এবং আরও অনেক কিছু থেকে সরিয়ে দিতে পারে। রূপান্তর প্রক্রিয়া সহজ এবং দ্রুত, তাই এটি করার জন্য আপনাকে কম্পিউটার উইজ হতে হবে না।
সহজভাবে আপনার পিসিতে সফ্টওয়্যারটি ডাউনলোড এবং ইনস্টল করুন, তারপর পিডিএফের জন্য পাসপারে সুরক্ষিত PDF ফাইলটি খুলুন।
"নিষেধাজ্ঞাগুলি সরান" বোতামে ক্লিক করুন এবং প্রোগ্রামটি পিডিএফ ফাইল থেকে সুরক্ষা সরানো শুরু করবে। এটি হয়ে গেলে, আপনি এজ, PDFelement, Google ডক্স বা অন্য কোনো PDF-দেখার প্রোগ্রামে PDF ফাইল খুলতে এবং পাঠ্যটি বের করতে সক্ষম হবেন।
একটি PDF ফাইল থেকে পাঠ্য নিষ্কাশন একটি কঠিন প্রক্রিয়া হতে হবে না. সঠিক সরঞ্জামগুলির সাহায্যে, আপনি এমনকি সবচেয়ে সুরক্ষিত PDF ফাইলগুলি থেকে সহজেই পাঠ্য বের করতে পারেন৷