วิธีการแยกข้อความจากไฟล์ PDF
อาจมีบางครั้งที่คุณต้องแยกข้อความออกจากไฟล์ PDF บางทีคุณอาจต้องการคัดลอกและวางข้อความลงในเอกสารประมวลผลคำ หรือบางทีคุณอาจต้องการเก็บข้อความไว้เพื่อใช้เป็นข้อมูลอ้างอิงในอนาคต
อย่างไรก็ตาม บางครั้งอาจเป็นกระบวนการที่น่าหงุดหงิด ไฟล์ PDF ส่วนใหญ่มีไว้สำหรับดูบนหน้าจอหรือพิมพ์ออกมาตามที่เป็นอยู่ การพยายามเลือกเฉพาะข้อความที่คุณต้องการมักจะส่งผลให้เลือกมากเกินไปหรือไม่เพียงพอ และหากคุณต้องการบันทึกข้อความเป็นรูปแบบอื่น คุณไม่สามารถทำได้โดยตรงจากโปรแกรมดู PDF เช่น Edge
โชคดีที่มีวิธีการสองสามวิธีที่คุณสามารถใช้เพื่อแยกข้อความจากไฟล์ PDF และทำให้กระบวนการง่ายขึ้นมาก
จะแยกข้อความจาก PDF ได้อย่างไร?
- ใช้ Adobe Acrobat Pro
Adobe Acrobat Pro เป็นโปรแกรมที่ต้องเสียเงิน ซึ่งเป็นหนึ่งในโปรแกรมอ่าน PDF ที่ได้รับความนิยมมากที่สุด และยังมีฟีเจอร์แยกข้อความอันทรงพลังอีกด้วย เพียงเปิดไฟล์ PDF ใน Adobe Acrobat แล้วไปที่ “เครื่องมือ” > “ส่งออก PDF” คุณสามารถเลือกส่งออก PDF เป็นไฟล์รูปแบบต่างๆ ได้ เช่น Word, Rich Text, Excel, PowerPoint และ Image
คุณสามารถเพิ่มไฟล์ PDF หลายไฟล์และส่งออกทั้งหมดในครั้งเดียวได้ ดังนั้นคุณจึงไม่จำเป็นต้องดำเนินการทีละขั้นตอน
หากต้องการแยกวลีหรือข้อความเฉพาะบางส่วน (เช่น ตารางข้อมูล) จาก PDF เพียงแค่เลือกพื้นที่แล้วคลิกขวาเพื่อส่งออก
อีกวิธีหนึ่งคุณอาจใช้ องค์ประกอบ PDF หาก Adobe Acrobat ไม่ใช่สิ่งที่คุณสนใจ
- ใช้ตัวแปลง PDF ออนไลน์
หากคุณไม่ต้องการติดตั้งซอฟต์แวร์ใดๆ บนคอมพิวเตอร์ของคุณ มีโปรแกรมแปลง PDF ออนไลน์หลายโปรแกรมที่สามารถช่วยคุณแยกข้อความจากไฟล์ PDF ได้ ค้นหาโปรแกรมที่รองรับรูปแบบที่คุณต้องการส่งออก แล้วอัปโหลด PDF ของคุณ
แม้ว่าบริการบางอย่างเหล่านี้จะใช้งานได้ฟรี แต่ส่วนใหญ่มีข้อจำกัดบางประการ เช่น ข้อจำกัดขนาดไฟล์ ข้อจำกัดหน้า หรือลายน้ำบนเอกสารที่ส่งออก
- ใช้ Google Docs
Google Docs ยังใช้ในการแยกข้อความจาก PDF ได้อีกด้วย เพียงอัปโหลดไฟล์ PDF ไปยัง Google Drive จากนั้นเปิดด้วย Google Docs เพื่อดำเนินการนี้ให้สำเร็จ
เมื่อเปิดไฟล์ PDF แล้ว ให้ไปที่ “ไฟล์” > “ดาวน์โหลด” และเลือกรูปแบบที่ต้องการ ไฟล์จะถูกดาวน์โหลดไปยังคอมพิวเตอร์ของคุณ จากนั้นคุณสามารถแก้ไขไฟล์ได้ตามต้องการ
ฉันจะแยกข้อความจาก PDF ที่สแกนได้อย่างไร
หากคุณพยายามแยกข้อความจาก PDF ที่สแกนมา การดำเนินการดังกล่าวอาจทำได้ยากขึ้น เนื่องจากไฟล์ PDF เป็นเพียงรูปภาพของข้อความ ในกรณีนี้ คุณจะต้องใช้เครื่องมือ Optical Character Recognition (OCR) เพื่อแยกข้อความออกมา
โปรแกรม OCR อันทรงพลังหนึ่งตัวคือ โปรแกรมแปลงไฟล์ PDF ไอศกรีม สามารถเปลี่ยน PDF ที่สแกนเป็นไฟล์ข้อความที่แก้ไขได้เพียงไม่กี่คลิก
วิธีการทำงานมีดังนี้:
- ติดตั้งและเปิด Icecream PDF Converter บนคอมพิวเตอร์ Windows ของคุณ (สำหรับ Mac ให้ใช้ OCR แปลง PDF เดียวกัน -
- คลิก “จาก PDF” และเลือก PDF ที่สแกนที่คุณต้องการแปลง
- เลือกรูปแบบเอาท์พุตสำหรับไฟล์ใหม่และคลิก “แปลง”
เมื่อการแปลงเสร็จสิ้นไฟล์จะถูกบันทึกลงในคอมพิวเตอร์ของคุณ
Icecream PDF Converter รองรับ OCR มากกว่า 12 ภาษา และสามารถแปลง PDF เป็น DOC, DOCX, HTML, ODT, RTF, TXT และอื่นๆ ได้
Google Docs ที่เรากล่าวถึงก่อนหน้านี้ยังมีฟีเจอร์ OCR ที่ใช้แปลงไฟล์ PDF ที่สแกนเป็นเอกสารข้อความที่แก้ไขได้ แม้ว่าจะไม่ครอบคลุมเท่ากับ Icecream PDF Converter หรือ Cisdem PDF Converter OCR แต่ก็ยังสามารถทำงานได้ในกรณีส่วนใหญ่
จะแยกข้อความจาก PDF ที่ได้รับการป้องกันได้อย่างไร?
ไฟล์ PDF บางไฟล์ถูกล็อกด้วยรหัสผ่านสำหรับการแก้ไข หรือมีมาตรการรักษาความปลอดภัยอื่นๆ ที่ใช้ป้องกันไม่ให้คุณดึงข้อความออกมาได้ หากคุณต้องการดึงข้อความออกจาก PDF ที่ได้รับการป้องกัน คุณจะต้องใช้โปรแกรมปลดล็อก PDF เช่น Passper สำหรับ PDF -
Passper for PDF เป็นโปรแกรมอันทรงพลังที่สามารถลบรหัสผ่านการแก้ไขและข้อจำกัดด้านความปลอดภัยอื่นๆ จากไฟล์ PDF เช่น ข้อจำกัดในการพิมพ์ ข้อจำกัดในการคัดลอก และอื่นๆ อีกมากมาย กระบวนการแปลงไฟล์นั้นง่ายและรวดเร็ว ดังนั้นคุณไม่จำเป็นต้องเป็นผู้เชี่ยวชาญด้านคอมพิวเตอร์ก็สามารถทำได้
เพียงดาวน์โหลดและติดตั้งซอฟต์แวร์บนพีซีของคุณ จากนั้นเปิดไฟล์ PDF ที่ปลอดภัยใน Passper for PDF
คลิกปุ่ม “ลบข้อจำกัด” แล้วโปรแกรมจะเริ่มลบการป้องกันออกจากไฟล์ PDF เมื่อดำเนินการเสร็จสิ้น คุณจะสามารถเปิดไฟล์ PDF ใน Edge, PDFelement, Google Docs หรือโปรแกรมอ่าน PDF อื่นๆ และแยกข้อความออกมาได้
การแยกข้อความออกจากไฟล์ PDF ไม่จำเป็นต้องเป็นกระบวนการที่ยาก ด้วยเครื่องมือที่เหมาะสม คุณสามารถแยกข้อความจากไฟล์ PDF ที่ได้รับการป้องกันมากที่สุดได้อย่างง่ายดาย