การรู้จำอักขระด้วยแสงคืออะไร?

click fraud protection

แม้ว่าการหยิบเอกสารบนคอมพิวเตอร์ของคุณและรับสำเนาจริงด้วยเครื่องพิมพ์จะเป็นเรื่องง่าย แต่โดยทั่วไปแล้ว การทำอย่างอื่นทำได้ยากกว่า แม้ว่าจะมีเครื่องสแกนอยู่และสามารถบันทึกเอกสารที่สแกนเป็นรูปภาพได้ แต่สิ่งนี้ไม่มีประโยชน์อย่างยิ่งหากคุณต้องการแก้ไขเอกสาร หากต้องการแก้ไขเอกสาร คุณต้องใช้เทคโนโลยีที่เรียกว่า Optical Character Recognition หรือ OCR

การรู้จำอักขระด้วยแสงทำงานอย่างไร

OCR ใช้เทคนิคต่างๆ เพื่ออ่านเอกสารอย่างถูกต้อง ซอฟต์แวร์ OCR จะปรับเอกสาร และอาจรวมถึงคำแต่ละคำเพื่อให้มีการจัดตำแหน่งอย่างถูกต้อง รูปภาพจะถูกแปลงเป็นรูปแบบขาวดำอย่างแท้จริง เนื่องจากง่ายกว่าการแยกเฉดสีเทา การวิเคราะห์ยังดำเนินการเพื่อระบุและลบรายการที่ไม่ใช่ข้อความ

ใช้อัลกอริธึม OCR สองประเภทหลัก การจับคู่เมทริกซ์และการแยกคุณลักษณะ การจับคู่เมทริกซ์ใช้รูปภาพของอักขระตัวเดียว จากนั้นเปรียบเทียบกับอัลกอริทึมที่กำหนดค่าฟอนต์แบบพิกเซลต่อพิกเซล เทคนิคนี้กำหนดให้อักขระต้องแยกจากเนื้อหาอื่นๆ ทั้งหมดอย่างถูกต้อง และต้องรวมแบบอักษรไว้ในซอฟต์แวร์ OCR OCR ประเภทนี้ใช้ไม่ได้ในการจดจำลายมือ

อัลกอริธึมการแยกคุณลักษณะจะแบ่งอักขระแต่ละตัวออกเป็นคุณลักษณะต่างๆ เช่น เส้น เส้นโค้ง และจุดตัดของเส้น เทคนิคนี้ช่วยลดการพึ่งพาอัลกอริธึมที่ได้รับการฝึกด้วยฟอนต์ที่รู้จักได้อย่างมาก การแยกคุณลักษณะสามารถจดจำฟอนต์ใหม่และถอดเสียงได้ เช่นเดียวกับการเขียนด้วยลายมือ แม้ว่าความแม่นยำจะไม่ดีเท่ากับฟอนต์ที่รู้จัก

ซอฟต์แวร์ขั้นสูงบางตัวใช้บริบทของตัวอักษรโดยรอบเพื่อช่วยระบุตัวอักษรที่ไม่ชัดเจน ตัวอย่างเช่น หากพิมพ์คำว่า "dog" และอัลกอริทึม OCR ไม่สามารถบอกได้ว่า "o" เป็น “a” หรือ “o” สามารถใช้พจนานุกรมเพื่อดูว่าการรวมกันของอักขระที่เป็นไปได้ทำให้เป็นที่รู้จักหรือไม่ คำ. ในกรณีนี้ อัลกอริธึม OCR จะลดความเป็นไปได้ของ "a" เนื่องจาก "dag" ไม่ใช่คำ ในขณะที่ "dog" เป็น

OCR ใช้ที่ไหน?

การใช้งานหลักอย่างหนึ่งของ OCR คือระบบไปรษณีย์ OCR ใช้เพื่อระบุที่อยู่ของจดหมายและพัสดุโดยอัตโนมัติ ซึ่งเป็นงานที่สามารถทำได้เร็วกว่าที่ผู้คนสามารถทำได้อย่างมาก ในกรณีที่ระบบ OCR ไม่สามารถอ่านที่อยู่ของฉลากได้ จะถูกแยกออกเพื่อให้มนุษย์ดำเนินการด้วยตนเองแทน

OCR มีประโยชน์ในฐานะเครื่องมือช่วยการเข้าถึงสำหรับผู้ที่มีความบกพร่องทางสายตาเมื่อใช้ร่วมกับเครื่องมือแปลงข้อความเป็นคำพูด Google แปลภาษายังใช้ OCR เป็นส่วนหนึ่งของกระบวนการแปลข้อความในรูปภาพ