რა არის ოპტიკური სიმბოლოების ამოცნობა?

მიუხედავად იმისა, რომ ადვილია დოკუმენტის თქვენს კომპიუტერში აღება და ფიზიკური ასლის მიღება პრინტერით, ზოგადად უფრო რთულია სხვა გზით წასვლა. მიუხედავად იმისა, რომ სკანერები არსებობს და შეუძლიათ სკანირებული დოკუმენტების სურათის სახით შენახვა, ეს არ არის განსაკუთრებით გამოსადეგი, თუ გსურთ დოკუმენტის რედაქტირება. იმისათვის, რომ შეძლოთ დოკუმენტის რედაქტირება, გსურთ გამოიყენოთ ტექნოლოგია, სახელწოდებით Optical Character Recognition ან OCR.

როგორ მუშაობს პერსონაჟების ოპტიკური ამოცნობა?

OCR იყენებს უამრავ ტექნიკას დოკუმენტების ზუსტად წასაკითხად. OCR პროგრამული უზრუნველყოფა არეგულირებს დოკუმენტს და პოტენციურად ცალკეულ სიტყვებს ისე, რომ ისინი სწორად იყოს გასწორებული. სურათი გარდაიქმნება სუფთა შავ-თეთრ ფორმატში, რადგან ეს უფრო ადვილია, ვიდრე ნაცრისფერი ჩრდილების დიფერენცირება. ანალიზი ასევე ტარდება ნებისმიერი არატექსტური ელემენტის იდენტიფიცირებისა და ამოღების მიზნით.

გამოიყენება OCR ალგორითმის ორი ძირითადი ტიპი, მატრიცის შესატყვისი და ფუნქციების ამოღება. მატრიცის შესატყვისი იღებს ერთი სიმბოლოს გამოსახულებას, შემდეგ ადარებს მას პიქსელ-პიქსელის საფუძველზე კონფიგურირებულ შრიფტებთან ალგორითმებთან. ეს ტექნიკა მოითხოვს სიმბოლოს სწორად იზოლირებას ყველა სხვა შინაარსისგან და შრიფტის ჩართვას OCR პროგრამულ უზრუნველყოფაში. ამ ტიპის OCR ასევე არ მუშაობს ხელნაწერის ამოცნობისთვის.

ფუნქციების ამოღების ალგორითმები თითოეულ სიმბოლოს ყოფს მახასიათებლებად, როგორიცაა ხაზები, მრუდები და ხაზების კვეთა. ეს ტექნიკა მნიშვნელოვნად ამცირებს ალგორითმზე დამოკიდებულებას ცნობილი შრიფტების გამოყენებით. ფუნქციების ამოღებას შეუძლია ახალი შრიფტების ამოცნობა და მათი ტრანსკრიფცია, ასევე ზოგიერთი ხელწერა, თუმცა სიზუსტე არ არის ისეთი კარგი, როგორც ცნობილი შრიფტებისთვის.

ზოგიერთი უფრო მოწინავე პროგრამული უზრუნველყოფა იყენებს მიმდებარე ასოების კონტექსტს, რათა დაეხმაროს ასოების იდენტიფიცირებას, რომლებიც არც ისე მკაფიოა. მაგალითად, თუ სიტყვა "ძაღლი" იბეჭდება და OCR ალგორითმი ზუსტად ვერ გეტყვით, არის თუ არა "o" "a" ან "o", მას შეუძლია გამოიყენოს ლექსიკონი, რათა ნახოს პოტენციური სიმბოლოების რომელიმე კომბინაცია ცნობს თუ არა სიტყვა. ამ შემთხვევაში, OCR ალგორითმი ამცირებს "a"-ს შესაძლებლობას, რადგან "dag" არ არის სიტყვა, ხოლო "ძაღლი" არის.

სად გამოიყენება OCR?

OCR-ის ერთ-ერთი მთავარი გამოყენება არის საფოსტო სისტემაში. OCR გამოიყენება წერილებისა და ამანათების მისამართის ავტომატურად იდენტიფიცირებისთვის, დავალება, რომელსაც შეუძლია ბევრად უფრო სწრაფად, ვიდრე ადამიანებს შეეძლოთ. იმ შემთხვევებში, როდესაც OCR სისტემა ვერ კითხულობს ეტიკეტის მისამართს, ის გამოიყოფა ადამიანის მიერ ხელით დასამუშავებლად.

OCR სასარგებლოა, როგორც ხელმისაწვდომობის ინსტრუმენტი მხედველობის დაქვეითების მქონე ადამიანებისთვის, როდესაც კომბინირებულია ტექსტიდან მეტყველების ინსტრუმენტთან. Google translate ასევე ახორციელებს OCR-ს, როგორც სურათებში ტექსტის თარგმნის პროცესის ნაწილი.