Παρόλο που είναι εύκολο να πάρετε ένα έγγραφο στον υπολογιστή σας και να λάβετε ένα φυσικό αντίγραφο με έναν εκτυπωτή, είναι γενικά πιο δύσκολο να πάτε από την άλλη. Αν και υπάρχουν σαρωτές και μπορούν να αποθηκεύσουν τα σαρωμένα έγγραφα ως εικόνα, αυτό δεν είναι ιδιαίτερα χρήσιμο εάν θέλετε να επεξεργαστείτε το έγγραφο. Για να μπορέσετε να επεξεργαστείτε ένα έγγραφο, θέλετε να χρησιμοποιήσετε μια τεχνολογία που ονομάζεται Optical Character Recognition ή OCR.
Πώς λειτουργεί η οπτική αναγνώριση χαρακτήρων;
Το OCR χρησιμοποιεί μια σειρά τεχνικών για την ακριβή ανάγνωση εγγράφων. Το λογισμικό OCR προσαρμόζει το έγγραφο, και ενδεχομένως ακόμη και μεμονωμένες λέξεις, ώστε να ευθυγραμμίζονται σωστά. Η εικόνα μετατρέπεται σε καθαρή ασπρόμαυρη μορφή, καθώς είναι ευκολότερο από τη διαφοροποίηση μεταξύ των αποχρώσεων του γκρι. Εκτελείται επίσης ανάλυση για τον εντοπισμό και την αφαίρεση τυχόν στοιχείων εκτός κειμένου.
Χρησιμοποιούνται δύο κύριοι τύποι αλγορίθμων OCR, η αντιστοίχιση μήτρας και η εξαγωγή χαρακτηριστικών. Η αντιστοίχιση μήτρας παίρνει μια εικόνα ενός μεμονωμένου χαρακτήρα και στη συνέχεια τη συγκρίνει με τις γραμματοσειρές που έχουν διαμορφωθεί από αλγόριθμους ανά εικονοστοιχείο. Αυτή η τεχνική απαιτεί ο χαρακτήρας να απομονωθεί σωστά από όλο το άλλο περιεχόμενο και να συμπεριληφθεί η γραμματοσειρά στο λογισμικό OCR. Αυτός ο τύπος OCR δεν λειτουργεί επίσης για την αναγνώριση χειρογράφου.
Οι αλγόριθμοι εξαγωγής χαρακτηριστικών αναλύουν κάθε χαρακτήρα σε χαρακτηριστικά, όπως γραμμές, καμπύλες και τομές γραμμών. Αυτή η τεχνική μειώνει σημαντικά την εξάρτηση από τον αλγόριθμο που εκπαιδεύεται με γνωστές γραμματοσειρές. Η εξαγωγή χαρακτηριστικών είναι ικανή να αναγνωρίζει νέες γραμματοσειρές και να τις μεταγράφει, καθώς και κάποιο χειρόγραφο, αν και η ακρίβεια δεν είναι τόσο καλή όσο για τις γνωστές γραμματοσειρές.
Κάποιο πιο προηγμένο λογισμικό χρησιμοποιεί το περιβάλλον των γύρω γραμμάτων για να βοηθήσει στον εντοπισμό γραμμάτων που δεν είναι τόσο καθαρά. Για παράδειγμα, εάν η λέξη "dog" είναι τυπωμένη και ο αλγόριθμος OCR δεν μπορεί να πει με βεβαιότητα εάν το "o" είναι "a" ή ένα "o", μπορεί να χρησιμοποιήσει ένα λεξικό για να δει αν κάποιος συνδυασμός πιθανών χαρακτήρων κάνει γνωστό λέξη. Σε αυτήν την περίπτωση, ο αλγόριθμος OCR θα απέκλειε την πιθανότητα του "a", καθώς το "dag" δεν είναι λέξη, ενώ το "σκύλος" είναι.
Πού χρησιμοποιείται το OCR;
Μία από τις κύριες χρήσεις του OCR είναι στο ταχυδρομικό σύστημα. Το OCR χρησιμοποιείται για την αυτόματη αναγνώριση της διεύθυνσης επιστολών και δεμάτων, μια εργασία που μπορεί να κάνει πολύ πιο γρήγορα από ό, τι οι άνθρωποι. Σε περιπτώσεις όπου το σύστημα OCR δεν μπορεί να διαβάσει τη διεύθυνση της ετικέτας, θα διαχωριστεί για να την επεξεργαστεί ο άνθρωπος με μη αυτόματο τρόπο.
Το OCR είναι χρήσιμο ως εργαλείο προσβασιμότητας για άτομα με προβλήματα όρασης όταν συνδυάζεται με ένα εργαλείο μετατροπής κειμένου σε ομιλία. Το Google translate εφαρμόζει επίσης το OCR ως μέρος της διαδικασίας μετάφρασης του κειμένου σε εικόνες.