Mikä on optinen merkin tunnistus?

Vaikka asiakirjan ottaminen tietokoneeseen ja fyysisen kopion hankkiminen tulostimella on helppoa, on yleensä vaikeampaa siirtyä toiseen suuntaan. Vaikka skannereita on olemassa ja ne voivat tallentaa skannatut asiakirjat kuvana, tämä ei ole erityisen hyödyllinen, jos haluat muokata asiakirjaa. Jotta voit muokata asiakirjaa, haluat käyttää optista merkintunnistusta tai OCR-tekniikkaa.

Miten optinen merkintunnistus toimii?

OCR käyttää useita tekniikoita asiakirjojen tarkan lukemiseen. OCR-ohjelmisto säätää asiakirjaa ja mahdollisesti jopa yksittäisiä sanoja niin, että ne on kohdistettu oikein. Kuva muunnetaan puhtaaksi mustavalkoiseksi, koska se on helpompaa kuin harmaan sävyjen erottaminen toisistaan. Analyysi suoritetaan myös muiden kuin tekstikohteiden tunnistamiseksi ja poistamiseksi.

Käytössä on kahta päätyyppiä OCR-algoritmeja, matriisinsovitus ja piirteiden poimiminen. Matriisivastaavuus ottaa kuvan yhdestä merkistä ja vertaa sitä algoritmien määrittämiin fontteihin pikseli kerrallaan. Tämä tekniikka edellyttää, että merkki on eristetty oikein kaikesta muusta sisällöstä ja että fontti sisällytetään OCR-ohjelmistoon. Tämän tyyppinen OCR ei myöskään toimi käsinkirjoituksen tunnistamiseen.

Ominaisuuden poiminta-algoritmit jakavat jokaisen merkin ominaisuuksiin, kuten viivoihin, käyriin ja viivojen leikkauspisteisiin. Tämä tekniikka vähentää merkittävästi riippuvuutta tunnetuilla fonteilla opetettavasta algoritmista. Ominaisuuksien poimiminen pystyy tunnistamaan uudet kirjasimet ja litteroimaan ne sekä jonkin verran käsialaa, vaikka tarkkuus ei ole yhtä hyvä kuin tunnetuilla kirjasimilla.

Jotkut edistyneemmät ohjelmistot käyttävät ympäröivien kirjainten kontekstia auttaakseen tunnistamaan kirjaimet, jotka eivät ole yhtä selkeitä. Jos esimerkiksi sana "koira" on painettu eikä OCR-algoritmi voi tietää varmasti, onko "o" "a" tai "o", se voi käyttää sanakirjaa nähdäkseen, tekeekö jokin mahdollisten merkkien yhdistelmä tunnetuksi sana. Tässä tapauksessa OCR-algoritmi sulkee pois "a":n mahdollisuuden, koska "dag" ei ole sana, kun taas "koira" on.

Missä OCR: ää käytetään?

Yksi OCR: n tärkeimmistä käyttötavoista on postijärjestelmä. Tekstintunnistusta käytetään automaattisesti identifioimaan kirjeiden ja pakettien osoitteet, mikä se voi tehdä huomattavasti nopeammin kuin ihmiset. Jos OCR-järjestelmä ei pysty lukemaan tarran osoitetta, se erotetaan, jotta ihminen voi käsitellä sen manuaalisesti.

Tekstintunnistus on hyödyllinen esteettömyystyökaluna näkövammaisille, kun se yhdistetään tekstistä puheeksi -työkaluun. Google-kääntäjä toteuttaa myös OCR: n osana kuvien tekstin käännösprosessia.