Talegjenkjenning er dekoding av menneskelig tale til transkribert tekst gjennom et dataprogram. For å gjenkjenne talte ord, må programmet transkribere det innkommende lydsignalet til en digitalisert representasjon, som da må sammenlignes med en enorm database med digitaliserte representasjoner av talte ord. For å transkribere tale med en akseptabel grad av nøyaktighet, må brukere snakke hvert ord uavhengig, med en pause mellom hvert ord, og dette reduserer betydelig hastigheten til talegjenkjenningssystemer og setter spørsmålstegn ved deres nytte, med unntak av fysiske funksjonshemminger som ville forhindre innspill fra andre midler. Se diskret talegjenkjenning.
Technipages forklarer talegjenkjenning
Talegjenkjenning er evnen til en forhåndsdefinert programvare, til å lytte til en talekommando, tolke den og gi et svar. Svarene kan variere fra datamaskinen din gir deg resultater fra et søk du nettopp har bestilt, eller til og med å få tilbake et svar fra telefonassistenter. Før noen type datamaskin kan få tilgang til denne teknologien, må den ha en lydinngang som en mikrofon for å kunne gi kommandoer til systemet.
Utviklingen av denne teknologien startet på 1950-tallet, med den første i 1952, utvikleren var Bell Laboratories, og de utviklet Audrey, som gjenkjenner bare sifre som leses av en såle stemme. IBM introduserte Shoebox i 1962, som kunne svare på rundt 16 ord på engelsk. Alexander Waibel utviklet harpy, og den kunne forstå over tusen ord. Teknologien benytter Hidden Markov-modellene fordi de kan trenes automatisk, også beregningsmessig egnet til bruk.
Google og Apple er to selskaper som har brukt teknologien for talegjenkjenning og Apples inntreden i talegjenkjenningsindustrien fikk offentlig oppmerksomhet på grunn av sin kunstige intelligens støtte. Smarttelefoner var basen for digitale assistenter.
Vanlig bruk av talegjenkjenning
- Talegjenkjenning teknologi kan utnyttes av både den militære og medisinske sektoren i et land
- Talegjenkjenning er en stadig voksende nisje ettersom den implementeres av Google og Apple for å lede kunder til deres forskjellige mål
- Den skjulte Markov-modellen er den underliggende teknologien for talegjenkjenning ettersom beregningen er egnet for bruk
Vanlige misbruk av talegjenkjenning
- Datasystemer som ønsker å bruke talegjenkjenning funksjonsprogramvare trenger ikke nødvendigvis å ha en mikrofon