Hvad er talegenkendelse? definition og betydning

click fraud protection

Talegenkendelse er afkodning af menneskelig tale til transskriberet tekst gennem et computerprogram. For at genkende talte ord skal programmet transskribere det indkommende lydsignal til en digitaliseret repræsentation, som så skal sammenlignes med en enorm database af digitaliserede repræsentationer af talte ord. For at transskribere tale med enhver acceptabel grad af nøjagtighed, skal brugerne tale hvert ord uafhængigt med en pause mellem hvert ord, og dette forsinker væsentligt hastigheden af ​​talegenkendelsessystemer og sætter spørgsmålstegn ved deres nytte, med undtagelse i tilfælde af fysiske handicap, som ville forhindre input fra andre midler. Se diskret talegenkendelse.

Technipages forklarer talegenkendelse

Talegenkendelse er en foruddefineret softwares evne til at lytte til en stemmekommando, fortolke den og give et svar. Svarene kan variere fra, at din computer giver dig resultater fra en søgning, du lige har bestilt, eller endda får et svar tilbage fra telefonassistenter. Før nogen form for computer kan få adgang til denne teknologi, skal den have en lydindgang som en mikrofon for at kunne give kommandoer til systemet.


Udviklingen af ​​denne teknologi startede i 1950'erne, hvor den første var i 1952, udvikleren var Bell Laboratories, og de udviklede Audrey, som genkender kun cifre, der læses af en sål stemme. IBM introducerede Shoebox i 1962, som kunne svare på omkring 16 ord på det engelske sprog. Alexander Waibel udviklede harpy, og den kunne forstå mere end tusind ord. Teknologien udnytter Hidden Markov-modellerne, fordi de kan trænes automatisk, også beregningsegnet til at blive brugt.
Google og Apple er to virksomheder, der har brugt teknologien til talegenkendelse og Apples indtræden i talegenkendelsesindustrien fik offentlig opmærksomhed på grund af dens kunstige intelligens opbakning. Smartphones var basen for digitale assistenter.

Almindelig brug af talegenkendelse

  • Tale genkendelse teknologi kan udnyttes af både den militære og medicinske sektor i et land
  • Tale genkendelse er en stadigt voksende niche, da den implementeres af Google og Apple for at drive kunderne til deres forskellige mål
  • Den skjulte Markov-model er den underliggende teknologi til tale genkendelse da dens beregning er egnet til at blive brugt

Almindelig misbrug af talegenkendelse

  • Computersystemer, der ønsker at udnytte tale genkendelse funktionssoftware behøver ikke nødvendigvis at have en mikrofon