Kaj je prepoznavanje govora? definicija in pomen

click fraud protection

Prepoznavanje govora je dekodiranje človeškega govora v prepisano besedilo s pomočjo računalniškega programa. Za prepoznavanje izgovorjenih besed mora program dohodni zvočni signal prepisati v digitaliziran predstavitev, ki jo je treba nato primerjati z ogromno bazo podatkov digitaliziranih predstavitev izgovorjene besede. Za prepis govora s poljubno sprejemljivo stopnjo natančnosti morajo uporabniki izgovoriti vsako besedo neodvisno, s premorom med vsako besedo, kar bistveno upočasni hitrost sistemov za prepoznavanje govora in postavlja pod vprašaj njihovo uporabnost, z izjemo v primeru telesnih okvar, ki bi preprečile vnos drugim pomeni. Glej prepoznavanje diskretnega govora.

Technipages pojasnjuje prepoznavanje govora

Prepoznavanje govora je zmožnost vnaprej določene programske opreme, da posluša glasovni ukaz, ga razlaga in daje odgovor. Odgovori se lahko gibljejo od vašega računalnika, ki vam daje rezultate iskanja, ki ste ga pravkar naročili, ali celo prejema odgovor telefonskih pomočnikov. Preden lahko kateri koli tip računalnika dostopa do te tehnologije, mora imeti zvočni vhod, kot je mikrofon, da lahko daje ukaze sistemu.


Razvoj te tehnologije se je začel v petdesetih letih prejšnjega stoletja, prva leta 1952, razvijalec je bil Bell Laboratories in razvili Audrey, ki prepozna samo števke, ki jih prebere podplat glas. IBM je leta 1962 predstavil Shoebox, ki je lahko odgovoril na približno 16 besed v angleškem jeziku. Alexander Waibel je razvil harpijo in je lahko razumela več kot tisoč besed. Tehnologija uporablja modele Hidden Markov, ker jih je mogoče samodejno usposobiti, tudi računalniško primerne za uporabo.
Google in Apple sta dve podjetji, ki sta uporabljali tehnologijo prepoznavanja govora in Apple-ovo Vstop v industrijo prepoznavanja govora je pritegnil pozornost javnosti zaradi svoje umetne inteligence podporo. Pametni telefoni so bili osnova za digitalne pomočnike.

Pogoste uporabe prepoznavanja govora

  • Prepoznavanje govora tehnologijo bi lahko izkoristila tako vojaški kot medicinski sektor države
  • Prepoznavanje govora je vedno naraščajoča niša, saj jo izvajata Google in Apple, da bi stranke pripeljala na različne cilje
  • Skriti Markov model je osnovna tehnologija za prepoznavanje govora saj je njegov izračun primeren za uporabo

Pogoste zlorabe prepoznavanja govora

  • Računalniške sisteme, ki želijo uporabljati prepoznavanje govora funkcijski programski opremi ni nujno, da ima mikrofon