Шта је препознавање говора? дефиниција и значење

click fraud protection

Препознавање говора је декодирање људског говора у транскрибовани текст путем компјутерског програма. Да би препознао изговорене речи, програм мора да транскрибује долазни звучни сигнал у дигитализовани репрезентација, која се затим мора упоредити са огромном базом података дигитализованих репрезентација изговорене речи. Да би транскрибовали говор са било којим подношљивим степеном тачности, корисници морају да говоре сваку реч независно, са паузом између сваке речи и то значајно успорава брзину система за препознавање говора и доводи у питање њихову корисност, са изузетком у случају физичког инвалидитета који би спречио унос од стране других значи. Погледајте препознавање дискретног говора.

Тецхнипагес објашњава препознавање говора

Препознавање говора је способност унапред дефинисаног софтвера да слуша гласовну команду, протумачи је и даје одговор. Одговори могу да се крећу од тога да вам рачунар даје резултате претраге коју сте управо наручили, или чак да добијете одговор од телефонских помоћника. Пре него што било који тип рачунара може да приступи овој технологији, мора имати звучни улаз попут микрофона да би могао да даје команде систему.


Развој ове технологије започео је 1950-их година, а прва је била 1952. године, програмер је био Белл Лабораториес, и развили су Аудреи, која препознаје само цифре које чита табан глас. ИБМ је представио Схоебок 1962. године, који је могао да одговори на око 16 речи на енглеском језику. Александар Вајбел је развио харпију и могла је да разуме преко хиљаду речи. Технологија користи Хидден Марков моделе јер се они могу аутоматски обучити, а такође и рачунарски погодни за употребу.
Гоогле и Аппле су две компаније које су користиле технологију препознавања говора и Аппле-ову улазак у индустрију препознавања говора привукао је пажњу јавности због своје вештачке интелигенције подржавање. Паметни телефони су били основа за дигиталне асистенте.

Уобичајене употребе препознавања говора

  • Препознавање говора технологију би могао да користи и војни и медицински сектор једне земље
  • Препознавање говора је ниша која стално расте јер га спроводе Гугл и Аппле како би довели клијенте до њихових различитих крајева
  • Скривени Марков модел је основна технологија за препознавање говора пошто је његов прорачун погодан за употребу

Уобичајене злоупотребе препознавања говора

  • Рачунарски системи који желе да користе препознавање говора Функционални софтвер не мора нужно да има микрофон