Какво е разпознаване на реч? определение и значение

Разпознаването на реч е декодирането на човешката реч в транскрибиран текст чрез компютърна програма. За да разпознае изговорени думи, програмата трябва да транскрибира входящия звуков сигнал в дигитализиран представяне, което след това трябва да се сравни с огромна база данни от дигитализирани репрезентации на изречени думи. За да транскрибират речта с каквато и да е допустима степен на точност, потребителите трябва да говорят всяка дума независимо, с пауза между всяка дума и това значително забавя скоростта на системите за разпознаване на реч и поставя под въпрос тяхната полезност, с изключение в случай на физически увреждания, които биха попречили на въвеждането от други означава. Вижте дискретно разпознаване на реч.

Technipages обяснява разпознаването на говор

Разпознаването на говор е способността на предварително дефиниран софтуер да слуша гласова команда, да я интерпретира и да дава отговор. Отговорите могат да варират от вашия компютър, който ви дава резултати от търсене, което току-що сте поръчали, или дори да получите отговор от телефонните асистенти. Преди всеки тип компютър да има достъп до тази технология, той трябва да има звуков вход като микрофон, за да може да дава команди на системата.

Разработването на тази технология започва през 50-те години на миналия век, като първата е през 1952 г., разработчикът е Bell Laboratories и те разработиха Audrey, която разпознава само цифри, разчетени от подметка глас. IBM представи Shoebox през 1962 г., който може да отговори на около 16 думи на английски език. Александър Вайбел разработи харпия и можеше да разбира над хиляда думи. Технологията използва моделите Hidden Markov, тъй като те могат да бъдат обучени автоматично, също така и изчислително подходящи за използване.
Google и Apple са две компании, които са използвали технологията за разпознаване на реч и технологията на Apple навлизането в индустрията за разпознаване на реч привлече общественото внимание поради своя изкуствен интелект подкрепа. Смартфоните бяха основата за цифровите асистенти.

Често срещани употреби на разпознаване на реч

Гласово разпознаване технологията може да бъде използвана както от военния, така и от медицинския сектор на дадена страна
Гласово разпознаване е постоянно нарастваща ниша, тъй като се прилага от Google и Apple, за да насочи клиентите към различните им цели
Скритият модел на Марков е основната технология за гласово разпознаване тъй като неговото изчисление е подходящо за използване

Често срещани злоупотреби с разпознаване на реч

Компютърни системи, които желаят да използват гласово разпознаване Функционалният софтуер не е задължително да има микрофон