Co to jest rozpoznawanie mowy? definicja i znaczenie

click fraud protection

Rozpoznawanie mowy to dekodowanie ludzkiej mowy w transkrybowany tekst za pomocą programu komputerowego. Aby rozpoznać wypowiadane słowa, program musi dokonać transkrypcji przychodzącego sygnału dźwiękowego na zdigitalizowany reprezentacji, którą należy następnie porównać z ogromną bazą danych zdigitalizowanych reprezentacji wypowiadane słowa. Aby dokonać transkrypcji mowy z jakąkolwiek akceptowalną dokładnością, użytkownicy muszą wypowiadać każde słowo niezależnie, z przerwą między każdym słowem, co znacznie spowalnia szybkość systemów rozpoznawania mowy i stawia pod znakiem zapytania ich użyteczność, Z wyjątkiem przypadków niesprawności fizycznych, które uniemożliwiałyby wprowadzanie danych przez inne znaczy. Zobacz dyskretne rozpoznawanie mowy.

Technipages wyjaśnia rozpoznawanie mowy

Rozpoznawanie mowy to zdolność wstępnie zdefiniowanego oprogramowania do słuchania polecenia głosowego, interpretowania go i udzielania odpowiedzi. Odpowiedzi mogą dotyczyć komputera, który daje wyniki z właśnie zamówionego wyszukiwania, a nawet odpowiedzi od asystentów telefonicznych. Zanim jakikolwiek komputer będzie mógł uzyskać dostęp do tej technologii, musi mieć wejście dźwiękowe, takie jak mikrofon, aby móc wydawać polecenia systemowi.


Rozwój tej technologii rozpoczął się w latach 50-tych XX wieku, przy czym pierwszy z nich w 1952 roku był twórcą: Bell Laboratories i opracowali Audrey, która rozpoznaje tylko cyfry odczytywane przez podeszwę głos. IBM wprowadził Shoebox w 1962 roku, który mógł odpowiadać na około 16 słów w języku angielskim. Alexander Waibel rozwinął harpię i potrafił zrozumieć ponad tysiąc słów. Technologia wykorzystuje modele ukrytego Markowa, ponieważ mogą one być trenowane automatycznie, a także odpowiednie obliczeniowo do użycia.
Google i Apple to dwie firmy, które wykorzystały technologię rozpoznawania mowy i Apple’s wejście do branży rozpoznawania mowy zwróciło uwagę opinii publicznej dzięki sztucznej inteligencji poparcie. Podstawą cyfrowych asystentów były smartfony.

Typowe zastosowania rozpoznawania mowy

  • Rozpoznawanie mowy technologia może być wykorzystywana zarówno przez sektor wojskowy, jak i medyczny kraju
  • Rozpoznawanie mowy to stale rozwijająca się nisza, ponieważ jest wdrażana przez Google i Apple, aby kierować klientów do różnych celów
  • Ukryty model Markowa jest podstawową technologią dla rozpoznawanie mowy ponieważ jego obliczenia są odpowiednie do użycia

Częste nadużycia rozpoznawania mowy

  • Systemy komputerowe, które chcą wykorzystać rozpoznawanie mowy oprogramowanie funkcyjne niekoniecznie musi mieć mikrofon