Co je rozpoznávání řeči? definice a význam

Rozpoznávání řeči je dekódování lidské řeči do přepsaného textu pomocí počítačového programu. Pro rozpoznání mluveného slova musí program přepsat příchozí zvukový signál do digitalizované podoby reprezentace, která musí být následně porovnána s obrovskou databází digitalizovaných reprezentací mluvená slova. Aby bylo možné přepsat řeč s tolerovatelnou mírou přesnosti, musí uživatelé mluvit každé slovo nezávisle, s pauzou mezi každým slovem, což podstatně zpomaluje rychlost systémů rozpoznávání řeči a zpochybňuje jejich užitečnost, s výjimkou případu fyzického postižení, které by bránilo vstupu jiných prostředek. Viz diskrétní rozpoznávání řeči.

Technipages vysvětluje rozpoznávání řeči

Rozpoznávání řeči je schopnost předdefinovaného softwaru poslouchat hlasový příkaz, interpretovat jej a reagovat. Odpovědi se mohou pohybovat od vašeho počítače, který vám poskytne výsledky z vyhledávání, které jste si právě objednali, nebo dokonce získat odpověď od telefonních asistentů. Než bude mít jakýkoli typ počítače přístup k této technologii, musí mít zvukový vstup, jako je mikrofon, aby mohl dávat příkazy systému.


Vývoj této technologie začal v 50. letech 20. století, přičemž první byla v roce 1952, vývojářem byl Bell Laboratories a vyvinuli Audrey, která rozpoznává pouze číslice čtené podrážkou hlas. IBM představila Shoebox v roce 1962, který dokázal odpovědět asi na 16 slov v angličtině. Alexander Waibel vyvinul harpyji a ta dokázala porozumět více než tisícům slov. Technologie využívá modely Hidden Markov, protože je lze trénovat automaticky, což je také vhodné pro použití ve výpočtech.
Google a Apple jsou dvě společnosti, které využívají technologii rozpoznávání řeči a technologii Apple vstup do odvětví rozpoznávání řeči si získal pozornost veřejnosti díky své umělé inteligenci podpora. Smartphony byly základem pro digitální asistenty.

Běžná použití rozpoznávání řeči

  • Rozpoznávání řeči technologii by mohl využívat jak vojenský, tak lékařský sektor země
  • Rozpoznávání řeči je stále rostoucí nika, protože je implementována společnostmi Google a Apple, aby přivedla zákazníky k různým cílům
  • Skrytý Markov model je základní technologií rozpoznávání řeči protože jeho výpočet je vhodný k použití

Běžná zneužití rozpoznávání řeči

  • Počítačové systémy, které chtějí využívat rozpoznávání řeči funkční software nemusí nutně mít mikrofon