Kas ir runas atpazīšana? definīcija un nozīme

click fraud protection

Runas atpazīšana ir cilvēka runas dekodēšana transkribētā tekstā, izmantojot datorprogrammu. Lai atpazītu izrunātos vārdus, programmai ir jāpārraksta ienākošais skaņas signāls digitalizētā formātā attēlojumu, kas pēc tam jāsalīdzina ar milzīgu datu bāzi ar digitalizētiem attēlojumiem izrunātie vārdi. Lai pārrakstītu runu ar jebkādu pieļaujamu precizitātes pakāpi, lietotājiem ir jāizrunā katrs vārds atsevišķi, starp katru vārdu ieturot pauzi, un tas ievērojami palēnina runas atpazīšanas sistēmu ātrumu un apšauba to lietderību, izņemot fizisku invaliditāti, kas neļautu citiem ievadīt informāciju nozīmē. Skatiet diskrētu runas atpazīšanu.

Technipages izskaidro runas atpazīšanu

Runas atpazīšana ir iepriekš definētas programmatūras spēja klausīties balss komandu, interpretēt to un sniegt atbildi. Atbildes var būt dažādas: jūsu dators sniedz jums tikko pasūtītās meklēšanas rezultātus vai pat atbildes saņemšanu no tālruņa palīgiem. Lai jebkura veida dators varētu piekļūt šai tehnoloģijai, tam ir jābūt skaņas ievadei, piemēram, mikrofonam, lai sistēma varētu dot komandas.


Šīs tehnoloģijas izstrāde sākās 1950. gados, pirmo reizi 1952. gadā izstrādātājs bija Bell Laboratories, un viņi izstrādāja Odriju, kas atpazīst tikai ciparus, ko nolasa zole. balss. IBM 1962. gadā ieviesa Shoebox, kas angļu valodā varēja atbildēt uz aptuveni 16 vārdiem. Aleksandrs Vaibels izstrādāja harpiju, un tā varēja saprast vairāk nekā tūkstoš vārdu. Tehnoloģija izmanto Hidden Markov modeļus, jo tos var apmācīt automātiski, arī skaitļošanas ziņā piemērotus lietošanai.
Google un Apple ir divi uzņēmumi, kas ir izmantojuši runas atpazīšanas tehnoloģiju un Apple iekļūšana runas atpazīšanas nozarē piesaistīja sabiedrības uzmanību, pateicoties tās mākslīgajam intelektam aizmugure. Viedtālruņi bija digitālo palīgu pamats.

Runas atpazīšanas biežie lietojumi

  • Runas atpazīšana tehnoloģiju varētu izmantot gan valsts militārais, gan medicīnas sektors
  • Runas atpazīšana ir arvien augoša niša, jo to ievieš Google un Apple, lai virzītu klientus uz dažādiem mērķiem
  • Slēptais Markova modelis ir pamatā esošā tehnoloģija runas atpazīšana jo tā aprēķins ir piemērots lietošanai

Izplatīta runas atpazīšanas nepareiza izmantošana

  • Datorsistēmas, kuras vēlas izmantot runas atpazīšana funkciju programmatūrai nav obligāti jābūt mikrofonam