Kas yra kalbos atpažinimas? apibrėžimas ir prasmė

click fraud protection

Kalbos atpažinimas – tai žmogaus kalbos iššifravimas į transkribuotą tekstą naudojant kompiuterinę programą. Kad atpažintų ištartus žodžius, programa turi perrašyti gaunamą garso signalą į suskaitmenintą reprezentaciją, kurią vėliau reikia palyginti su milžiniška skaitmeninių vaizdų duomenų baze ištarti žodžiai. Norėdami perrašyti kalbą bet kokiu leistinu tikslumu, naudotojai turi tarti kiekvieną žodį atskirai, su pauze tarp kiekvieno žodžio ir tai labai sulėtina kalbos atpažinimo sistemų greitis ir kelia abejonių dėl jų naudingumo, išskyrus fizinės negalios atvejus, dėl kurių kiti asmenys negalėtų įvesti informacijos reiškia. Žr. diskretišką kalbos atpažinimą.

Technipages paaiškina kalbos atpažinimą

Kalbos atpažinimas – tai iš anksto nustatytos programinės įrangos galimybė klausytis balso komandos, ją interpretuoti ir atsakyti. Atsakymai gali būti įvairūs: jūsų kompiuteris pateikia ką tik užsakytos paieškos rezultatus arba netgi atsako iš telefono padėjėjų. Kad bet kokio tipo kompiuteris galėtų pasiekti šią technologiją, jis turi turėti garso įvestį, pvz., mikrofoną, kad galėtų duoti komandas sistemai.


Ši technologija pradėta kurti šeštajame dešimtmetyje, o pirmoji – 1952 m. Bell Laboratories, ir jie sukūrė Audrey, kuri atpažįsta tik skaitmenis, kuriuos skaito padas balsas. IBM pristatė Shoebox 1962 m., kuris galėjo atsakyti į maždaug 16 žodžių anglų kalba. Aleksandras Vaibelis sukūrė harpiją ir galėjo suprasti daugiau nei tūkstantį žodžių. Ši technologija naudoja Hidden Markov modelius, nes jie gali būti mokomi automatiškai, taip pat skaičiavimo požiūriu tinkami naudoti.
„Google“ ir „Apple“ yra dvi įmonės, kurios panaudojo kalbos atpažinimo ir „Apple“ technologijas įėjimas į kalbos atpažinimo pramonę sulaukė visuomenės dėmesio dėl savo dirbtinio intelekto atrama. Išmanieji telefonai buvo skaitmeninių asistentų pagrindas.

Įprasti kalbos atpažinimo būdai

  • Kalbos atpažinimas technologijas galėtų panaudoti tiek šalies karinis, tiek medicinos sektoriai
  • Kalbos atpažinimas yra nuolat auganti niša, kurią diegia „Google“ ir „Apple“, siekdamos nukreipti klientus į skirtingus tikslus
  • Paslėptas Markovo modelis yra pagrindinė technologija kalbos atpažinimas nes jo skaičiavimas tinkamas naudoti

Dažni netinkami kalbos atpažinimo būdai

  • Kompiuterinės sistemos, kurios nori naudoti kalbos atpažinimas funkcinei programinei įrangai nebūtinai turi turėti mikrofoną