Puheentunnistus on ihmisen puheen purkamista transkriboiduksi tekstiksi tietokoneohjelman avulla. Puhuttujen sanojen tunnistamiseksi ohjelman tulee transkriptoida saapuva äänisignaali digitoiduksi esitys, jota on sitten verrattava valtavaan tietokantaan digitoituja esityksiä puhutut sanat. Puheen litteroimiseksi siedettävällä tarkkuudella käyttäjien on puhuttava jokainen sana itsenäisesti, pitäen jokaisen sanan välissä tauko, mikä hidastaa huomattavasti puheentunnistusjärjestelmien nopeus ja kyseenalaistaa niiden käyttökelpoisuuden, lukuun ottamatta fyysisiä vammoja, jotka estäisivät muiden syöttämästä tarkoittaa. Katso diskreetti puheentunnistus.
Technipages selittää puheentunnistuksen
Puheentunnistus on ennalta määritellyn ohjelmiston kyky kuunnella äänikomentoa, tulkita sitä ja antaa vastaus. Vastaukset voivat vaihdella tietokoneestasi, joka antaa sinulle juuri tilaamasi haun tulokset, tai jopa vastauksen saaminen puhelinavustajilta. Ennen kuin minkään tyyppiset tietokoneet voivat käyttää tätä tekniikkaa, siinä on oltava äänitulo, kuten mikrofoni, jotta se voi antaa komentoja järjestelmälle.
Tämän tekniikan kehittäminen aloitettiin 1950-luvulla, ja ensimmäinen oli vuonna 1952, kehittäjä oli Bell Laboratories ja he kehittivät Audreyn, joka tunnistaa vain pohjan lukemat numerot ääni. IBM esitteli vuonna 1962 Shoeboxin, joka pystyi vastaamaan noin 16 sanaan englannin kielellä. Alexander Waibel kehitti harpyan, ja se ymmärsi yli tuhat sanaa. Tekniikka hyödyntää Hidden Markov -malleja, koska ne ovat automaattisesti koulutettavissa, myös laskennallisesti käyttökelpoisia.
Google ja Apple ovat kaksi yritystä, jotka ovat hyödyntäneet puheentunnistusteknologiaa ja Applen teknologiaa pääsy puheentunnistusteollisuuteen sai julkista huomiota tekoälynsä ansiosta taustalla. Älypuhelimet olivat digitaalisten avustajien perusta.
Puheentunnistuksen yleiset käyttötavat
- Puheentunnistus teknologiaa voisi hyödyntää sekä maan sotilas- että lääkeala
- Puheentunnistus on jatkuvasti kasvava markkinarako, jota Google ja Apple ottavat käyttöön houkutellakseen asiakkaita heidän eri tarkoituksiinsa
- Piilotettu Markovin malli on taustalla oleva tekniikka puheentunnistus koska sen laskenta soveltuu käytettäväksi
Yleiset puheentunnistuksen väärinkäytökset
- Tietokonejärjestelmät, jotka haluavat hyödyntää puheentunnistus toimintoohjelmistoissa ei välttämättä tarvitse olla mikrofonia