Vad är taligenkänning? definition och betydelse

Taligenkänning är avkodning av mänskligt tal till transkriberad text genom ett datorprogram. För att känna igen talade ord måste programmet transkribera den inkommande ljudsignalen till en digitaliserad representation, som sedan måste jämföras med en enorm databas av digitaliserade representationer av talade ord. För att transkribera tal med en acceptabel grad av noggrannhet måste användarna tala varje ord självständigt, med en paus mellan varje ord och detta saktar avsevärt ner hastigheten hos taligenkänningssystem och ifrågasätter deras användbarhet, med undantag för fysiska funktionshinder som skulle förhindra inmatning av andra innebär att. Se diskret taligenkänning.

Technipages förklarar taligenkänning

Taligenkänning är förmågan hos en fördefinierad programvara att lyssna på ett röstkommando, tolka det och ge ett svar. Svaren kan sträcka sig från att din dator ger dig resultat från en sökning du just beställt, eller till och med att få tillbaka ett svar från telefonassistenter. Innan någon typ av dator kan komma åt denna teknik måste den ha en ljudingång som en mikrofon för att kunna ge kommandon till systemet.

Utvecklingen av denna teknik startade på 1950-talet, med den första 1952, utvecklaren var Bell Laboratories, och de utvecklade Audrey, som känner igen bara siffror som läses av en sula röst. IBM introducerade Shoebox 1962, som kunde svara på cirka 16 ord på engelska. Alexander Waibel utvecklade harpy, och den kunde förstå över tusen ord. Tekniken använder Hidden Markov-modellerna eftersom de kan tränas automatiskt, även beräkningsmässigt lämpliga att användas.
Google och Apple är två företag som har använt tekniken för taligenkänning och Apples inträdet i taligenkänningsbranschen fick allmän uppmärksamhet på grund av dess artificiella intelligens stöd. Smartphones var basen för digitala assistenter.

Vanlig användning av taligenkänning

Taligenkänning Tekniken skulle kunna utnyttjas av både den militära och medicinska sektorn i ett land
Taligenkänning är en ständigt växande nisch eftersom den implementeras av Google och Apple för att driva kunder till sina olika mål
Den dolda Markov-modellen är den underliggande tekniken för taligenkänning eftersom dess beräkning är lämplig att användas

Vanliga missbruk av taligenkänning

Datorsystem som vill använda taligenkänning funktionsprogramvara behöver inte nödvändigtvis ha en mikrofon