音声認識とは何ですか? 定義と意味

click fraud protection

音声認識は、コンピュータプログラムを介して人間の音声を文字起こしされたテキストにデコードすることです。 話し言葉を認識するために、プログラムは着信音声信号をデジタル化されたものに変換する必要があります 表現。これは、デジタル化された表現の巨大なデータベースと比較する必要があります。 話し言葉。 許容できる精度で音声を書き写すには、ユーザーは各単語を個別に話す必要があり、各単語の間に一時停止があります。これにより、 音声認識システムの速度とその有用性に疑問を投げかける、他の人による入力を妨げる身体障害の場合を除いて 意味。 離散音声認識を参照してください。

Technipagesは音声認識について説明しています

音声認識は、事前定義されたソフトウェアの機能であり、音声コマンドを聞いて解釈し、応答を返します。 応答は、注文したばかりの検索から結果を返すコンピューターから、電話アシスタントからの応答を返すものまでさまざまです。 どのタイプのコンピューターもこのテクノロジーにアクセスするには、システムにコマンドを送信できるようにするために、マイクのようなサウンド入力が必要です。
この技術の開発は1950年代に始まり、1952年に最初に開発されました。 ベル研究所、そして彼らはオードリーを開発しました。オードリーは、ソールによって読み取られている数字だけを認識します ボイス。 IBMは1962年にShoeboxを導入しました。これは、英語で約16語に対応できます。 アレクサンダーワイベルはハーピーを開発しました、そしてそれは千以上の言葉を理解することができました。 このテクノロジーは、隠れマルコフモデルを利用します。これは、モデルを自動的にトレーニングでき、計算上も使用に適しているためです。
GoogleとAppleは、音声認識とAppleのテクノロジーを利用した2つの会社です。 音声認識業界への参入は、その人工知能のために世間の注目を集めました バッキング。 スマートフォンはデジタルアシスタントの基盤でした。

音声認識の一般的な使用法

  • 音声認識 テクノロジーは、国の軍事部門と医療部門の両方で利用できます
  • 音声認識 は、顧客をさまざまな目的に導くためにGoogleとAppleによって実装されているため、成長を続けるニッチです。
  • 隠れマルコフモデルは、 音声認識 その計算は使用するのに適しているので

音声認識の一般的な誤用

  • 利用したいコンピュータシステム 音声認識 機能ソフトウェアは必ずしもマイクを持っている必要はありません