การรู้จำเสียงคืออะไร? ความหมายและความหมาย

การรู้จำเสียงคือการถอดรหัสคำพูดของมนุษย์เป็นข้อความที่ถอดเสียงผ่านโปรแกรมคอมพิวเตอร์ ในการจดจำคำพูด โปรแกรมต้องถอดเสียงสัญญาณเสียงที่เข้ามาเป็นดิจิทัล การเป็นตัวแทนซึ่งจะต้องเปรียบเทียบกับฐานข้อมูลขนาดใหญ่ของการเป็นตัวแทนดิจิทัลของ คำพูด ในการถอดเสียงคำพูดด้วยระดับความแม่นยำที่ยอมรับได้ ผู้ใช้ต้องพูดแต่ละคำแยกกัน โดยมีการหยุดระหว่างแต่ละคำและทำให้ช้าลงอย่างมาก ความเร็วของระบบรู้จำเสียงพูดและถามอรรถประโยชน์ ยกเว้นกรณีทุพพลภาพที่จะขัดขวางไม่ให้ผู้อื่นป้อนข้อมูล วิธี. ดูการรู้จำคำพูดแบบไม่ต่อเนื่อง

Technipages อธิบายการรู้จำเสียง

การรู้จำเสียงเป็นความสามารถของซอฟต์แวร์ที่กำหนดไว้ล่วงหน้า เพื่อฟังคำสั่งเสียง ตีความ และตอบกลับ คำตอบอาจมีตั้งแต่คอมพิวเตอร์ของคุณซึ่งให้ผลลัพธ์จากการค้นหาที่คุณเพิ่งสั่งซื้อ หรือแม้แต่การตอบกลับจากผู้ช่วยทางโทรศัพท์ ก่อนที่คอมพิวเตอร์ประเภทใดจะสามารถเข้าถึงเทคโนโลยีนี้ได้ จะต้องมีอินพุตเสียงเหมือนไมโครโฟนจึงจะสั่งงานระบบได้
การพัฒนาเทคโนโลยีนี้เริ่มต้นในปี 1950 โดยครั้งแรกในปี 1952 นักพัฒนาคือ Bell Laboratories และพวกเขาได้พัฒนา Audrey ซึ่งรับรู้เพียงตัวเลขที่อ่านโดย sole เสียง. IBM เปิดตัว Shoebox ในปี 1962 ซึ่งสามารถตอบสนองต่อคำได้ประมาณ 16 คำในภาษาอังกฤษ Alexander Waibel พัฒนาฮาร์ปี้และสามารถเข้าใจคำศัพท์ได้มากกว่าหนึ่งพันคำ เทคโนโลยีนี้ใช้โมเดล Hidden Markov เนื่องจากสามารถฝึกได้โดยอัตโนมัติและยังเหมาะสมกับการคำนวณอีกด้วย


Google และ Apple เป็นสองบริษัทที่ใช้เทคโนโลยีการรู้จำเสียงพูดและของ Apple การเข้าสู่อุตสาหกรรมการรู้จำคำพูดได้รับความสนใจจากสาธารณชนเนื่องจากปัญญาประดิษฐ์ การสนับสนุน สมาร์ทโฟนเป็นฐานสำหรับผู้ช่วยดิจิทัล

การใช้งานทั่วไปของการรู้จำเสียง

  • การรู้จำเสียง เทคโนโลยีสามารถควบคุมได้ทั้งภาคการทหารและการแพทย์ของประเทศ
  • การรู้จำเสียง เป็นช่องที่เติบโตขึ้นเรื่อยๆ เนื่องจาก Google และ Apple กำลังดำเนินการเพื่อผลักดันลูกค้าไปยังจุดสิ้นสุดที่แตกต่างกัน
  • โมเดล Markov ที่ซ่อนอยู่เป็นเทคโนโลยีพื้นฐานสำหรับ การรู้จำคำพูด เนื่องจากการคำนวณมีความเหมาะสมต่อการใช้งาน

การใช้การรู้จำเสียงในทางที่ผิดที่พบบ่อย

  • ระบบคอมพิวเตอร์ที่ต้องการใช้ การรู้จำคำพูด ซอฟต์แวร์ฟังก์ชั่นไม่จำเป็นต้องมีไมโครโฟน