Live Transcribe 2.1 เตรียมเพิ่มการตรวจจับไซเรนฉุกเฉิน, Smart Segments และ Speaker ID

การอัปเดตล่าสุดสำหรับแอป Live Transcribe จะเผยให้เห็นฟีเจอร์ที่กำลังจะมีขึ้น 3 ประการ ได้แก่ การตรวจจับไซเรนฉุกเฉิน การแบ่งกลุ่มอัจฉริยะ และรหัสลำโพง

เมื่อต้นปีนี้ที่ Google I/O บริษัท เปิดตัวสองแอพใหม่ สำหรับ Android เพื่อช่วยเหลือผู้ที่มีความบกพร่องทางการได้ยิน — Live Transcribe และโปรแกรมขยายเสียง แม้ว่าแอปทั้งสองจะมุ่งเน้นไปที่ผู้บกพร่องทางการได้ยิน แต่เดิม Google ในภายหลัง อัปเดตแอป Live Transcribe แล้ว เพื่อช่วยเหลือนักศึกษาและนักข่าวด้วย หลังจากการอัปเดต แอปอนุญาตให้ผู้ใช้บันทึกการถอดเสียงไว้ในอุปกรณ์ของตน และยังมีความสามารถในการตรวจจับเหตุการณ์เสียงระหว่างการถอดเสียงอีกด้วย ตอนนี้ดูเหมือนว่า Google กำลังเตรียมแอปเพื่อแนะนำคุณสมบัติเพิ่มเติมอีกสามประการ

การแยกส่วน APK มักจะสามารถคาดเดาคุณสมบัติที่อาจมาถึงในการอัปเดตแอปพลิเคชันในอนาคต แต่เป็นไปได้ว่าคุณสมบัติใดๆ ที่เรากล่าวถึงในที่นี้อาจไม่ปรากฏในรุ่นอนาคต เนื่องจากขณะนี้ฟีเจอร์เหล่านี้ยังไม่มีการใช้งานในเวอร์ชันที่ใช้งานจริง และนักพัฒนาอาจดึงมาใช้เมื่อใดก็ได้ในเวอร์ชันต่อๆ ไป

การแยกส่วนการอัปเดตล่าสุดสำหรับ Live Transcribe (เวอร์ชัน 2.1.276871059) เผยให้เห็นสตริงของโค้ดที่บ่งบอกถึงฟีเจอร์ที่กำลังจะมีขึ้น รวมถึงแสดงเสียงไซเรนฉุกเฉิน การแบ่งกลุ่มอัจฉริยะ และรหัสลำโพง คุณลักษณะแสดงไซเรนฉุกเฉินจะช่วยให้แอปสามารถระบุไซเรนฉุกเฉินและแจ้งเตือนผู้ใช้ได้ สตริงยังมีกล่องโต้ตอบสำหรับคุณลักษณะที่ระบุว่า "โปรดใช้ความระมัดระวังเมื่อมีการรายงานเสียงไซเรน โปรดจำไว้ว่าไม่ใช่ทุกไซเรนที่ต้องดำเนินการหรือระบุเหตุฉุกเฉินที่เกี่ยวข้อง (เช่น ไซเรนบนทีวี) นอกจากนี้ การตรวจจับเสียงไซเรนของเรายังอาจเกิดข้อผิดพลาดเป็นครั้งคราว"

<stringname="show_emergency_siren_dialog_message">Please exercise caution when sirens are reported. Remember that not all sirens require action or indicate a relevant emergency (sirens on TV, for example). Furthermore, our siren detection will occasionally make mistakes.string>
<stringname="show_emergency_siren_title">Show Emergency Sirensstring>
<stringname="smart_segment">Smart segmentstring>
<stringname="smart_segment_summary">Segment transcript based on performance (rather than text length)string>
<stringname="speaker_id_title">Enable speaker IDstring>

ฟีเจอร์ Smart Segment จะแบ่งการถอดเสียงตามประสิทธิภาพ แทนที่จะเป็นความยาวของข้อความ และฟีเจอร์ Speaker ID จะช่วยให้แอประบุและติดป้ายกำกับผู้พูดในการสนทนาที่กำลังดำเนินอยู่ Mishaal Rahman บรรณาธิการบริหารของเราก็ได้พิจารณาเรื่องนี้ด้วย พื้นที่เก็บข้อมูล GitHub ของ Live Transcribe ที่ มีไลบรารีไคลเอนต์ Android ที่ใช้ในการสื่อสารกับ Cloud Speech API ของ Google และพบว่าโมดูลการรู้จำเสียงอัตโนมัติ (ASR) รองรับการระบุลำโพงในตัว อย่างไรก็ตาม ไม่มีการติดตั้ง Speaker ID และดูเหมือนว่าแอปจะมีการใช้งานในปัจจุบัน แต่อาจมีการเปลี่ยนแปลงได้ในอนาคตอันใกล้นี้

ขอขอบคุณซอฟต์แวร์ PNF ที่ให้ใบอนุญาตแก่เรา โปรแกรมถอดรหัส JEBซึ่งเป็นเครื่องมือวิศวกรรมย้อนกลับระดับมืออาชีพสำหรับแอปพลิเคชัน Android