[อัปเดต: คำบรรยายสดใน "โทรศัพท์ที่เลือก"] Google ทำงานเพื่อการเข้าถึงด้วยคำบรรยายสดบน Android Q, Live Relay และ Live Transcribe

click fraud protection

ที่ Google I/O 2019 Google ได้เปิดเผยความพยายามในการเข้าถึง เช่น Live Caption บน Android Q, Live Relay และ Live Transcribe อ่านต่อ!

อัปเดต 1 (5/10/19 @ 23:53 น. ET): ตาม เวนเจอร์บีทคำบรรยายสดอาจไม่พร้อมใช้งานบนอุปกรณ์ทุกเครื่องที่ใช้ Android Q รายละเอียดเพิ่มเติมด้านล่าง

เราในฐานะผู้บริโภคมักจะมองข้ามโลกรอบตัวเราไปโดยเปล่าประโยชน์ สิ่งที่เราประสบ เราสันนิษฐานว่าทุกคนรอบตัวเรามีประสบการณ์แบบเดียวกันในแง่ที่คล้ายคลึงกัน หากไม่เหมือนกัน ข้อสันนิษฐานนี้ขยายไปถึงทุกส่วนของชีวิตเรา รวมถึงเทคโนโลยีด้วย แต่ความพิการมีอยู่จริง และการอยู่ร่วมกับพวกเขากลายเป็นงานที่ท้าทายเนื่องจากข้อสันนิษฐานเหล่านี้ การเข้าถึงจึงกลายเป็นหัวข้อสำคัญ และ Google กำลังมีส่วนร่วมในการทำให้คนพิการมีโอกาสที่เท่าเทียมกันในการเพลิดเพลินกับประสบการณ์เหล่านี้ แอนดรอยด์ คิว ผสานรวมความพยายามในการเข้าถึงของ Google หลายประการเพื่อทำให้ Android เป็นประสบการณ์ที่เชื่อมโยงกันมากขึ้น แม้ว่าคุณลักษณะทั้งหมดที่กล่าวถึงด้านล่างนี้จะยังไม่พร้อมใช้งานใน Android ในขณะนี้

คำบรรยายสด

พวกเราหลายคนไม่เคยสนใจที่จะดูการตั้งค่าคำอธิบายภาพเป็นครั้งที่สอง และเรายังใช้สื่อจำนวนมากโดยไม่ได้สังเกตว่าไม่มีคำอธิบายภาพเลยด้วยซ้ำ แต่สำหรับคนหูหนวกและมีปัญหาในการได้ยินจำนวน 466 ล้านคนทั่วโลก คำบรรยายมีจุดประสงค์มากกว่าความสะดวกสบาย คำบรรยายเป็นเพียงสื่อกลางของประสบการณ์

Android Q ผสานรวมคำบรรยายสดทำให้ผู้ใช้จากชุมชนคนหูหนวกสามารถเข้าถึงประสบการณ์ต่างๆ ได้อย่างง่ายดายและเป็นสากลมากขึ้น

เมื่อเปิดใช้งานการตั้งค่าแล้ว Live Caption จะสร้างคำบรรยายสื่อที่กำลังเล่นเสียงบนอุปกรณ์ของคุณโดยอัตโนมัติด้วยการแตะเพียงครั้งเดียว คำบรรยายสดใช้งานได้กับวิดีโอ พอดแคสต์ ข้อความเสียง และแอปอื่นๆ แม้กระทั่งกับเนื้อหาที่บันทึกไว้ในอุปกรณ์ก็ตาม คำบรรยายจะปรากฏขึ้นทันทีที่ตรวจพบคำพูดที่กำลังเล่นบนอุปกรณ์ และเนื่องจากทั้งหมดนี้เกิดขึ้นผ่านการรู้จำคำพูดบนอุปกรณ์ เสียงหรือคำบรรยายจึงไม่ออกไปจากโทรศัพท์ของคุณ และคุณสามารถใช้คุณสมบัตินี้ได้โดยไม่ต้องใช้ WiFi หรือข้อมูลมือถือ

อัปเดต 5/10/62: Google ได้ยืนยันกับ เวนเจอร์บีท คำบรรยายสดดังกล่าวจะ "มาในโทรศัพท์บางรุ่นที่ใช้ Android Q ในปลายปีนี้" โดยเฉพาะอย่างยิ่ง "เลือกอุปกรณ์ระดับไฮเอนด์" ตามที่ Brian Kemler ผู้จัดการผลิตภัณฑ์การเข้าถึงของ Android กล่าว สาเหตุน่าจะเนื่องมาจากข้อจำกัดด้านหน่วยความจำและพื้นที่ การเปิดตัวครั้งแรกจะถูกจำกัดแต่จะขยายออกไปเมื่อเวลาผ่านไป และ Google วางแผนที่จะเผยแพร่รายชื่ออุปกรณ์ที่จะได้รับการสนับสนุนสำหรับ Live Caption ในขณะที่เราใกล้จะเปิดตัว Android Q สู่สาธารณะรุ่นแรก

นอกจากนี้ Google ยังยืนยันว่าการบันทึกคำบรรยายสดจะไม่สามารถทำได้ (เนื่องจากข้อจำกัดโดยเจตนาใน AudioPlaybackCaptureConfiguration API) ว่าจะไม่ทำงานกับการโทร การโทรด้วยเสียง หรือการสนทนาทางวิดีโอ (เนื่องจาก API ไม่รองรับ) และจะรองรับเฉพาะคำบรรยายเป็นภาษาอังกฤษที่ ปล่อย. เมื่อเปิดตัวฟีเจอร์แล้ว โมเดลออฟไลน์จะถูกดาวน์โหลด และการอัปเดตของโมเดลจะให้บริการผ่านบริการ Google Play

ถ่ายทอดสด

Live Relay ต่อยอดจากแนวคิดที่เสนอโดย Live Caption โดยให้ผู้คนสามารถโทรออกและรับสายโทรศัพท์ได้โดยไม่ต้องพูดหรือได้ยิน

Live Relay ใช้การรู้จำคำพูดบนอุปกรณ์และการแปลงข้อความเป็นคำพูดเพื่อให้โทรศัพท์ฟังการโทรด้วยเสียงแล้วพูดคำตอบในนามของผู้ใช้ที่พิมพ์คำตอบออกมา คุณลักษณะนี้ทำงานควบคู่กับคุณลักษณะคำแนะนำการเขียนแบบคาดเดา เช่น การเขียนอัจฉริยะ และ สมาร์ทตอบกลับทำให้สามารถพักสายสดได้ง่ายขึ้นด้วยการตอบกลับอย่างรวดเร็ว Live Relay ทำงานบนอุปกรณ์ทั้งหมด ดังนั้นการโทรยังคงเป็นส่วนตัว เนื่องจาก Live Relay โต้ตอบกับอีกฝ่ายผ่านการโทรศัพท์ปกติ จึงสามารถทำงานกับโทรศัพท์บ้านในอีกด้านหนึ่งได้

แม้ว่า Live Relay จะเป็นประโยชน์สำหรับชุมชนคนหูหนวกและชุมชน Mute อย่างแน่นอน แต่กรณีการใช้งานก็ขยายไปถึง สถานการณ์ที่บางคนอาจไม่สามารถพูดหรือได้ยินโทรศัพท์ได้ในขณะนั้น แต่ยังต้องการโต้ตอบ กับมัน Google ยังมองในแง่ดีเกี่ยวกับการบูรณาการความสามารถในการแปลแบบเรียลไทม์ภายใน Live Relay ซึ่งในทางกลับกัน มีศักยภาพที่จะให้ใครก็ตามโทรหาใครก็ได้ในโลกนี้และสื่อสารได้โดยไม่คำนึงถึงอุปสรรคทางภาษา

Google ระบุว่า Live Relay ยังอยู่ในขั้นตอนการวิจัย ยังไม่ชัดเจนในทันทีว่าฟีเจอร์นี้ถูกรวมเข้ากับ Android Q เวอร์ชันปัจจุบันหรือไม่ เราคาดเดาว่าจะเปิดตัวในอุปกรณ์ Android ในอนาคต

Live Transcribe -- ส่วนขยายสำหรับผู้ใช้ที่มีความบกพร่องด้านการพูด

Google นำเสนอ Live Transcribe เมื่อต้นปีนี้ในฐานะเครื่องมือสำหรับผู้ใช้หูหนวกในการถอดเสียงคำพูดรอบตัวพวกเขาแบบสดๆ แอปนี้มีจุดมุ่งหมายเพื่อให้การสนทนาในชีวิตประจำวันเข้าถึงได้มากขึ้นโดยการแปลงคำพูดในโลกแห่งความเป็นจริงผ่านไมโครโฟนของโทรศัพท์ให้เป็นคำบรรยายแบบเรียลไทม์ Live Transcribe คือ มีให้บริการแล้วในรูปแบบเบต้าแบบจำกัดการเข้าถึงล่วงหน้าผ่านทาง Play Storeพร้อมรองรับภาษาและภาษาถิ่นมากกว่า 70 ภาษา แอปนี้ได้รับการติดตั้งไว้ล่วงหน้าในอุปกรณ์ Pixel 3 ด้วย

ถอดเสียงสดและการแจ้งเตือนผู้พัฒนา: การวิจัยที่ Google

ราคา: ฟรี

3.8.

ดาวน์โหลด

ความพยายามล่าสุดของ Google ในการปรับปรุงการเข้าถึงทำให้ Live Transcribe ไม่เพียงแต่สำหรับผู้ใช้หูหนวกเท่านั้น แต่ยังรวมถึงผู้ใช้ที่มีความบกพร่องในการพูดผ่าน Project Euphonia ด้วย

ทีมงานภายใต้ Project Euphonia ใช้ AI เพื่อปรับปรุงความสามารถของคอมพิวเตอร์ในการทำความเข้าใจรูปแบบคำพูดที่หลากหลาย รวมถึงคำพูดที่มีความบกพร่อง Google ได้ร่วมมือกับองค์กรไม่แสวงหากำไร เช่น ALS Therapy Development Institute และ ALS Residence Initiative เพื่อบันทึกเสียงของผู้คน ที่ได้รับผลกระทบจาก ALS จากนั้นใช้การบันทึกเหล่านี้เพื่อฝึกโมเดล AI ให้ถอดเสียงคำพูดของผู้ที่มีคำพูดประเภทนี้ได้อย่างน่าเชื่อถือมากขึ้น ความยากลำบาก ชุดอัลกอริธึม AI ในปัจจุบันทำงานร่วมกับภาษาอังกฤษเพื่อรองรับบุคคลที่มีความบกพร่องทางร่างกาย เกี่ยวข้องกับ ALS แต่ Google มองในแง่ดีเกี่ยวกับการวิจัยที่นำไปใช้กับกลุ่มใหญ่และคำพูดที่แตกต่างกัน ความบกพร่อง

นอกจากนี้ Google ยังสร้างสิ่งนี้ด้วยการฝึกอบรมอัลกอริธึม AI ส่วนบุคคลเพื่อตรวจจับเสียงและ ท่าทาง จากนั้นดำเนินการต่างๆ เช่น การสร้างคำสั่งเสียงไปยัง Google Home หรือการส่งข้อความ ข้อความ กรณีการใช้งานนี้มีประโยชน์อย่างยิ่งกับผู้ที่มีความพิการขั้นรุนแรง ไม่สามารถพูดได้ และสามารถโต้ตอบได้เฉพาะกับเสียงที่ไม่ใช่คำพูดและการแสดงสีหน้าเท่านั้น

ดูเหมือนว่าฟังก์ชันใหม่เหล่านี้ยังไม่พร้อมใช้งานใน Live Transcribe Google กำลังขอความช่วยเหลือจากอาสาสมัครที่พูดไม่ชัดหรือเข้าใจยาก และยินดีบันทึกชุดวลีเพื่อช่วยฝึกระบบให้ทำงานได้ดีขึ้นต่อไป หากคุณมีสิทธิ์และต้องการเป็นอาสาสมัครโปรด กรอกแบบฟอร์มสำหรับสิ่งเดียวกัน.

ความพยายามของ Google ในการปรับปรุงการเข้าถึงเทคโนโลยีเป็นสิ่งที่น่ายกย่องอย่างแน่นอน เราหวังว่าบริษัทซอฟต์แวร์จำนวนมากขึ้นมุ่งมั่นที่จะมอบประสบการณ์ที่เท่าเทียมกันให้กับบุคคลที่มีความสามารถแตกต่างกัน


ที่มา 1: Googleที่มา 2: Googleที่มา 3: Google