ในงานเสมือนจริงของ Google L10n Google ได้แสดงให้เห็นถึงการมุ่งเน้นใหม่เกี่ยวกับภาษาอินเดียพร้อมการเปลี่ยนแปลงที่ดึงดูดผู้คนหลายภาษาในอินเดีย
อินเดียเป็นดินแดนแห่งร้อยภาษา ซึ่งเป็นสถานที่ที่ภาษาถิ่นเปลี่ยนแปลงทุกๆ 100 กม. ในโลกเทคโนโลยีที่ครอบงำโดยภาษาอังกฤษ ภาษาท้องถิ่นและภาษาท้องถิ่นเหล่านี้พบว่าตัวเองไม่สามารถให้การเข้าถึงประสบการณ์ที่มีความหมายบนอินเทอร์เน็ตได้ ที่งานเสมือนจริงของ Google L10n วันนี้ Google กำลังทำให้ผู้ใช้ที่พูดได้หลายภาษาในอินเดียได้รับประสบการณ์ที่สมบูรณ์ยิ่งขึ้นในอินเดียได้ง่ายขึ้น ด้วยการสลับภาษาที่ง่ายดายสำหรับ Google Search การแสดงผลลัพธ์สองภาษาที่ดีขึ้นใน Google Search การสลับภาษาที่ง่ายดายใน Google Maps ช่วยทำการบ้านเป็นภาษาฮินดีผ่าน Google Lens และโมเดล AI หลายภาษาที่เรียกว่า MuRIL เพื่อให้คอมพิวเตอร์เข้าใจความหลากหลายได้ง่ายขึ้น ภาษามนุษย์
พื้นหลัง
ก่อนที่จะเข้าสู่การประกาศ ต่อไปนี้เป็นข้อมูลพื้นฐานบางส่วนในการอธิบายบริบทให้ผู้ชมในต่างประเทศทราบ ก ส่วนใหญ่ของอินเดียเป็นภาษาสองภาษาและหลายภาษาโดยภาษาอังกฤษเป็นภาษาแรกเพียง 0.02% ของประชากรอินเดียจำนวนกว่า 1.2 พันล้านคน มีเพียง 10.6% ของประชากรทั้งหมดที่สามารถพูดภาษาอังกฤษได้ ในทางตรงกันข้าม ประชากร 43.63% พูดภาษาฮินดีเป็นภาษาแรก ในขณะที่ 57.1% สามารถพูดภาษาฮินดีโดยรวมได้ (แม้ว่าจะแบ่งออกเป็นภาษาถิ่นย่อยต่างๆ ก็ตาม) ภาษาอื่นๆ ตามมา แต่ในเปอร์เซ็นต์ที่น้อยกว่า ได้แก่ เบงกาลี มราฐี และเตลูกู 8.9%, 8.2% และ 7.8% ตามลำดับ ข้อดีและข้อเสียสั้น ๆ ก็คือ การให้ความสำคัญกับเทคโนโลยีเป็นภาษาอังกฤษ เนื่องจากเป็นสื่อกลางในการเข้าถึงเพียงช่องทางเดียวที่ทำให้เทคโนโลยีอยู่ห่างจากคนจำนวนมาก ผู้ใช้ที่อาจพบว่าเทคโนโลยีนี้มีประโยชน์อย่างยิ่ง และอาจต้องการมันมากกว่าผู้ใช้ที่สามารถเข้าถึงเทคโนโลยีในที่อื่นได้แล้ว วิธี
ดังที่ฉันได้กล่าวไว้ในของฉัน รีวิวเสียงของ Google Nestแม้แต่ลำโพงอัจฉริยะก็ยังใช้งานได้น้อยกว่าในการตั้งค่าหลายภาษาเหมือนกับในบ้านที่พูดภาษาอังกฤษ คำสั่งในภาษาผสมไม่ได้รับการยอมรับอย่างดี (เช่นคำสั่งภาษาอังกฤษเป็นหลักพร้อมคำภาษาฮินดีบางคำ) และการตั้งค่า ภาษาสองภาษายังคงจำกัดอยู่เพียงบางภาษาผสมกัน (ภาษาฮินดี + ภาษาอูรดู หรือภาษาอินเดียสองภาษาใด ๆ รวมกันไม่ถูกต้อง แต่เป็นภาษาฮินดี + อังกฤษ) สถานการณ์ดีขึ้นกว่าเมื่อหลายปีก่อน แต่ก็ยังมีวิธีที่ยุติธรรมในการปรับปรุง
และ Google ก็รู้เรื่องนี้ดี เป็นรากฐานสำหรับ ประกาศวันนี้ที่งาน L10n (ตัวย่อขี้เล่นสำหรับ Localization โดยมีตัวอักษร 10 ตัวอยู่ระหว่าง L และ n)
ประกาศที่งาน Google L10n 2020
สลับระหว่างผลลัพธ์ภาษาอังกฤษและภาษาอินเดียได้อย่างง่ายดายใน Google Search
Google เสนอความสามารถในการสลับระหว่างผลลัพธ์ในภาษาอังกฤษและภาษาฮินดีอย่างรวดเร็วผ่านชิป/แท็บใน Google Search ในรัฐของอินเดียที่มีประชากรที่พูดภาษาฮินดีเป็นจำนวนมาก ชิปนี้ช่วยเพิ่มคำค้นหาภาษาฮินดีเพิ่มขึ้น 10 เท่าในอินเดีย
ขณะนี้มีการขยายภาษาเดียวกันนี้ไปยังภาษาอินเดียอื่นๆ มากขึ้น ขณะนี้ Google Search สามารถสลับผลลัพธ์ระหว่างภาษาอังกฤษกับภาษาทมิฬ/เตลูกู/บางลา/มราฐีได้เช่นกัน
การแสดงผลการค้นหาสองภาษาที่ดีขึ้นใน Google Search
ผู้ใช้ในอินเดีย รวมทั้งตัวฉันเองด้วย ชอบที่จะพิมพ์ข้อความเป็นภาษาอังกฤษ แม้ว่าผลลัพธ์จะต้องเป็นภาษาท้องถิ่นก็ตาม ในความเป็นจริง การทับศัพท์ภาษาฮินดีเป็นภาษาอังกฤษทำให้เกิด Hinglish ซึ่งเป็นภาษาฮินดีที่เขียนด้วยตัวอักษรภาษาอังกฤษ
Google Search กำลังมาช่วยเหลือคนสองภาษาสำหรับคำค้นหาของพวกเขา ในเดือนหน้า Search จะเริ่มแสดงเนื้อหาที่เกี่ยวข้องในภาษาอินเดียที่รองรับเมื่อเหมาะสม แม้ว่าคำค้นหาจะมีก็ตาม ได้รับการทับศัพท์เป็นภาษาอังกฤษ ทำให้เกิดผลการค้นหาแบบสองภาษาในภาษาต่างๆ มากขึ้น นอกเหนือจากภาษาอังกฤษเป็นภาษาหลัก ภาษาอินเดียที่รองรับสำหรับภาษารอง ได้แก่ ฮินดี บังคลา มราฐี ทมิฬ และเตลูกู
สลับภาษาอย่างง่ายดายใน Google Maps
Google Assistant และ Discover สามารถเปลี่ยนเป็นภาษาอื่นนอกเหนือจากระบบได้ ทำให้ผู้ใช้สามารถใช้เครื่องมือเหล่านี้ได้ตามต้องการ เนื้อหามากกว่า 50% ใน Google Discover มีการรับชมเป็นภาษาอินเดียในประเทศ และผู้ใช้ Google Assistant หนึ่งในสามใช้เนื้อหานั้นเป็นภาษาอินเดีย
ขณะนี้ความสามารถในการเปลี่ยนภาษาภายในแอปได้ขยายไปยัง Google Maps แล้ว ขณะนี้ผู้ใช้สามารถเปิดแอป ไปที่การตั้งค่า แล้วแตะ "ภาษาของแอป" เพื่อเลือกภาษาได้มากถึงเก้าภาษา ซึ่งจะทำให้ผู้ใช้สามารถค้นหาสถานที่ ขอเส้นทาง และนำทางไปรอบๆ ในภาษาที่ต้องการสำหรับงานนี้ได้ง่ายขึ้น
ช่วยทำการบ้านเป็นภาษาฮินดีผ่าน Google Lens
Google Lens ช่วยให้คุณได้แล้ว แก้ปัญหาคณิตศาสตร์ เพื่อช่วยทำการบ้านของลูกคุณ คุณสามารถถ่ายภาพปัญหาทางคณิตศาสตร์ และดูคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีการแก้ปัญหาได้ แต่คู่มือนี้แสดงเป็นภาษาอังกฤษเป็นหลัก
ขณะนี้ Google กำลังเปิดตัวโซลูชันภาษาฮินดีสำหรับการช่วยทำการบ้านใน Google Lens
MuRIL -- โมเดล AI หลายภาษาที่ช่วยให้ระบบคอมพิวเตอร์เข้าใจภาษาอินเดียในวงกว้าง
การสนทนามากมายเกี่ยวกับศูนย์ AI และการเรียนรู้ของเครื่องเกี่ยวกับการทำความเข้าใจมนุษย์และภาษาของมนุษย์ แต่เมื่อภาษามีรูปแบบเป็นร้อยรูปแบบ การสนทนานี้ก็กลายเป็นงานที่น่าเกรงขาม ยิ่งกว่าที่เป็นอยู่ นี่คือจุดที่ MuRIL เข้ามา
ย่อมาจาก Multilingual Rerestantions for Indian Languages MuRIL เป็นรูปแบบหลายภาษาที่ปรับขนาดตามภาษาต่างๆ เหนือประโยชน์อื่นๆ มันยังให้การสนับสนุนข้อความทับศัพท์ เช่น เมื่อเขียนภาษาฮินดีโดยใช้อักษรโรมัน MuRIL ยังเก่งในการพิจารณาความรู้สึกของประโยคที่ทับศัพท์อีกด้วย MuRIL รองรับภาษาอินเดีย 16 ภาษาและภาษาอังกฤษ ทำให้มีความครอบคลุมสูงสุดสำหรับภาษาอินเดีย ในบรรดารูปแบบอื่นๆ ที่เปิดเผยต่อสาธารณะในประเภทเดียวกัน
MuRIL ได้รับการจัดทำเป็นโอเพ่นซอร์สและพร้อมใช้งานสำหรับ ดาวน์โหลดจาก TensorFlow Hub ฟรี.
เป็นเรื่องดีที่ได้เห็นบริษัทต่างๆ นำทางการสนทนาไปสู่การยอมรับภาษาที่หลากหลายในวงกว้าง เราหวังว่าความพยายามจะดำเนินต่อไปเพื่อจุดประสงค์นี้สำหรับภาษาอื่นๆ และภูมิภาคอื่นๆ เช่นกัน