Google berfokus pada bahasa India dengan peralihan bahasa yang mudah di Maps, peralihan Penelusuran bilingual, dan banyak lagi

Pada acara virtual Google L10n, Google telah menunjukkan fokus baru pada bahasa India dengan perubahan yang menarik bagi multibahasa di India.

India adalah negeri dengan seratus bahasa, tempat dialek berubah setiap 100 km. Di dunia teknologi yang didominasi oleh bahasa Inggris, bahasa dan dialek lokal ini tidak mampu memberikan akses terhadap pengalaman bermakna di Internet. Pada acara virtual Google L10n hari ini, Google mempermudah pengguna multibahasa di India untuk memperkaya pengalaman di India dengan peralihan bahasa yang mudah untuk Google Penelusuran, hasil bilingual yang lebih baik muncul di Google Penelusuran, peralihan bahasa yang mudah di Google Maps, bantuan pekerjaan rumah dalam bahasa Hindi melalui Google Lens, dan model AI multibahasa yang disebut MuRIL untuk memudahkan komputer memahami beragam bahasa bahasa manusia.

Latar belakang

Sebelum sampai pada pengumumannya, berikut beberapa latar belakang untuk menjelaskan konteksnya kepada audiens internasional. A sebagian besar wilayah India adalah bilingual dan multibahasa

, dengan bahasa Inggris sebagai bahasa pertama bagi hanya 0,02% dari populasi India yang berjumlah lebih dari 1,2 miliar orang. Hanya 10,6% dari total penduduk yang bisa berbahasa Inggris. Sebaliknya, 43,63% penduduk menggunakan bahasa Hindi sebagai bahasa pertama mereka, sementara 57,1% dapat berbicara bahasa Hindi secara keseluruhan (walaupun bahasa ini dibagi menjadi sub-dialek yang berbeda). Bahasa-bahasa lain menyusul, namun dalam persentase yang lebih kecil — Bengali, Marathi, dan Telugu masing-masing sebesar 8,9%, 8,2%, dan 7,8%. Kelebihan dan kekurangannya adalah memfokuskan teknologi pada bahasa Inggris sebagai satu-satunya media akses yang menjauhkan teknologi dari sejumlah besar bahasa. pengguna yang menganggap teknologi ini benar-benar berguna -- dan mungkin lebih membutuhkannya dibandingkan mereka yang sudah memiliki akses ke teknologi tersebut di negara lain. cara.

Seperti yang saya catat di saya Ulasan Google Nest Audio, bahkan sesuatu seperti speaker pintar menawarkan lebih sedikit penggunaan dalam pengaturan multibahasa dibandingkan dengan rumah tangga berbahasa Inggris. Perintah dalam bahasa campuran tidak dikenali dengan baik (seperti perintah bahasa Inggris dengan beberapa kata Hindi), dan pengaturannya bahasa bilingual masih terbatas pada beberapa kombinasi (Bahasa Hindi + Urdu, atau dua bahasa India mana pun bukanlah kombinasi yang valid, namun bahasa Hindi + Inggris adalah kombinasi yang valid). Situasinya lebih baik dibandingkan beberapa tahun yang lalu, namun masih ada jalan yang bisa ditempuh untuk melakukan perbaikan.

Dan Google mengetahui hal ini, menjadi basisnya pengumuman hari ini di acara L10n (singkatan lucu untuk Lokalisasi, dengan 10 huruf antara L dan n).

Pengumuman di Acara Google L10n 2020

Beralih dengan mudah antara hasil bahasa Inggris dan India di Google Penelusuran

Google telah menawarkan kemampuan untuk bertukar dengan cepat antara hasil dalam bahasa Inggris dan Hindi melalui chip/tab di Google Penelusuran, di negara bagian India dengan populasi berbahasa Hindi yang signifikan. Chip ini meningkatkan peningkatan kueri bahasa Hindi sebesar 10x di India.

Hal yang sama kini diperluas ke lebih banyak bahasa India. Google Penelusuran kini juga menawarkan kemampuan untuk mengalihkan hasil antara bahasa Inggris dan Tamil/Telugu/Bangla/Marathi.

Hasil Bilingual yang lebih baik muncul di Google Penelusuran

Pengguna di India, termasuk saya sendiri, lebih memilih mengetik sesuatu dalam bahasa Inggris meskipun hasilnya diharapkan dalam bahasa lokal. Faktanya, transliterasi bahasa Hindi ke bahasa Inggris telah memunculkan Hinglish, yaitu bahasa Hindi yang ditulis dengan alfabet Inggris.

Google Penelusuran hadir untuk menyelamatkan para bilingual tersebut untuk kueri Penelusuran mereka. Selama bulan depan, Penelusuran akan mulai menampilkan konten relevan dalam bahasa India yang didukung jika diperlukan, meskipun kueri sudah melakukannya telah ditransliterasikan ke dalam bahasa Inggris, sehingga memunculkan hasil pencarian bilingual di lebih banyak bahasa selain bahasa Inggris sebagai bahasa utama. Bahasa India yang didukung untuk tingkat menengah adalah Hindi, Bangla, Marathi, Tamil, dan Telugu.

Peralihan bahasa dengan mudah di Google Maps

Asisten Google dan Discover memiliki kemampuan untuk beralih ke bahasa yang berbeda dari bahasa sistem, sehingga pengguna dapat menggunakan alat ini sesuai preferensi spesifik mereka. Lebih dari 50% konten di Google Discover dilihat dalam bahasa India di negara tersebut, dan sepertiga pengguna Asisten Google menggunakannya dalam bahasa India.

Kemampuan untuk mengubah bahasa dalam aplikasi kini diperluas ke Google Maps. Pengguna kini cukup membuka aplikasi, membuka Pengaturan, dan mengetuk "Bahasa Aplikasi" untuk memilih hingga sembilan bahasa. Hal ini akan memudahkan pengguna untuk mencari tempat, mendapatkan petunjuk arah, dan bernavigasi dalam bahasa pilihan mereka untuk tugas ini.

Bantuan pekerjaan rumah dalam bahasa Hindi melalui Google Lens

Google Lens sudah mengizinkan Anda melakukannya memecahkan masalah matematika untuk membantu pekerjaan rumah anak Anda. Anda dapat mengambil foto soal matematika, dan diperlihatkan panduan langkah demi langkah tentang cara menyelesaikannya. Namun panduan ini sebagian besar ditampilkan dalam bahasa Inggris.

Google kini memperkenalkan solusi bahasa Hindi untuk bantuan pekerjaan rumah di Google Lens.

MuRIL -- model AI multibahasa untuk membantu sistem komputer memahami bahasa India dalam skala besar

Banyak perbincangan seputar AI dan pembelajaran mesin berpusat pada pemahaman manusia dan bahasa manusia. Namun ketika bahasa mempunyai ratusan bentuk, percakapan ini menjadi tugas yang berat, lebih dari sebelumnya. Di sinilah MuRIL berperan.

Kependekan dari Multilingual Represtantions for Indian Languages, MuRIL adalah model multibahasa yang mencakup berbagai bahasa. Manfaat lainnya, juga memberikan dukungan untuk teks transliterasi seperti saat menulis bahasa Hindi menggunakan aksara Romawi. MuRIL juga pandai menentukan sentimen kalimat yang ditransliterasi. MuRIL mendukung 16 bahasa India dan juga bahasa Inggris, sehingga memberikan cakupan bahasa India tertinggi di antara model sejenis lainnya yang tersedia untuk umum.

MuRIL telah dijadikan sumber terbuka dan tersedia untuk unduh dari TensorFlow Hub gratis.


Sangat menyenangkan melihat perusahaan mengarahkan percakapan ke arah penerimaan yang lebih luas terhadap beragam bahasa. Kami berharap upaya ini terus berlanjut untuk bahasa lain dan wilayah lain juga.