Google은 지도의 쉬운 언어 전환, 이중 언어 검색 전환 등을 통해 인도어에 중점을 둡니다.

Google L10n 가상 이벤트에서 Google은 인도의 다국어 사용자의 관심을 끄는 변화를 통해 인도어에 대한 새로운 초점을 보여주었습니다.

인도는 100km마다 방언이 바뀌는 100개 언어의 땅입니다. 영어가 지배하는 기술 세계에서 이러한 현지 언어와 방언은 인터넷에서 의미 있는 경험에 대한 접근을 제공할 수 없다는 것을 알게 됩니다. 오늘 Google L10n 가상 이벤트에서 Google은 인도의 다국어 사용자가 인도에서 더욱 풍부한 경험을 누릴 수 있도록 지원하고 있습니다. Google 검색의 쉬운 언어 전환, Google 검색의 향상된 이중 언어 결과 표시, Google 지도의 쉬운 언어 전환, Google Lens를 통한 힌디어 숙제 도우미와 MuRIL이라는 다국어 AI 모델을 통해 컴퓨터가 다양한 내용을 더 쉽게 이해할 수 있습니다. 인간의 언어.

배경

발표에 앞서 전 세계 청중에게 상황을 설명하기 위한 몇 가지 배경 정보가 있습니다. ㅏ 인도의 큰 덩어리는 이중 언어와 다국어를 사용합니다., 영어는 12억 명이 넘는 인도의 방대한 인구 중 0.02%만이 모국어로 사용하고 있습니다. 전체 인구의 10.6%만이 영어를 구사할 수 있습니다. 대조적으로, 인구의 43.63%가 힌디어를 모국어로 사용하는 반면, 57.1%는 전체적으로 힌디어를 말할 수 있습니다(다양한 하위 방언으로 나누어져 있음). 다른 언어도 뒤따르지만 그 비율은 더 낮습니다. 벵골어, 마라티어, 텔루구어는 각각 8.9%, 8.2%, 7.8%입니다. 장단점은 유일한 액세스 매체 게이트로서 영어를 중심으로 기술에 초점을 맞추면 기술이 매우 많은 수의 언어에서 멀리 떨어져 있다는 것입니다. 그렇지 않으면 기술이 절대적으로 유용하다고 생각하는 사용자 - 아마도 다른 분야에서 이미 기술에 액세스할 수 있는 사용자보다 더 필요할 수도 있습니다. 방법.

내가 내에서 언급했듯이 Google Nest 오디오 검토, 스마트 스피커와 같은 것조차도 영어를 사용하는 가정에서와 마찬가지로 다국어 설정에서는 덜 사용됩니다. 혼합 언어로 된 명령은 잘 인식되지 않습니다(주로 일부 힌디어 단어가 포함된 영어 명령).

이중 언어는 여전히 일부 조합으로 제한됩니다. (힌디어 + 우르두어 또는 두 인도어는 유효한 조합이 아니지만 힌디어 + 영어는 유효한 조합입니다). 상황은 몇 년 전보다 나아졌지만 여전히 개선할 여지가 남아 있습니다.

그리고 Google은 이를 알고 오늘 L10n 행사 발표 (Localization의 재미있는 약어이며 L과 n 사이에 10개의 문자가 있습니다).

Google L10n 이벤트 2020 공지사항

Google 검색에서 영어와 인도어 결과 간에 쉽게 전환 가능

Google은 힌디어를 사용하는 인구가 많은 인도 주에서 Google 검색의 칩/탭을 통해 영어와 힌디어 결과 간에 빠르게 전환할 수 있는 기능을 제공해 왔습니다. 이 칩은 인도에서 힌디어 검색어를 10배 증가시켰습니다.

이제 동일한 내용이 더 많은 인도 언어로 확장되고 있습니다. 이제 Google 검색에서는 영어와 타밀어/텔루구어/방글라어/마라티어 간에 결과를 전환하는 기능도 제공합니다.

Google 검색에 더 나은 이중 언어 결과 표시

나를 포함한 인도의 사용자들은 결과가 현지 언어로 예상되더라도 영어로 입력하는 것을 선호합니다. 실제로 힌디어를 영어로 음역하면 영어 알파벳으로 작성된 힌디어인 Hinglish가 탄생했습니다.

Google 검색은 검색어에 대해 이러한 이중 언어 사용자를 구출하고 있습니다. 다음 달에는 검색어에 다음이 포함된 경우에도 검색에서 적절한 경우 지원되는 인도 언어로 관련 콘텐츠를 표시하기 시작할 것입니다. 영어로 음역되어 기본 언어인 영어 외에 더 많은 언어에 대한 이중 언어 검색 결과가 표시됩니다. 보조 언어로 지원되는 인도어는 힌디어, 방글라어, 마라티어, 타밀어, 텔루구어입니다.

Google 지도에서 쉽게 언어 전환

Google 어시스턴트와 Discover에는 시스템과 다른 언어로 전환할 수 있는 기능이 있어 사용자는 특정 선호도에 따라 이러한 도구를 사용할 수 있습니다. Google Discover 콘텐츠의 50% 이상이 해당 국가에서 인도어로 표시되며, Google 어시스턴트 사용자의 3분의 1이 인도어로 콘텐츠를 사용하고 있습니다.

이제 앱 내에서 언어를 변경하는 기능이 Google 지도로 확장되었습니다. 이제 사용자는 앱을 열고 설정으로 이동한 후 '앱 언어'를 탭하여 최대 9개 언어 중에서 선택할 수 있습니다. 이를 통해 사용자는 이 작업에 대해 더 쉽게 장소를 검색하고, 길을 찾고, 원하는 언어로 탐색할 수 있습니다.

Google Lens를 통한 힌디어 숙제 도움말

Google 렌즈에서는 이미 다음을 수행할 수 있습니다. 수학 문제를 해결하다 아이의 숙제를 도와주기 위해. 수학 문제의 사진을 찍고 문제 해결 방법에 대한 단계별 가이드를 볼 수 있습니다. 하지만 이 가이드는 주로 영어로 표시되었습니다.

Google은 이제 Google Lens에 숙제 도움말을 위한 힌디어 솔루션을 도입합니다.

MuRIL - 컴퓨터 시스템이 인도어를 대규모로 이해할 수 있도록 돕는 다국어 AI 모델

AI와 머신러닝에 관한 많은 대화는 인간과 인간의 언어를 이해하는 데 중점을 두고 있습니다. 그러나 언어가 수백 가지 형태를 취하게 되면, 이 대화는 이미 그랬던 것보다 훨씬 더 엄청난 일로 부풀어 오른다. 이것이 바로 MuRIL이 등장하는 곳입니다.

Multilingual Represtantions for Indian Languages의 약자인 MuRIL은 여러 언어로 확장되는 다국어 모델입니다. 다른 이점 중에서도 로마자 스크립트를 사용하여 힌디어를 작성할 때와 같이 음역된 텍스트에 대한 지원도 제공합니다. MuRIL은 음역된 문장의 감정을 파악하는 데에도 능숙합니다. MuRIL은 영어뿐만 아니라 16개의 인도어를 지원하므로 공개적으로 사용 가능한 동종 모델 중 인도어에 대한 적용 범위가 가장 높습니다.

MuRIL은 오픈 소스로 만들어졌으며 다음에서 사용할 수 있습니다. TensorFlow Hub에서 다운로드 무료로.


기업들이 다양한 언어를 더 폭넓게 수용하는 방향으로 대화를 이끌어가는 모습을 보는 것은 좋은 일입니다. 이를 위한 노력이 다른 언어와 다른 지역에서도 계속되기를 바랍니다.