No evento virtual Google L10n, o Google mostrou foco renovado nas línguas índicas com mudanças que atraem os multilíngues na Índia.
A Índia é a terra das cem línguas, um lugar onde o dialeto muda a cada 100 km. Num mundo tecnológico dominado pelo inglês, estas línguas e dialetos locais encontram-se incapazes de fornecer acesso a experiências significativas na Internet. No evento virtual Google L10n de hoje, o Google está tornando mais fácil para usuários multilíngues na Índia terem experiências enriquecedoras na Índia com alternância fácil de idioma para a Pesquisa Google, melhor exibição de resultados bilíngues na Pesquisa Google, alternância fácil de idioma no Google Maps, ajuda com o dever de casa em hindi por meio do Google Lens e um modelo de IA multilíngue chamado MuRIL para tornar mais fácil para os computadores entenderem diversas linguagem humana.
Fundo
Antes de passar aos anúncios, aqui estão alguns antecedentes para explicar o contexto ao nosso público internacional. A grande parte da Índia é bilíngue e multilíngue
, sendo o inglês a primeira língua de apenas 0,02% da vasta população da Índia, de mais de 1,2 mil milhões de pessoas. Apenas 10,6% da população total fala inglês. Em contraste, 43,63% da população fala hindi como primeira língua, enquanto 57,1% pode falar hindi em geral (embora este esteja dividido em diferentes subdialetos). Seguem-se outras línguas, mas em percentagens menores – bengali, marata e telugu em 8,9%, 8,2% e 7,8%, respetivamente. Resumindo, focar a tecnologia no inglês como o único meio de acesso mantém a tecnologia longe de um grande número de usuários que de outra forma achariam a tecnologia absolutamente útil - e talvez precisem dela ainda mais do que aqueles que já têm acesso à tecnologia em outros caminhos.Como observei em meu Análise do Google Nest Audio, mesmo algo como um alto-falante inteligente oferece menos utilidade em uma configuração multilíngue do que em uma casa onde se fala inglês. Comandos em idiomas mistos não são tão bem reconhecidos (como um comando principalmente em inglês com algumas palavras em hindi) e a configuração idiomas bilíngues ainda está limitado a algumas combinações (Hindi + Urdu ou quaisquer duas línguas índicas não são uma combinação válida, mas Hindi + Inglês é). A situação é melhor do que era há poucos anos, mas ainda há um caminho justo a percorrer para melhorias.
E o Google sabe disso, formando a base para anúncios de hoje no evento L10n (uma abreviatura lúdica para Localização, com 10 letras entre L e n).
Anúncios no evento Google L10n 2020
Alternância fácil entre resultados em inglês e indiano na Pesquisa Google
O Google oferece a capacidade de alternar rapidamente entre resultados em inglês e hindi por meio de um chip/guia na Pesquisa Google, em estados indianos com uma população significativa de língua hindi. Esse chip aumentou em 10 vezes o aumento nas consultas em hindi na Índia.
O mesmo está agora a ser expandido para mais línguas índicas. A Pesquisa Google agora oferecerá a capacidade de alternar resultados entre inglês e Tamil/Telugu/Bangla/Marathi também.
Melhor resultado bilíngue aparecendo na Pesquisa Google
Os usuários na Índia, inclusive eu, preferem digitar coisas em inglês, mesmo que os resultados sejam esperados em um idioma local. Na verdade, a transliteração do Hindi para o Inglês deu origem ao Hinglish, que é o Hindi escrito com o alfabeto inglês.
A Pesquisa Google está resgatando esses bilíngues em suas consultas de pesquisa. No próximo mês, a Pesquisa começará a exibir conteúdo relevante nos idiomas indianos suportados, quando apropriado, mesmo que a consulta tenha foi transliterado para o inglês, dando origem a resultados de pesquisa bilíngues em mais idiomas além do inglês como principal. Os idiomas indianos suportados para o ensino secundário são Hindi, Bangla, Marathi, Tamil e Telugu.
Mudança fácil de idioma no Google Maps
O Google Assistant e o Discover têm a capacidade de mudar para um idioma diferente do sistema, permitindo que os usuários usem essas ferramentas de acordo com suas preferências específicas. Mais de 50% do conteúdo do Google Discover é visualizado nos idiomas indianos do país, e um terço dos usuários do Google Assistente o usa em um idioma indiano.
A capacidade de alterar o idioma no aplicativo agora está sendo estendida ao Google Maps. Os usuários agora podem simplesmente abrir o aplicativo, acessar Configurações e tocar em “Idioma do aplicativo” para selecionar até nove idiomas. Isso tornará mais fácil para os usuários pesquisar lugares, obter rotas e navegar no idioma de sua preferência para esta tarefa.
Ajuda com lição de casa em hindi por meio do Google Lens
O Google Lens já permite que você resolver problemas de matemática para ajudar com a lição de casa do seu filho. Você pode tirar uma foto de um problema de matemática e ver um guia passo a passo sobre como resolvê-lo. Mas este guia foi exibido principalmente em inglês.
O Google agora está apresentando soluções em hindi para ajuda com a lição de casa no Google Lens.
MuRIL – o modelo de IA multilíngue para ajudar os sistemas de computador a compreender as línguas indianas em grande escala
Grande parte da conversa sobre IA e aprendizado de máquina gira em torno da compreensão dos humanos e da linguagem humana. Mas quando as línguas assumem centenas de formas, esta conversa torna-se numa tarefa formidável, mais do que já era. É aqui que entra o MuRIL.
Abreviação de Representações Multilíngues para Línguas Indianas, MuRIL é um modelo multilíngue que se adapta a vários idiomas. Entre outros benefícios, também oferece suporte para texto transliterado, como ao escrever hindi usando a escrita romana. MuRIL também é bom para determinar o sentimento de frases transliteradas. MuRIL oferece suporte a 16 idiomas indianos, além do inglês, proporcionando a maior cobertura para idiomas indianos entre qualquer outro modelo desse tipo disponível publicamente.
MuRIL tornou-se de código aberto e está disponível para baixar do TensorFlow Hub de graça.
É ótimo ver as empresas direcionarem as conversas para uma aceitação mais ampla de diversos idiomas. Esperamos que os esforços continuem neste sentido para outras línguas e também para outras regiões.