Google se concentre sur les langues indiennes avec un changement de langue facile dans Maps, des bascules de recherche bilingues, etc.

Lors de l'événement virtuel Google L10n, Google a manifesté un regain d'intérêt pour les langues indiennes avec des changements qui plaisent aux multilingues en Inde.

L'Inde est le pays aux cent langues, un endroit où le dialecte change tous les 100 km. Dans un monde technologique dominé par l’anglais, ces langues et dialectes locaux se trouvent incapables de donner accès à des expériences significatives sur Internet. Lors de l'événement virtuel Google L10n d'aujourd'hui, Google permet aux utilisateurs multilingues en Inde de vivre plus facilement des expériences enrichissantes en Inde. avec des changements de langue faciles pour la recherche Google, un meilleur affichage des résultats bilingues dans la recherche Google, un changement de langue facile dans Google Maps, aide aux devoirs en hindi via Google Lens et un modèle d'IA multilingue appelé MuRIL pour permettre aux ordinateurs de comprendre plus facilement divers langage humain.

Arrière-plan

Avant d’en venir aux annonces, voici quelques éléments de contexte pour expliquer le contexte à notre public international. UN

une grande partie de l'Inde est bilingue et multilingue, l'anglais étant la langue maternelle de seulement 0,02 % de la vaste population indienne de plus de 1,2 milliard d'habitants. Seulement 10,6 % de la population totale parle anglais. En revanche, 43,63 % de la population parle l'hindi comme première langue, tandis que 57,1 % peuvent parler l'hindi dans l'ensemble (bien que celui-ci soit divisé en différents sous-dialectes). D'autres langues suivent, mais dans des pourcentages plus faibles: le bengali, le marathi et le telugu avec respectivement 8,9 %, 8,2 % et 7,8 %. En bref, le fait de concentrer la technologie autour de l'anglais comme seul moyen d'accès éloigne la technologie d'un très grand nombre de personnes. des utilisateurs qui autrement trouveraient la technologie absolument utile - et qui en ont peut-être encore plus besoin que ceux qui ont déjà accès à la technologie dans d'autres façons.

Comme je l'ai noté dans mon Examen de Google Nest Audio, même quelque chose comme un haut-parleur intelligent est moins utile dans une configuration multilingue que dans un foyer anglophone. Les commandes dans des langues mixtes ne sont pas très bien reconnues (comme une commande principalement anglaise avec quelques mots hindi), et la configuration les langues bilingues sont encore limitées à certaines combinaisons (L'hindi + l'ourdou, ou deux langues indiennes ne constituent pas une combinaison valide, mais l'hindi + l'anglais l'est). La situation est meilleure qu’elle ne l’était il y a quelques années à peine, mais il reste encore beaucoup à faire pour l’améliorer.

Et Google le sait, car il constitue la base de les annonces d'aujourd'hui lors de l'événement L10n (une abréviation ludique pour Localisation, avec 10 lettres entre L et n).

Annonces lors de l'événement Google L10n 2020

Basculement facile entre les résultats en anglais et en indien dans la recherche Google

Google offre la possibilité de basculer rapidement entre les résultats en anglais et en hindi via une puce/un onglet dans la recherche Google, dans les États indiens comptant une importante population parlant hindi. Cette puce a multiplié par 10 l'augmentation des requêtes en hindi en Inde.

La même chose est maintenant étendue à davantage de langues indiennes. La recherche Google offrira désormais la possibilité de basculer les résultats entre l'anglais et le tamoul/telugu/bangla/marathi.

Meilleur affichage des résultats bilingues dans la recherche Google

Les utilisateurs en Inde, moi y compris, préfèrent taper des choses en anglais même si les résultats sont attendus dans une langue locale. En fait, la translittération de l’hindi vers l’anglais a donné naissance au Hinglish, qui est l’hindi écrit avec l’alphabet anglais.

La recherche Google vient à la rescousse de ces bilingues pour leurs requêtes de recherche. Au cours du mois prochain, la recherche commencera à afficher du contenu pertinent dans les langues indiennes prises en charge, le cas échéant, même si la requête a été translittéré en anglais, donnant lieu à des résultats de recherche bilingues dans davantage de langues en plus de l'anglais comme langue principale. Les langues indiennes prises en charge pour le secondaire sont l'hindi, le bangla, le marathi, le tamoul et le telugu.

Changement de langue facile dans Google Maps

Google Assistant et Discover ont la possibilité de passer à une langue différente de celle du système, permettant aux utilisateurs d'utiliser ces outils selon leurs préférences spécifiques. Plus de 50 % du contenu de Google Discover est consulté dans les langues indiennes du pays, et un tiers des utilisateurs de Google Assistant l'utilisent dans une langue indienne.

La possibilité de changer de langue au sein de l'application est désormais étendue à Google Maps. Les utilisateurs peuvent désormais simplement ouvrir l'application, accéder à Paramètres et appuyer sur « Langue de l'application » pour sélectionner jusqu'à neuf langues. Cela permettra aux utilisateurs de rechercher plus facilement des lieux, d'obtenir un itinéraire et de naviguer dans leur langue préférée pour cette tâche.

Aide aux devoirs en hindi via Google Lens

Google Lens vous permet déjà de résoudre des problèmes de mathématiques pour aider aux devoirs de votre enfant. Vous pouvez prendre une photo d'un problème mathématique et voir un guide étape par étape sur la façon de le résoudre. Mais ce guide a été principalement affiché en anglais.

Google introduit désormais des solutions en hindi pour l'aide aux devoirs dans Google Lens.

MuRIL – le modèle d'IA multilingue pour aider les systèmes informatiques à comprendre les langues indiennes à grande échelle

Une grande partie des discussions autour de l’IA et de l’apprentissage automatique portent sur la compréhension des humains et du langage humain. Mais lorsque les langues prennent cent formes, cette conversation se transforme en une tâche formidable, plus encore qu’elle ne l’était déjà. C'est là qu'intervient MuRIL.

Abréviation de Représentations multilingues pour les langues indiennes, MuRIL est un modèle multilingue qui s'adapte à toutes les langues. Entre autres avantages, il prend également en charge le texte translittéré, par exemple lors de l'écriture de l'hindi en utilisant l'écriture romaine. MuRIL est également efficace pour déterminer le sentiment des phrases translittérées. MuRIL prend en charge 16 langues indiennes ainsi que l'anglais, ce qui lui confère la couverture la plus élevée des langues indiennes parmi tous les autres modèles de ce type accessibles au public.

MuRIL a été rendu open source et est disponible pour télécharger depuis le hub TensorFlow gratuitement.


C'est formidable de voir des entreprises orienter les conversations vers une acceptation plus large de diverses langues. Nous espérons que les efforts se poursuivront dans ce sens pour d’autres langues et d’autres régions également.