Google Translate est sur le point de devenir plus utile puisque la société a ajouté la prise en charge de 24 nouvelles langues, le tout grâce à un nouveau modèle monolingue.
Google a annoncé l'ajout de la prise en charge de 24 nouvelles langues dans Google Translate. Les nouvelles langues viennent s’ajouter à la liste déjà longue d’options, et ces langues sont parlées collectivement par plus de 300 millions de personnes.
Les langues nouvellement ajoutées sont celles qui sont gravement mal desservies sur Internet, et Google affirme qu'il est difficile de trouver un texte bilingue incluant ces langues. En tant que tels, les modèles de formation classiques ne fonctionnent pas, car ils prennent en compte la même expression dans deux langues différentes. Ainsi, Google a développé un modèle monolingue qui lui a permis d’ajouter la prise en charge de ces nouvelles langues sans avoir besoin d’un texte équivalent dans une autre langue. La société appelle cela Zero-Shot Machine Translation, et même si cela fonctionne, il n’est pas aussi précis qu’un modèle bilingue le serait seul. À ce titre, Google affirme avoir travaillé avec des locuteurs natifs et des institutions et déterminé que les traductions automatiques étaient de « qualité suffisante » pour être utiles.
Si vous vous demandez quelles sont les nouvelles langues, Google a fourni une liste complète. Ils comprennent:
- Assamais
- Aymara
- Bambara
- Bhojpuri
- Dhivehi
- Dogri
- Éwé
- Guarani
- Ilocano
- Konkani
- Krio
- Kurde (sorani)
- Lingala
- Luganda
- Maïthili
- Meiteilon (Manipuri)
- Mizo
- Oromo
- Quechua
- Sanskrit
- Sepedi
- Tigrinya
- Tsonga
- Twi
Même si certaines de ces langues sont parlées par des millions de personnes, d’autres ne sont pas si courantes. Par exemple, le divehi n'est parlé que par environ 300 000 personnes et le mizo est utilisé par 830 000 personnes dans le nord-est de l'Inde. Cela devrait être un bon indicateur de la réussite technique que représente l’ajout de ces langues à Google Translate. Avec ces 24 ajouts, Google Translate prend désormais en charge 133 langues au total.
Les 24 nouvelles langues devraient être disponibles à partir d'aujourd'hui, et Google affirme qu'il continuera à améliorer les modèles au fil du temps pour rendre la traduction plus précise et plus fiable. L'entreprise a également partagé un aperçu de la façon dont le modèle d'IA a été développé si vous souhaitez en savoir plus sur la façon dont cela est né.