Google Translate staat op het punt nuttiger te worden omdat het bedrijf ondersteuning voor 24 nieuwe talen heeft toegevoegd, allemaal dankzij een nieuw eentalig model.
Google heeft aangekondigd dat het ondersteuning toevoegt voor 24 nieuwe talen in Google Translate. De nieuwe talen voegen zich bij de toch al grote lijst met opties, en deze talen worden gezamenlijk door meer dan 300 miljoen mensen gesproken.
De nieuw toegevoegde talen zijn talen die ernstig onderbediend zijn op internet, en Google zegt dat het moeilijk is om tweetalige tekst te vinden waarin deze talen voorkomen. Als zodanig werken typische trainingsmodellen niet, omdat ze rekening houden met dezelfde uitdrukking in twee verschillende talen. Als zodanig ontwikkelde Google een eentalig model waarmee het ondersteuning voor deze nieuwe talen kon toevoegen zonder dat er gelijkwaardige tekst in een andere taal nodig was. Het bedrijf noemt dit Zero-Shot Machine Translation, en hoewel het werkt, is het niet zo nauwkeurig als een tweetalig model op zichzelf zou zijn. Daarom zegt Google dat het met moedertaalsprekers en instellingen heeft samengewerkt en heeft vastgesteld dat de geautomatiseerde vertalingen van "voldoende kwaliteit" waren om bruikbaar te zijn.
Als je je afvraagt wat de nieuwe talen zijn: Google heeft een volledige lijst verstrekt. Ze bevatten:
- Assamees
- Aymara
- Bambara
- Bhojpuri
- Divehi
- Dogri
- Ooi
- Guarani
- Ilocano
- Konkani
- Krio
- Koerdisch (Sorani)
- Lingala
- Luganda
- Maithili
- Meiteilon (Manipuri)
- Mizo
- Oromo
- Quechua
- Sanskriet
- Sepedi
- Tigrinya
- Tsonga
- Twee
Hoewel sommige van deze talen door miljoenen mensen worden gesproken, zijn sommige niet zo gebruikelijk. Dhivehi wordt bijvoorbeeld slechts door ongeveer 300.000 mensen gesproken, en Mizo wordt door 830.000 mensen in Noordoost-India gebruikt. Dat zou een goede indicatie moeten zijn van de technische prestatie die het kost om deze talen aan Google Translate toe te voegen. Met deze 24 toevoegingen ondersteunt Google Translate nu in totaal 133 talen.
Alle 24 nieuwe talen zouden vanaf vandaag beschikbaar moeten zijn, en Google zegt dat het de modellen in de loop van de tijd zal blijven verbeteren om de vertalingen nauwkeuriger en betrouwbaarder te maken. Het bedrijf deelde ook enig inzicht in hoe het AI-model is ontwikkeld als je meer wilt weten over hoe het tot stand is gekomen.