Google richt zich op Indische talen met eenvoudige taalwisseling in Maps, tweetalige zoekschakelaars en meer

click fraud protection

Tijdens het virtuele Google L10n-evenement heeft Google een hernieuwde focus getoond op Indische talen, met veranderingen die meertaligen in India aanspreken.

India is het land van honderd talen, een plaats waar het dialect elke 100 km verandert. In een door Engels gedomineerde technische wereld zijn deze lokale talen en dialecten niet in staat toegang te bieden tot betekenisvolle ervaringen op internet. Tijdens het virtuele Google L10n-evenement van vandaag maakt Google het voor meertalige gebruikers in India gemakkelijker om verrijkende ervaringen te hebben in India met eenvoudige taalwisselingen voor Google Zoeken, betere tweetalige zoekresultaten in Google Zoeken, eenvoudige taalwisseling in Google Maps, huiswerkhulp in het Hindi via Google Lens, en een meertalig AI-model genaamd MuRIL om het voor computers gemakkelijker te maken om diverse menselijke taal.

Achtergrond

Voordat we naar de aankondigingen gaan, volgt hier wat achtergrondinformatie om de context aan ons internationale publiek uit te leggen. A

Een groot deel van India is tweetalig en meertalig, waarbij Engels de eerste taal is van slechts 0,02% van India's enorme bevolking van meer dan 1,2 miljard mensen. Slechts 10,6% van de totale bevolking spreekt Engels. Daarentegen spreekt 43,63% van de bevolking Hindi als hun eerste taal, terwijl 57,1% in het algemeen Hindi spreekt (hoewel dit is onderverdeeld in verschillende subdialecten). Andere talen volgen, maar in kleinere percentages: Bengaals, Marathi en Telugu in respectievelijk 8,9%, 8,2% en 7,8%. Het komt erop neer dat het concentreren van de technologie rond het Engels als het enige toegangsmedium de technologie weghoudt van een zeer groot aantal gebruikers die de technologie anders absoluut nuttig zouden vinden - en deze misschien zelfs meer nodig hebben dan degenen die al toegang hebben tot de technologie in andere manieren.

Zoals ik in mijn Google Nest Audio-recensie, zelfs zoiets als een slimme luidspreker biedt minder nut in een meertalige opstelling dan in een Engelssprekend huishouden. Commando's in gemengde talen worden niet zo goed herkend (zoals een voornamelijk Engels commando met enkele Hindi-woorden) en ingesteld tweetalige talen is nog steeds beperkt tot enkele combinaties (Hindi + Urdu, of twee Indische talen zijn geen geldige combinatie, maar Hindi + Engels wel). De situatie is beter dan enkele jaren geleden, maar er is nog steeds een redelijke weg te gaan naar verbeteringen.

En Google weet dit en vormt de basis voor de aankondigingen van vandaag op het L10n-evenement (een speelse afkorting voor Localization, met 10 letters tussen L en n).

Aankondigingen op Google L10n Event 2020

Gemakkelijk schakelen tussen Engelse en Indiase taalresultaten in Google Zoeken

Google biedt de mogelijkheid om snel te wisselen tussen resultaten in het Engels en Hindi via een chip/tabblad in Google Zoeken, in Indiase staten met een aanzienlijke Hindi-sprekende bevolking. Deze chip verhoogde de toename van het aantal Hindi-zoekopdrachten met een factor 10 in India.

Hetzelfde wordt nu uitgebreid naar meer Indische talen. Google Zoeken biedt nu ook de mogelijkheid om de resultaten te schakelen tussen Engels en Tamil/Telugu/Bangla/Marathi.

Betere tweetalige resultaten verschijnen in Google Zoeken

Gebruikers in India, inclusief mijzelf, geven er de voorkeur aan dingen in het Engels te typen, zelfs als de resultaten in een lokale taal worden verwacht. In feite heeft de transliteratie van het Hindi naar het Engels aanleiding gegeven tot Hinglish, Hindi geschreven met het Engelse alfabet.

Google Zoeken komt dergelijke tweetaligen te hulp voor hun zoekopdrachten. De komende maand zal Search, indien nodig, relevante inhoud in ondersteunde Indiase talen gaan tonen, zelfs als de zoekopdracht dat wel doet zijn naar het Engels getranscribeerd, waardoor tweetalige zoekresultaten in meer talen ontstonden, naast Engels als primaire taal. Ondersteunde Indiase talen voor het middelbaar onderwijs zijn Hindi, Bangla, Marathi, Tamil en Telugu.

Gemakkelijk van taal wisselen in Google Maps

Google Assistant en Discover hebben de mogelijkheid om over te schakelen naar een andere taal dan het systeem, waardoor gebruikers deze tools naar eigen voorkeur kunnen gebruiken. Meer dan 50% van de inhoud van Google Discover wordt in het land in Indiase talen bekeken en een derde van de Google Assistent-gebruikers gebruikt de inhoud in een Indiase taal.

De mogelijkheid om binnen de app van taal te veranderen wordt nu uitgebreid naar Google Maps. Gebruikers kunnen nu eenvoudig de app openen, naar Instellingen gaan en op ‘App-taal’ tikken om uit maximaal negen talen te kiezen. Dit maakt het voor gebruikers gemakkelijker om naar plaatsen te zoeken, routebeschrijvingen op te vragen en rond te navigeren in de taal van hun voorkeur voor deze taak.

Huiswerkhulp in het Hindi via Google Lens

Met Google Lens is dit al mogelijk wiskundeproblemen oplossen om te helpen met het huiswerk van uw kind. U kunt een foto maken van een wiskundig probleem en stapsgewijze instructies krijgen over hoe u dit probleem kunt oplossen. Maar deze gids is voornamelijk in het Engels weergegeven.

Google introduceert nu Hindi-oplossingen voor huiswerkhulp in Google Lens.

MuRIL – het meertalige AI-model dat computersystemen helpt Indiase talen op grote schaal te begrijpen

Een groot deel van het gesprek rond AI en machine learning gaat over het begrijpen van mensen en menselijke taal. Maar wanneer talen honderd vormen aannemen, groeit dit gesprek uit tot een formidabele taak, meer nog dan het al was. Dit is waar MuRIL in beeld komt.

MuRIL is een afkorting van Multilingual Represtantions for Indian Languages ​​en is een meertalig model dat over verschillende talen schaalt. Naast andere voordelen biedt het ook ondersteuning voor getranslitereerde tekst, bijvoorbeeld bij het schrijven van Hindi met het Romeinse schrift. MuRIL is ook goed in het bepalen van het sentiment van getranscribeerde zinnen. MuRIL ondersteunt 16 Indiase talen en Engels, waardoor het de hoogste dekking voor Indiase talen heeft van alle andere openbaar beschikbare modellen in zijn soort.

MuRIL is open-source gemaakt en beschikbaar voor downloaden van de TensorFlow Hub gratis.


Het is geweldig om te zien dat bedrijven gesprekken sturen in de richting van een bredere acceptatie van diverse talen. We hopen dat de inspanningen op dit gebied ook voor andere talen en andere regio's zullen worden voortgezet.