Google koncentruje się na językach indyjskich, oferując łatwą zmianę języka w Mapach, dwujęzyczne przełączniki wyszukiwania i nie tylko

click fraud protection

Podczas wirtualnego wydarzenia Google L10n firma Google ponownie skupiła się na językach indyjskich, wprowadzając zmiany atrakcyjne dla osób wielojęzycznych w Indiach.

Indie to kraina stu języków, miejsce, w którym dialekt zmienia się co 100 km. W świecie technologii zdominowanym przez język angielski te lokalne języki i dialekty nie są w stanie zapewnić dostępu do znaczących doświadczeń w Internecie. Podczas dzisiejszego wirtualnego wydarzenia Google L10n Google ułatwia wielojęzycznym użytkownikom w Indiach wzbogacanie doświadczeń w Indiach z łatwym przełączaniem języka w wyszukiwarce Google, lepszym dwujęzycznym wyświetlaniem wyników w wyszukiwarce Google, łatwą zmianą języka w Mapach Google, pomoc w odrabianiu zadań domowych w języku hindi za pośrednictwem Google Lens oraz wielojęzyczny model sztucznej inteligencji o nazwie MuRIL, który ułatwia komputerom zrozumienie różnorodnych język ludzki.

Tło

Zanim przejdziemy do ogłoszeń, oto kilka informacji wyjaśniających kontekst naszej międzynarodowej publiczności. A

duża część Indii jest dwujęzyczna i wielojęzyczna, przy czym angielski jest pierwszym językiem zaledwie 0,02% ogromnej populacji Indii, liczącej ponad 1,2 miliarda ludzi. Tylko 10,6% całej populacji mówi po angielsku. Dla kontrastu, 43,63% populacji posługuje się hindi jako pierwszym językiem, podczas gdy 57,1% ogólnie mówi w języku hindi (chociaż jest on podzielony na różne subdialekty). W ślad za nimi podążają inne języki, ale w mniejszym odsetku — bengalski, marathi i telugu odpowiednio 8,9%, 8,2% i 7,8%. Krótko mówiąc, skupienie technologii wokół języka angielskiego jako jedynego środka dostępu trzyma technologię z dala od bardzo dużej liczby użytkownicy, którzy w przeciwnym razie uznaliby tę technologię za absolutnie przydatną – i być może potrzebują jej nawet bardziej niż ci, którzy mają już dostęp do technologii w innych krajach sposoby.

Jak zauważyłem w swoim Recenzja Google Nest Audio, nawet coś w rodzaju inteligentnego głośnika jest mniej przydatne w konfiguracji wielojęzycznej niż w anglojęzycznym gospodarstwie domowym. Polecenia w językach mieszanych nie są zbyt dobrze rozpoznawane (jak polecenia głównie w języku angielskim z niektórymi słowami w języku hindi) i konfigurowanie Języki dwujęzyczne są nadal ograniczone do niektórych kombinacji (Hindi + urdu lub dowolne dwa języki indyjskie nie są prawidłową kombinacją, ale hindi + angielski tak). Sytuacja jest lepsza niż kilka lat temu, ale nadal jest wiele do zrobienia w celu poprawy.

I Google o tym wie, tworząc podstawę dla dzisiejsze ogłoszenia na wydarzeniu L10n (zabawny skrót od „Lokalizacja”, składający się z 10 liter między L i n).

Ogłoszenia podczas wydarzenia Google L10n 2020

Łatwe przełączanie między wynikami w języku angielskim i indyjskim w wyszukiwarce Google

Google oferuje możliwość szybkiego przełączania wyników w języku angielskim i hindi za pomocą chipa/karty w wyszukiwarce Google w stanach Indii ze znaczną populacją mówiącą w języku hindi. Ten chip zwiększył 10-krotnie wzrost liczby zapytań w języku hindi w Indiach.

To samo jest teraz rozszerzane na więcej języków indyjskich. Wyszukiwarka Google będzie teraz oferować możliwość przełączania wyników między angielskim a tamilskim/telugu/Bangla/marathi.

Lepsze wyświetlanie wyników dwujęzycznych w wyszukiwarce Google

Użytkownicy w Indiach, łącznie ze mną, wolą pisać po angielsku, nawet jeśli wyników oczekuje się w lokalnym języku. W rzeczywistości transliteracja języka hindi na język angielski dała początek Hinglish, czyli pisowni w języku hindi za pomocą alfabetu angielskiego.

Wyszukiwarka Google przychodzi na ratunek osobom dwujęzycznym w przypadku zapytań. W ciągu następnego miesiąca wyszukiwarka zacznie wyświetlać odpowiednią treść w obsługiwanych językach indyjskich, jeśli będzie to konieczne, nawet jeśli zapytanie tak zostało przetłumaczone na język angielski, co dało dwujęzyczne wyniki wyszukiwania w większej liczbie języków oprócz angielskiego jako podstawowego. Obsługiwane języki indyjskie dla języka dodatkowego to hindi, bengalski, marathi, tamilski i telugu.

Łatwa zmiana języka w Mapach Google

Asystent Google i Discover mają możliwość przełączenia na inny język niż system, dzięki czemu użytkownicy mogą korzystać z tych narzędzi według własnych preferencji. Ponad 50% treści w Google Discover jest przeglądanych w tym kraju w językach indyjskich, a jedna trzecia użytkowników Asystenta Google korzysta z niego w języku indyjskim.

Możliwość zmiany języka w aplikacji została teraz rozszerzona na Mapy Google. Użytkownicy mogą teraz po prostu otworzyć aplikację, przejść do Ustawień i kliknąć „Język aplikacji”, aby wybrać spośród maksymalnie dziewięciu języków. Ułatwi to użytkownikom wyszukiwanie miejsc, uzyskiwanie wskazówek dojazdu i nawigację w preferowanym przez nich języku w ramach tego zadania.

Pomoc w odrabianiu zadań domowych w języku hindi za pośrednictwem Google Lens

Obiektyw Google już na to pozwala Rozwiąż problemy matematyczne aby pomóc dziecku w odrabianiu zadań domowych. Możesz zrobić zdjęcie problemu matematycznego i wyświetlić przewodnik krok po kroku, jak go rozwiązać. Jednak ten przewodnik był wyświetlany głównie w języku angielskim.

Google wprowadza teraz rozwiązania w języku hindi umożliwiające pomoc w odrabianiu zadań domowych w Google Lens.

MuRIL – wielojęzyczny model sztucznej inteligencji, który pomaga systemom komputerowym rozumieć języki indyjskie na dużą skalę

Wiele rozmów na temat sztucznej inteligencji i uczenia maszynowego koncentruje się wokół zrozumienia ludzi i ludzkiego języka. Ale kiedy języki przybierają setki form, ta rozmowa staje się ogromnym zadaniem, większym niż dotychczas. I tu z pomocą przychodzi MuRIL.

Skrót od wielojęzycznych reprezentacji języków indyjskich, MuRIL to wielojęzyczny model, który można skalować w różnych językach. Oprócz innych korzyści zapewnia także obsługę transliteracji tekstu, na przykład podczas pisania w języku hindi przy użyciu pisma rzymskiego. MuRIL jest również dobry w określaniu nastroju transliterowanych zdań. MuRIL obsługuje 16 języków indyjskich oraz angielski, co zapewnia największy zasięg języków indyjskich spośród wszystkich innych publicznie dostępnych modeli tego typu.

MuRIL stał się oprogramowaniem typu open source i jest dostępny dla pobrać z TensorFlow Hub za darmo.


Wspaniale jest widzieć, jak firmy kierują rozmowy w stronę szerszej akceptacji różnorodnych języków. Mamy nadzieję, że wysiłki w tym zakresie będą kontynuowane także w przypadku innych języków i innych regionów.