Google ყურადღებას ამახვილებს ინდურ ენებზე Maps-ში ენის მარტივი გადართვის, ორენოვანი Search გადამრთველებით და სხვა

Google L10n ვირტუალურ ღონისძიებაზე Google-მა აჩვენა განახლებული აქცენტი ინდურ ენებზე იმ ცვლილებებით, რომლებიც მიმართავს ინდოეთში მრავალენოვან ადამიანებს.

ინდოეთი ასი ენის ქვეყანაა, ადგილი სადაც დიალექტი იცვლება ყოველ 100 კმ-ში. ტექნიკურ სამყაროში, სადაც დომინირებს ინგლისური, ეს ადგილობრივი ენები და დიალექტები ვერ ახერხებენ ინტერნეტში მნიშვნელოვანი გამოცდილების წვდომას. Google L10n ვირტუალურ ღონისძიებაზე დღეს Google უადვილებს მრავალენოვანი მომხმარებლებისთვის ინდოეთში გამდიდრების გამოცდილებას ინდოეთში Google Search-ისთვის ენის მარტივი გადამრთველებით, Google Search-ში ორენოვანი შედეგების უკეთესად გადართვით, Google Maps-ში ენის მარტივი გადართვით, საშინაო დავალების დახმარება ჰინდიზე Google Lens-ის და მრავალენოვანი AI მოდელის სახელწოდებით MuRIL-ის მეშვეობით, რათა კომპიუტერებს გაუადვილდეს სხვადასხვას გაგება ადამიანის ენა.

ფონი

სანამ განცხადებებზე მივიდოდეთ, აქ არის გარკვეული ფონი, რათა აუხსნას კონტექსტი ჩვენს საერთაშორისო აუდიტორიას. ა ინდოეთის დიდი ნაწილი ორენოვანი და მრავალენოვანიაინგლისური არის პირველი ენა ინდოეთის დიდი მოსახლეობის მხოლოდ 0,02%-ში, 1,2 მილიარდზე მეტი ადამიანისგან. მთლიანი მოსახლეობის მხოლოდ 10,6%-ს შეუძლია ინგლისურად საუბარი. ამის საპირისპიროდ, მოსახლეობის 43,63% საუბრობს ჰინდიდ, როგორც პირველ ენაზე, ხოლო 57,1%–ს შეუძლია ზოგადად ჰინდიზე საუბარი (თუმცა ეს იყოფა სხვადასხვა ქვედიალექტად). სხვა ენები მოჰყვება, მაგრამ უფრო მცირე პროცენტებში - ბენგალური, მარათჰი და ტელუგუ 8.9%, 8.2% და 7.8% შესაბამისად. გრძელი და მოკლე ის არის, რომ ტექნოლოგიის ფოკუსირება ინგლისურ ენაზე, როგორც ერთადერთი წვდომის საშუალება, იცავს ტექნოლოგიას ძალიან დიდი რაოდენობისგან. მომხმარებლები, რომლებიც სხვაგვარად თვლიდნენ, რომ ტექნოლოგია აბსოლუტურად სასარგებლო იქნება - და შესაძლოა ის უფრო მეტად სჭირდებოდათ, ვიდრე მათ უკვე აქვთ წვდომა ტექნოლოგიაზე სხვა გზები.

როგორც აღვნიშნე ჩემს Google Nest Audio მიმოხილვა, თუნდაც ჭკვიანი სპიკერის მსგავსი რამ უფრო ნაკლებ გამოყენებას გვთავაზობს მრავალენოვან მოწყობილობებში, როგორც ეს ინგლისურენოვან ოჯახში. შერეულ ენებში ბრძანებები კარგად არ არის აღიარებული (როგორც ძირითადად ინგლისური ბრძანება ზოგიერთი ჰინდი სიტყვით) და დაყენება ორენოვანი ენები კვლავ შემოიფარგლება ზოგიერთი კომბინაციით (ჰინდი + ურდუ, ან ნებისმიერი ორი ინდური ენა არ არის სწორი კომბინაცია, მაგრამ ჰინდი + ინგლისური არის). სიტუაცია უკეთესია, ვიდრე რამდენიმე წლის წინ იყო, მაგრამ გასაუმჯობესებლად ჯერ კიდევ სამართლიანი გზაა გასავლელი.

და Google-მა იცის ეს, აყალიბებს საფუძველს დღევანდელი განცხადებები L10n ღონისძიებაზე (ლოკალიზაციის სათამაშო აბრევიატურა, 10 ასო L-სა და n-ს შორის).

განცხადებები Google L10n ღონისძიებაზე 2020

მარტივი გადართვა ინგლისურ და ინდურ ენების შედეგებს შორის Google Search-ში

Google გვთავაზობს შედეგების სწრაფად გადაცვლას ინგლისურ და ჰინდიზე ჩიპის/ჩანართის მეშვეობით Google Search-ში, ინდოეთის შტატებში, სადაც ჰინდიზე მოლაპარაკე მნიშვნელოვანი მოსახლეობაა. ამ ჩიპმა გაზარდა ჰინდის მოთხოვნების ზრდა ინდოეთში 10-ჯერ.

იგივე ახლა უფრო ინდურ ენებზე ვრცელდება. Google Search ახლა შესთავაზებს შედეგების გადართვის შესაძლებლობას ინგლისურ და ტამილურ/ტელუგუ/ბანგლა/მარათულს შორის.

უკეთესი ორენოვანი შედეგების გამოჩენა Google Search-ში

მომხმარებლები ინდოეთში, მათ შორის მეც, ურჩევნიათ აკრიფონ ნივთები ინგლისურად, მაშინაც კი, თუ შედეგები მოსალოდნელია ადგილობრივ ენაზე. ფაქტობრივად, ჰინდი ინგლისურ ენაზე ტრანსლიტერაციამ წარმოშვა ჰინგლიში, რომელიც ჰინდია დაწერილი ინგლისური ანბანით.

Google Search მოდის სამაშველოში ასეთი ორენოვანი ადამიანებისთვის მათი საძიებო მოთხოვნებისთვის. მომდევნო თვეში Search დაიწყებს შესაბამისი შინაარსის ჩვენებას მხარდაჭერილ ინდურ ენებზე, როცა ეს მიზანშეწონილია, მაშინაც კი, თუ ეს მოთხოვნა იქნება ტრანსლიტერირებულია ინგლისურად, რაც იძლევა ორენოვან ძიების შედეგებს სხვა ენაზე, გარდა ინგლისურისა, როგორც ძირითადი. მეორადისთვის მხარდაჭერილი ინდური ენებია ჰინდი, ბანგლა, მარათჰი, ტამილური და ტელუგუ.

ენის მარტივი გადართვა Google Maps-ში

Google Assistant-სა და Discover-ს აქვს სისტემისგან განსხვავებულ ენაზე გადართვის შესაძლებლობა, რაც მომხმარებლებს საშუალებას აძლევს გამოიყენონ ეს ხელსაწყოები თავიანთი კონკრეტული უპირატესობით. Google Discover-ის კონტენტის 50%-ზე მეტი ჩანს ქვეყანაში ინდურ ენებზე და Google ასისტენტის მომხმარებელთა მესამედი მას ინდურ ენაზე იყენებს.

აპლიკაციის შიგნით ენების შეცვლის შესაძლებლობა ახლა ვრცელდება Google Maps-ზე. მომხმარებლებს ახლა შეუძლიათ უბრალოდ გახსნან აპი, გადავიდნენ პარამეტრებში და შეეხეთ „აპლიკაციის ენას“ ცხრა ენიდან ასარჩევად. ეს გაუადვილებს მომხმარებლებს ადგილების მოძიებას, მიმართულებების მიღებას და ამ ამოცანისთვის მათთვის სასურველ ენაზე ნავიგაციას.

საშინაო დავალების დახმარება ჰინდიზე Google Lens-ის მეშვეობით

Google Lens უკვე გაძლევთ ამის საშუალებას მათემატიკური ამოცანების ამოხსნა დაეხმარეთ თქვენს შვილს საშინაო დავალების შესრულებაში. შეგიძლიათ გადაიღოთ მათემატიკური ამოცანის ფოტო და გაჩვენოთ ნაბიჯ-ნაბიჯ სახელმძღვანელო მისი ამოხსნის შესახებ. მაგრამ ეს სახელმძღვანელო ძირითადად ნაჩვენებია ინგლისურ ენაზე.

Google ახლა შემოაქვს ჰინდი გადაწყვეტილებებს საშინაო დავალების დასახმარებლად Google Lens-ში.

MuRIL - მრავალენოვანი AI მოდელი, რომელიც ეხმარება კომპიუტერულ სისტემებს ინდური ენების მასშტაბის გაგებაში

ბევრი საუბარი ხელოვნური ინტელექტისა და მანქანათმცოდნეობის ირგვლივ მიზნად ისახავს ადამიანებისა და ადამიანის ენის გაგებას. მაგრამ როდესაც ენები ასობით ფორმას იღებს, ეს საუბარი დიდ ამოცანად გადაიქცევა, უფრო მეტად ვიდრე ეს იყო. სწორედ აქ მოდის MuRIL.

ინდოეთის ენებისთვის მრავალენოვანი რეპრეზენტაციების შემოკლება, MuRIL არის მრავალენოვანი მოდელი, რომელიც მასშტაბურია სხვადასხვა ენებზე. სხვა უპირატესობებთან ერთად, ის ასევე უზრუნველყოფს ტრანსლიტერირებული ტექსტის მხარდაჭერას, როგორიცაა ჰინდი რომაული დამწერლობის გამოყენებით. MuRIL ასევე კარგია ტრანსლიტერირებული წინადადებების განწყობის განსაზღვრაში. MuRIL მხარს უჭერს 16 ინდურ ენას, ისევე როგორც ინგლისურს, რაც მას ყველაზე მაღალ დაფარვას აძლევს ინდურ ენებს შორის ნებისმიერ სხვა საჯაროდ მისაწვდომ მოდელს შორის.

MuRIL გაკეთდა ღია კოდით და ხელმისაწვდომია ჩამოტვირთვა TensorFlow Hub-დან უფასოდ.


მშვენიერია იმის ხილვა, რომ კომპანიები აწარმოებენ საუბრებს სხვადასხვა ენების უფრო ფართო მიღებისკენ. ვიმედოვნებთ, რომ ამ მიმართულებით ძალისხმევა გაგრძელდება სხვა ენებისთვის და სხვა რეგიონებისთვისაც.