Στην εικονική εκδήλωση Google L10n, η Google έδειξε ανανεωμένη εστίαση στις ινδικές γλώσσες με αλλαγές που απευθύνονται στους πολύγλωσσους στην Ινδία.
Η Ινδία είναι η χώρα των εκατό γλωσσών, ένα μέρος όπου η διάλεκτος αλλάζει κάθε 100 χιλιόμετρα. Σε έναν τεχνολογικό κόσμο που κυριαρχείται από τα αγγλικά, αυτές οι τοπικές γλώσσες και διάλεκτοι δεν μπορούν να παρέχουν πρόσβαση σε ουσιαστικές εμπειρίες στο Διαδίκτυο. Στην εικονική εκδήλωση Google L10n σήμερα, η Google διευκολύνει τους πολύγλωσσους χρήστες στην Ινδία να έχουν εμπλουτισμένες εμπειρίες στην Ινδία με εύκολες εναλλαγές γλώσσας για την Αναζήτηση Google, καλύτερη εμφάνιση δίγλωσσων αποτελεσμάτων στην Αναζήτηση Google, εύκολη εναλλαγή γλώσσας στους Χάρτες Google, βοήθεια για την εργασία στα Χίντι μέσω του Google Lens και ενός πολύγλωσσου μοντέλου AI που ονομάζεται MuRIL για να διευκολύνει τους υπολογιστές να κατανοούν διάφορα ανθρώπινη γλώσσα.
Ιστορικό
Πριν φτάσουμε στις ανακοινώσεις, ακολουθεί ένα υπόβαθρο για να εξηγήσουμε το πλαίσιο στο διεθνές κοινό μας. ΕΝΑ
μεγάλο κομμάτι της Ινδίας είναι δίγλωσσο και πολύγλωσσο, με τα αγγλικά να είναι η πρώτη γλώσσα μόνο του 0,02% του τεράστιου πληθυσμού της Ινδίας με πάνω από 1,2 δισεκατομμύρια ανθρώπους. Μόνο το 10,6% του συνολικού πληθυσμού μπορεί να μιλήσει αγγλικά. Αντίθετα, το 43,63% του πληθυσμού μιλάει Χίντι ως πρώτη του γλώσσα, ενώ το 57,1% μπορεί να μιλάει Χίντι συνολικά (αν και αυτό χωρίζεται σε διαφορετικές υποδιαλέκτους). Ακολουθούν άλλες γλώσσες, αλλά σε μικρότερα ποσοστά — Μπενγκάλι, Μαράθι και Τελούγκου σε 8,9%, 8,2% και 7,8% αντίστοιχα. Το μακρύ και μικρό είναι ότι η εστίαση της τεχνολογίας γύρω από τα αγγλικά ως το μόνο μέσο πρόσβασης κρατά την τεχνολογία μακριά από έναν πολύ μεγάλο αριθμό χρήστες που διαφορετικά θα έβρισκαν την τεχνολογία απολύτως χρήσιμη -- και ίσως την χρειάζονταν περισσότερο από αυτούς που έχουν ήδη πρόσβαση στην τεχνολογία σε άλλες τρόπους.Όπως σημείωσα στο δικό μου Αναθεώρηση ήχου Google Nest, ακόμη και κάτι σαν ένα έξυπνο ηχείο προσφέρει λιγότερη χρήση σε μια πολύγλωσση εγκατάσταση όπως θα έκανε σε ένα αγγλόφωνο νοικοκυριό. Οι εντολές σε μικτές γλώσσες δεν αναγνωρίζονται τόσο καλά (όπως μια κυρίως αγγλική εντολή με μερικές λέξεις Χίντι) και η ρύθμιση οι δίγλωσσες γλώσσες εξακολουθούν να περιορίζονται σε ορισμένους συνδυασμούς (Χίντι + Ουρντού ή οποιεσδήποτε δύο ινδικές γλώσσες δεν είναι έγκυρος συνδυασμός, αλλά τα Χίντι + Αγγλικά είναι). Η κατάσταση είναι καλύτερη από ό, τι ήταν πριν από λίγα χρόνια, αλλά υπάρχει ακόμα πολύς δρόμος για βελτιώσεις.
Και η Google το γνωρίζει αυτό, αποτελώντας τη βάση για οι σημερινές ανακοινώσεις στην εκδήλωση L10n (μια παιχνιδιάρικη συντομογραφία του Localization, με 10 γράμματα μεταξύ L και n).
Ανακοινώσεις στο Google L10n Event 2020
Εύκολη εναλλαγή μεταξύ αποτελεσμάτων αγγλικής και ινδικής γλώσσας στην Αναζήτηση Google
Η Google προσφέρει τη δυνατότητα γρήγορης εναλλαγής μεταξύ αποτελεσμάτων στα Αγγλικά και στα Χίντι μέσω ενός τσιπ/καρτέλας στην Αναζήτηση Google, σε πολιτείες της Ινδίας με σημαντικό πληθυσμό που μιλάει Χίντι. Αυτό το τσιπ αύξησε την αύξηση των ερωτημάτων στα Χίντι κατά 10 φορές στην Ινδία.
Το ίδιο τώρα επεκτείνεται σε περισσότερες ινδικές γλώσσες. Η Αναζήτηση Google θα προσφέρει πλέον τη δυνατότητα εναλλαγής αποτελεσμάτων μεταξύ Αγγλικών και Ταμίλ/Τελούγκου/Μπάνγκλα/Μαράθι επίσης.
Καλύτερη εμφάνιση δίγλωσσων αποτελεσμάτων στην Αναζήτηση Google
Οι χρήστες στην Ινδία, συμπεριλαμβανομένου του εαυτού μου, προτιμούν να πληκτρολογούν πράγματα στα αγγλικά, ακόμη κι αν τα αποτελέσματα αναμένονται σε μια τοπική γλώσσα. Στην πραγματικότητα, η μεταγραφή Χίντι στα Αγγλικά προκάλεσε το Hinglish, το οποίο είναι Χίντι γραμμένο με το αγγλικό αλφάβητο.
Η Αναζήτηση Google έρχεται στη διάσωση τέτοιων δίγλωσσων για τα ερωτήματα αναζήτησής τους. Κατά τη διάρκεια του επόμενου μήνα, η Αναζήτηση θα αρχίσει να εμφανίζει σχετικό περιεχόμενο σε υποστηριζόμενες ινδικές γλώσσες, όταν χρειάζεται, ακόμα κι αν το ερώτημα έχει έχει μεταγραφεί στα αγγλικά, με αποτέλεσμα τα δίγλωσσα αποτελέσματα αναζήτησης σε περισσότερες γλώσσες εκτός από τα αγγλικά ως κύρια. Οι υποστηριζόμενες ινδικές γλώσσες για τη δευτεροβάθμια εκπαίδευση είναι τα Χίντι, τα Μπανγκλά, τα Μαράθι, τα Ταμίλ και τα Τελούγκου.
Εύκολη εναλλαγή γλώσσας στους Χάρτες Google
Το Google Assistant και το Discover έχουν τη δυνατότητα εναλλαγής σε διαφορετική γλώσσα από το σύστημα, επιτρέποντας στους χρήστες να χρησιμοποιούν αυτά τα εργαλεία σύμφωνα με τις συγκεκριμένες προτιμήσεις τους. Πάνω από το 50% του περιεχομένου στο Google Discover προβάλλεται σε ινδικές γλώσσες στη χώρα και το ένα τρίτο των χρηστών του Βοηθού Google το χρησιμοποιεί σε ινδική γλώσσα.
Η δυνατότητα αλλαγής γλωσσών εντός της εφαρμογής επεκτείνεται τώρα στους Χάρτες Google. Οι χρήστες μπορούν τώρα απλώς να ανοίξουν την εφαρμογή, να μεταβούν στις Ρυθμίσεις και να πατήσουν "Γλώσσα εφαρμογής" για να επιλέξουν από έως και εννέα γλώσσες. Αυτό θα διευκολύνει τους χρήστες να αναζητήσουν μέρη, να λάβουν οδηγίες και να περιηγηθούν στη γλώσσα που προτιμούν για αυτήν την εργασία.
Βοήθεια για την εργασία στα Χίντι μέσω του Google Lens
Το Google Lens σας το επιτρέπει ήδη επίλυση μαθηματικών προβλημάτων για να βοηθήσετε με τις εργασίες του παιδιού σας. Μπορείτε να τραβήξετε μια φωτογραφία ενός μαθηματικού προβλήματος και να σας εμφανιστεί ένας βήμα προς βήμα οδηγός για το πώς να το λύσετε. Αλλά αυτός ο οδηγός έχει εμφανιστεί κυρίως στα Αγγλικά.
Η Google εισάγει τώρα λύσεις Χίντι για βοήθεια σχετικά με την εργασία στο Google Lens.
MuRIL -- το πολύγλωσσο μοντέλο τεχνητής νοημοσύνης που βοηθά τα συστήματα υπολογιστών να κατανοούν τις ινδικές γλώσσες σε κλίμακα
Πολλές συζητήσεις γύρω από την τεχνητή νοημοσύνη και τη μηχανική μάθηση επικεντρώνονται στην κατανόηση των ανθρώπων και της ανθρώπινης γλώσσας. Αλλά όταν οι γλώσσες παίρνουν εκατό μορφές, αυτή η συζήτηση μετατρέπεται σε ένα τρομερό έργο, περισσότερο από ό, τι ήταν ήδη. Εδώ μπαίνει το MuRIL.
Το MuRIL είναι ένα πολύγλωσσο μοντέλο που κλιμακώνεται σε διάφορες γλώσσες. Μεταξύ άλλων πλεονεκτημάτων, παρέχει επίσης υποστήριξη για μεταγραμμένο κείμενο, όπως όταν γράφετε Χίντι χρησιμοποιώντας τη ρωμαϊκή γραφή. Το MuRIL είναι επίσης καλό στον προσδιορισμό του συναισθήματος των μεταγραμμένων προτάσεων. Το MuRIL υποστηρίζει 16 ινδικές γλώσσες καθώς και αγγλικά, δίνοντάς του την υψηλότερη κάλυψη για τις ινδικές γλώσσες μεταξύ οποιουδήποτε άλλου διαθέσιμου στο κοινό μοντέλου του είδους του.
Το MuRIL έχει γίνει ανοιχτού κώδικα και είναι διαθέσιμο για λήψη από το TensorFlow Hub δωρεάν.
Είναι υπέροχο να βλέπεις εταιρείες να κατευθύνουν τις συνομιλίες προς την ευρύτερη αποδοχή διαφορετικών γλωσσών. Ελπίζουμε να συνεχιστούν οι προσπάθειες για αυτό το σκοπό και για άλλες γλώσσες και άλλες περιοχές.