מפות Google משפרת את יכולת הגילוי עם תעתיק אוטומטי

מפות Google משפרת את יכולת הגילוי של נקודות עניין ב-10 שפות הודיות באמצעות מודלים של לימוד תעתיק אוטומטי.

גוגל לאחרונה נוספה אפשרות חדשה להחלפת שפה במפות Google כדי לעזור למשתמשים בהודו לחפש מקומות, לקבל מסלול ולנווט בשפה המקומית המועדפת עליהם. עם זאת, מכיוון שהשמות של רוב מקומות העניין ההודיים (POI) אינם זמינים בתסריטים מקוריים, הגילוי בשפות הודיות הוא עדיין נושא מרכזי. כדי להתמודד עם זה, גוגל מציגה כעת תכונה חדשה במפות שתעתיק אוטומטית את השמות של נקודות עניין כדי לשפר את יכולת הגילוי.

גוגל טוענת שתכונה חדשה זו תעשה זאת "לספק חווית שפה עשירה ואינטואיטיבית יותר למשתמשים, ותאפשר למיליוני מיליונים לשלוח שאילתות ב השפה שלהם ולמצוא מידע במפות כגון מסעדות, משאבות דלק, בתי חולים, חנויות מכולת." ועוד. הודות לתכונה, Google Maps תוכל כעת לתעתיק אוטומטית את שם הסקריפט הלטיני של נקודות עניין להינדית, בנגלה, מראטי, טלוגו, טמילית, גוג'ראטי, קנאדה, מלאיאלאם, פנג'בי ואודיה.

מדבר על היכולות של תכונת התעתיק האוטומטי החדשה במפות Google, אמר Cibu Johny, מהנדס תוכנה, Google Maps, "כמעט שלושה רבעים מההודים מקיימים אינטראקציה עם האינטרנט בעיקר באמצעות שפות מקומיות ולא אנגלית, ומספר זה רק הולך וגדל. כדי להפוך את מפות Google למועיל ככל האפשר עבור מיליוני משתמשים בשפה ההודית, הכנסנו אוטומטית מעודכנת מערכת תעתיק המאפשרת לנו לספק תוצאות מדויקות יותר כאשר משתמשים מחפשים נקודות עניין המועדפות עליהם שפה. במדינה שבה שמות של מפעלים נכתבים עם מילים ממספר שפות וראשי תיבות, מיפוי פונטי מילים אלו בשפת האם שלהן יעזרו לנו להציג בצורה מדויקת יותר את התוצאות שמשתמשי השפה המקומית מחפשים ל."

גוגל נתנה את הדוגמה הבאה כדי להראות כיצד תכונת התעתיק האוטומטי תעזור למשתמשי מפות בהודו:

"מיילים נפוצות באנגלית משמשות לעתים קרובות בשמות של מקומות בהודו, אפילו כשהן נכתבות בכתב הילידים. האופן שבו השם נכתב בתסריטים אלה מונע במידה רבה על ידי ההגייה שלו. לדוגמה, एनआईटी מראשי התיבות NIT מבוטא 'en-aye-tee', לא בתור המילה האנגלית 'nit'. לכן על ידי הבנה ש-NIT הוא ראשי תיבות נפוץ מהאזור, מפות יכולות לגזור את התעתיק הנכון. בעבר כאשר מפות לא הצליחה להבין את ההקשר של एनआईटी, היא הייתה מציגה במקום זאת ישות קשורה שעשויה להיות רחוקה יותר מהמשתמש. עם פיתוח זה, נוכל למצוא את התוצאה הרצויה מתוך שאילתת השפה המקומית. בנוסף, משתמשים יכולים לראות את שמות ה-POI בשפתם המקומית, גם כאשר אין להם מידע זה במקור."

כדי לאפשר תכונה זו, גוגל השתמשה במכלול של מודלים של למידה, מילוני תעתיק שונים ומודול של ראשי תיבות עם מדגם גדול מאוד של טקסטים מקוונים. גוגל טוענת שהתכונה מציעה שיפורי איכות וכיסוי משמעותיים לעומת תעתיקים אוטומטיים קיימים של שמות POI; עד 20 פעמים בשפות מסוימות. הטבלה הבאה מציגה את שיפורי הכיסוי והאיכות בשפות הנתמכות.

לפרטים נוספים על תכונת התעתיק האוטומטי החדשה במפות גוגל וכיצד היא פועלת, בדוק הפוסט הזה בבלוג של Google India.